OpenAI 发布最强模型 o1 !打破 AI 瓶颈开启新时代,GPT-5 可能永远不会来了

⭐发布日期:2024年09月29日 | 来源:第一财经

⭐作者:贝纳·纪欧多 责任编辑:Admin

⭐阅读量:438 评论:2人

【资料大全正版资料】

【澳门内部资料精准大全】

【新奥资料免费精准】 【2024新澳今晚资料】 【澳彩资料免费的资料大全】 【二四六天天有好彩资料免费资料精选】 【2024澳门天天开好彩大全2024】 【香港开彩开奖+结果记录】 【7777788888】 【7777788888管家婆澳】
【4949澳门精准免费大全2023】 【新澳门彩精准一码内部网站】 【新澳内部资料精准大全】 【香港6合开奖结果+开奖记录今晚】 【新奥长期免费资料大全】 【新澳2024年精准一肖一码】 【新澳资彩长期免费资料】 【澳门4949精准免费大全】

没有任何预警,OpenAI 突然发布了 OpenAI o1 系列模型。按照官方技术博客说法,o1 在推理能力上代表了人工智能最强的水平。

OpenAI CEO Sam Altman 表示:「OpenAI o1 是一个新范式的开始:可以进行通用复杂推理的 AI。」

在复杂推理任务上,这款新模型是一次重要突破,代表了 AI 能力的新水平。基于此,OpenAI 选择将此系列重新命名为 OpenAI o1,并从头开始计数。

不知道这是否意味着,GPT-5 这个命名也不会出现了。

简单总结新模型的特点:

  • OpenAI o1:性能强大,适用于处理各个领域推理的复杂任务。
  • OpenAI o1 mini:经济高效,适用于需要推理但不需要广泛世界知识的应用场景。

现在,该模型已经全量推送,你可以通过 ChatGPT 网页端或者 API 进行访问。

其中 o1-preview 还是预览版,OpenAI 还会继续更新开发下一版本。目前使用有一定次数限制,o1-preview 每周 30 条消息,o1-mini 每周 50 条。

和传闻中的「草莓」一样,这些新的 AI 模型能够推理复杂任务,并解决科学、编码和数学领域中比以往更为困难的问题。官方表示,如果你需要解决科学、编码、数学等领域的复杂问题,那么这些增强的推理功能将尤为有用。

例如,医疗研究人员可以用它注释细胞测序数据,物理学家可以用它生成复杂的量子光学公式,开发人员可以用它构建并执行多步骤的工作流程。

此外,OpenAI o1 系列擅长生成和调试复杂代码。

为了给开发人员提供更高效的解决方案,OpenAI 还发布了一款更快、更便宜的推理模型 OpenAI o1-mini,尤其擅长编码。

作为较小版本,o1-mini 的成本比 o1-preview 低 80%,是一个功能强大且高效的模型,适用于需要推理但不需要广泛世界知识的应用场景。

在具体训练过程中,OpenAI 会训练这些模型在回答问题之前深入思考。o1 在回答问题前会产生一个内部的思维链,这使得它能够进行更深入的推理。

通过训练,OpenAI o1 模型能够学会完善自己的思维方式,并且随着更多的强化学习(训练时间计算)和更多的思考时间(测试时间计算)而持续提高。

OpenAI 研究员 @yubai01 也点出了 01 的训练路线:

我们使用 RL 来训练一个更强大的推理模型。很高兴能成为这段旅程的一部分,而且要走很长一段路!

据介绍,在测试中,这款模型在物理、化学和生物等任务中表现得如同博士生,尤其是在数学和编码领域表现突出。

在国际数学奥林匹克竞赛(IMO)的资格考试中,GPT-4o 只解决了 13% 的问题,而推理模型得分高达 83%。在 Codeforces 编程竞赛中,它的表现进入了前 89% 的队列。

不过,和传闻的爆料一样,作为一个早期版本,该模型还不具备一些 ChatGPT 的常用功能,比如网页浏览和上传文件或图像等多模态能力。

相比之下,GPT-4o 反而会更加胜任许多常见的应用场景。

为了确保新模型的安全,OpenAI 提出了一种新的安全训练方法。

在最严苛的「越狱」测试中,GPT-4o 得分为 22(满分 100),而 o1-preview 模型得分为 84,在安全性方面堪称遥遥领先。

从下周开始,ChatGPT Enterprise 和 Edu 用户也可以访问这两款模型。符合条件的开发人员现在可以通过 API 使用这两款模型,每分钟速率也有所限制。

在这里划个重点,OpenAI 表示,未来将向所有 ChatGPT 免费用户提供 o1-mini 的访问权限。不过,大概率也会在次数上有所限制。

关于新模型 o1 更多细节,我们很快将在更详细的体验后与大家分享。如果你有感兴趣的问题,欢迎在留言区告诉我们。

推理能力遥遥领先,但仍分不出「9.11 和 9.8 哪个大」

官方也放出了更多 OpenAI o1 的更多演示视频。

比如使用 OpenAI o1 来编写一个找松鼠的网页游戏。这个游戏的目标是控制一只考拉躲避不断增加的草莓,并在 3 秒后找到出现的松鼠。

与传统的经典游戏如贪吃蛇不同,这类游戏的逻辑相对复杂,更考验 OpenAI o1 的逻辑推理能力。

又或者,OpenAI o1 已经开始能通过推理,解决一些简单的物理问题,

演示列举了一个例子,一颗小草莓被放在一个普通的杯子里,杯子倒扣在桌子上,然后杯子被拿起,询问草莓会在哪里,并要求解释推理过程。这表明模型能够理解物体在不同物理状态下的位置变化。

落地到具体的应用中,OpenAI o1 还能成为医生的得力助手,比如帮助医生整理总结的病例信息,甚至辅助诊断一些疑难杂症。

热衷于将 AI 与科学相结合的量子物理学家马里奥•克莱恩(Mario Krenn)也向 OpenAI 的 o1 模型提出一个关于特定的量子算符应用的问题,结果,OpenAI o1 也轻松拿捏。

「Strawberry」里有多少个「r」,GPT-4o 会回答错误,但却难不倒 OpenAI o1,这一点值得好评

不过,经过实测,OpenAI o1 依然无法解决「9.11 和 9.8 哪个大」的经典难题,严重扣分。

对于 OpenAI o1 的到来,英伟达具身智能负责人 Jim Fan 表示:

我们终于看到了推理时间扩展的范式被推广并投入生产。正如萨顿(强化学习教父)在《苦涩的教训》中所说,只有两种技术可以无限制地与计算规模化:

学习和搜索。是时候将重点转向后者了。

在他看来,大模型中的很多参数是用来记忆事实的,这的确有助于在问答的基准测试「刷分」,但如果将逻辑推理能力与知识(事实记忆)分开,使用一个小的「推理核心」来调用工具,如浏览器和代码验证器,这样可以减少预训练的计算量。

Jim Fan 也点出了 OpenAI o1 最强大的优势所在,即 o1 模型可以轻松成为数据飞轮的一部分。

简单来说,如果模型给出了正确的答案,那么整个搜索过程就可以变成一个包含正负奖励的训练数据集。这样的数据集可以用来训练未来的模型版本,并且随着生成的训练数据越来越精细,模型的表现也会不断改善。好一个通过自己博弈,实现自己训练自己的内循环。

不过网友的实测中也发现了一些问题,比如回复的时间长了不少,虽然花了更长时间思考,但在一些问题上也会出现答非所问输出不全等问题。

赛博禅心猜测,这次的 o1 有可能是 GPT-4o 在进行一些微调/对齐后的 agent,整体远低于预期,

Sam Altman 也承认 o1 仍然有缺陷,存在局限,在第一次使用时更令人印象深刻,而在你花更多时间使用后就没那么好了。

尽管如此,OpenAI o1 模型在整体的表现上还是可圈可点。

现在,OpenAI o1 模型的发布堪称下半年 AI 模型大战的导火索,如无意外,接下来,其他 AI 公司也不会藏着掖着了。

没错,我点的就是 Anthropic、Meta AI、xAI 等老对手、以及一些潜在深处的 AI 黑马。

并且,从 GPT-4 发布至今,OpenAI 每一次模型发布的最深层意义并不在于性能的强大,而是提供了一种技术路线的标杆,从而带领人们往未知的深水区迈进。

GPT-4 如此,OpenAI o1 也希望如此。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿|原文链接· ·新浪微博

【2024澳门天天开好彩大全免费】 【新澳天天开奖资料大全最新】
【2024年天天开好彩资料】 【新澳天天开奖资料大全最新54期】
【2024澳门天天开好彩大全53期】 【澳门天天开彩期期精准】
【2024全年资料免费大全】 【新澳天天开奖资料大全】
【澳门内部最精准免费资料】 【2024澳门天天开好彩大全】
【2024年新奥门天天开彩免费资料】 【新澳2024今晚开奖资料】 【澳门一肖一码一必开一肖】
上一条新闻 下一条新闻

推荐文章

发表评论

清川元梦

2秒前:没错,我点的就是 Anthropic、Meta AI、xAI 等老对手、以及一些潜在深处的 AI 黑马。

IP:39.12.5.*

黄颖君

2秒前:爱范儿|原文链接· ·新浪微博

IP:45.65.3.*

迈克尔·格兰特斯琴

5秒前:简单总结新模型的特点: OpenAI o1:性能强大,适用于处理各个领域推理的复杂任务。

IP:45.68.4.*

第一财经APP介绍

APP图标

新澳门今晚开奖结果 开奖APP名:第一财经

版本:V4.14.127

更新时间:2024-09-28 16:21

新澳彩资料免费资料大全33图库这是一个功能强大的2024新澳免费资料图片APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:为了确保新模型的安全,OpenAI 提出了一种新的安全训练方法。

新澳门资料大全正版资料APP介绍

APP图标

2024澳门天天六开彩免费资料第114期APP名:第一财经

版本:V5.16.828

更新时间:2024-09-28 19:19

精准澳门平特一肖这是一个功能强大的新澳门内部资料APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:从下周开始,ChatGPT Enterprise 和 Edu 用户也可以访问这两款模型。

新澳今晚开什么APP介绍

APP图标

2024澳门天天开好彩大全开奖APP名:第一财经

版本:V9.59.449

更新时间:2024-09-28 23:17

澳门二四六天天好彩这是一个功能强大的彩霸王免费内部资料澳门APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:8 哪个大」官方也放出了更多 OpenAI o1 的更多演示视频。

管家婆一码一肖资料免费公开APP介绍

APP图标

新澳门资料大全免费新鼬077APP名:第一财经

版本:V5.21.554

更新时间:2024-09-28 16:13

澳门2024正版资料免费看这是一个功能强大的二四六天天彩资料大全凤凰APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:Jim Fan 也点出了 OpenAI o1 最强大的优势所在,即 o1 模型可以轻松成为数据飞轮的一部分。

澳门一肖一码一必中一肖雷锋APP介绍

APP图标

最准一肖一码一一子中特37bAPP名:第一财经

版本:V6.80.998

更新时间:2024-09-28 14:14

新澳门内部资料精准大全有购买吗这是一个功能强大的2024香港特马今晚开奖APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:在他看来,大模型中的很多参数是用来记忆事实的,这的确有助于在问答的基准测试「刷分」,但如果将逻辑推理能力与知识(事实记忆)分开,使用一个小的「推理核心」来调用工具,如浏览器和代码验证器,这样可以减少预训练的计算量。

2024新奥资料免费精准天天大全APP介绍

APP图标

4949澳门开奖结果APP名:第一财经

版本:V3.99.285

更新时间:2024-09-28 15:15

2024新澳免费资料大全精准版这是一个功能强大的新澳新澳门正版资料APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:又或者,OpenAI o1 已经开始能通过推理,解决一些简单的物理问题,演示列举了一个例子,一颗小草莓被放在一个普通的杯子里,杯子倒扣在桌子上,然后杯子被拿起,询问草莓会在哪里,并要求解释推理过程。

澳门最准的资料免费公开APP介绍

APP图标

2023澳门天天开好彩大全挂牌APP名:第一财经

版本:V9.17.540

更新时间:2024-09-28 20:22

2024澳门特马今晚开奖06期这是一个功能强大的二四六天下彩天天免费大全APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:在最严苛的「越狱」测试中,GPT-4o 得分为 22(满分 100),而 o1-preview 模型得分为 84,在安全性方面堪称遥遥领先。

2024澳门天天开彩大全APP介绍

APP图标

澳门天天彩免费资料大全免费查询APP名:第一财经

版本:V7.32.448

更新时间:2024-09-28 21:21

澳门王中王100%的资料羊了个羊这是一个功能强大的请问今晚上开什么特马APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:目前使用有一定次数限制,o1-preview 每周 30 条消息,o1-mini 每周 50 条。