首页 今日新闻文章正文

震撼!全球最强模型GPT-5即将发布

今日新闻 2025年08月01日 18:53 0 aa
震撼!全球最强模型GPT-5即将发布

过去几年,OpenAI 感觉就像一个单人品牌。首席执行官萨姆·奥特曼凭借其娱乐圈风格和融资风头,盖过了公司其他所有大腕的风头。即便他被炒鱿鱼,最终也重回巅峰——而且比以往任何时候都更加出名。但透过这位魅力十足的领头人,你就能更清楚地了解这家公司的未来发展方向。毕竟,奥特曼并非这家公司赖以成名的技术的缔造者。

这一重任落在了 OpenAI 的两位研究主管——首席研究官 Mark Chen 和首席科学家 Jakub Pachocki 身上。他们共同承担着确保 OpenAI 领先于谷歌等强大竞争对手的重任。

最近,Mark Chen和Jakub Pachocki前往伦敦,OpenAI 于 2023 年在伦敦设立了首个国际办事处。在这次访问中,我与两人进行了一次独家访谈。我们探讨了他们如何应对研究与产品之间固有的矛盾。我们还讨论了他们为何认为编码和数学是构建更强大的通用模型的关键;他们所说的通用人工智能 (AGI) 究竟指什么;以及 OpenAI 的超级协同团队(由公司联合创始人兼前首席科学家伊利亚·苏茨克韦尔 (Ilya Sutskever) 组建,旨在防止假想的超级智能失控)的遭遇,该团队在他辞职后不久就解散了。

特别是,我想了解他们在 OpenAI 数月来最大的产品 GPT-5 发布前夕的想法。

有报道称,该公司的下一代模型将于8月发布。OpenAI的官方说法——嗯,Altman的说法——是“很快”就会发布GPT-5。人们对其充满期待。OpenAI在GPT-3和GPT-4上取得的飞跃提升了人们对这项技术可能性的预期。然而,GPT-5发布的推迟引发了谣言,称OpenAI一直在努力构建一个既能满足自身期望(更不用说满足所有人期望)的模型。

奥特曼一反常态地谦虚:“GPT-5 是一个实验模型,它融合了我们将在未来模型中使用的新研究技术,”他在 X 上发帖称——这让它听起来更像是一项正在进行的工作,而不是另一个改变视野的版本。

但对于一家在过去几年里一直引领行业发展进程的公司来说,预期管理也是其工作职责的一部分。陈和帕乔基正是在 OpenAI 内部制定了这些议程。

双峰

该公司在伦敦的总部位于圣詹姆斯公园,距离白金汉宫以东几百米。但我在国王十字车站附近一个共享办公空间的会议室里见到了陈和帕乔基。OpenAI 把这里当作伦敦科技街区中心地带的临时住所(谷歌 DeepMind 和 Meta 就在附近)。OpenAI 的研究传播主管劳伦斯·福康奈特(Laurance Fauconnet)坐在桌子末端,手里拿着一台打开的笔记本电脑。

陈穿着一件栗色 Polo 衫,衣着干净利落,几乎可以说是学院风。他受过媒体方面的训练,与记者交谈时游刃有余。(在“GPT-4o 介绍”视频中,他正在和一个聊天机器人调情。)帕乔基穿着一件印有大象标志的黑色 T 恤,看起来更像电视电影里的黑客。他说话的时候经常盯着自己的手。

但两人的合作比表面上看起来要紧密得多。帕乔基总结了他们的角色。陈负责组建和管理研究团队,他说:“我负责制定研究路线图,并确立我们的长期技术愿景。”

“但角色是可变的,”陈说。“我们都是研究人员,我们利用技术线索。只要我们看到可以解决的问题,我们就会去做。”

陈先生于2018年加入该公司,此前他曾在华尔街公司Jane Street Capital担任量化交易员,开发了用于期货交易的机器学习模型。在OpenAI,他牵头创建了该公司突破性的生成图像模型DALL-E 。随后,他致力于为GPT-4添加图像识别功能,并领导了为GitHub Copilot提供支持的生成编码模型Codex的开发。

帕乔基于 2017 年放弃理论计算机科学学术生涯加入 OpenAI,并于 2024 年接替苏茨克弗担任首席科学家。他是 OpenAI 所谓推理模型(尤其是 o1 和 o3)的主要架构师,这些模型旨在解决科学、数学和编码中的复杂任务。

当我们见面时,他们兴奋不已,因为他们公司的技术连续获得两项新的胜利。

7月16日,OpenAI的一个大型语言模型在全球最硬核的编程竞赛之一AtCoder世界巡回赛总决赛中获得第二名。7月19日,OpenAI宣布其一个模型在世界最负盛名的数学竞赛之一——2025年国际数学奥林匹克竞赛中取得了金牌级别的成绩。

这一数学结果成为头条新闻,不仅因为OpenAI的非凡成就,还因为其竞争对手谷歌DeepMind两天后透露,其一个模型在同一场比赛中也取得了同样的分数。谷歌DeepMind遵守了比赛规则,等待主办方核实结果后再公布结果;而OpenAI实际上已经自己标记了答案。

对陈和帕乔基来说,结果不言而喻。无论如何,他们最兴奋的是编程方面的胜利。“我觉得这被低估了,”陈告诉我。他说,在国际数学奥林匹克竞赛中获得金牌会让你跻身前20到50名选手之列。但在AtCoder竞赛中,OpenAI的模型却名列前两名:“突破了人类表现的全新高度——这是前所未有的。”

船,船,船!

OpenAI 的员工仍然喜欢说自己在研究实验室工作。但如今,这家公司已与三年前 ChatGPT 发布之前大不相同。如今,这家估值 3000 亿美元的公司正与全球规模最大、最富有的科技公司展开竞争。突破极限的研究和引人注目的演示已不再能满足需求。它需要的是将产品交付到用户手中——而事实也的确如此。

OpenAI 持续发布新版本——对其 GPT-4 系列进行重大更新,推出一系列生成式图像和视频模型,并引入了与 ChatGPT 语音对话的功能。六个月前,它发布了 o1 版本,开启了新一波所谓的推理模型浪潮,随后又发布了 o3 版本。上周,它向公众发布了基于浏览器的代理 Operator。OpenAI声称,目前每周有超过 4 亿人使用其产品,每天提交 25 亿条指令。

OpenAI 即将上任的应用首席执行官 Fidji Simo 计划保持这一势头。在一份致公司的备忘录中,她告诉员工,她期待“帮助 OpenAI 的技术惠及全球更多人”,这些技术将“为更多人带来比历史上任何其他技术都多的机会”。预计相关产品将持续推出。

我问OpenAI如何平衡开放式研究和产品开发。“这是我们思考了很久的事情,早在ChatGPT诞生之前,”Pachocki说。“如果我们真的认真考虑构建通用人工智能,那么显然这项技术可以实现很多目标,可以探索很多方向,最终成就伟大的产品。”换句话说,不断摇动树木,收获所能收获的一切。

OpenAI 团队提出的一个观点是,将实验模型推向世界是研究的必要组成部分。目标是让人们意识到这项技术已经发展得多么出色。“我们希望让人们了解未来,以便我们能够参与到这场将会非常艰难的社会对话中,”Altman早在 2022 年就告诉我。这项奇特新技术的创造者们也对它的用途充满好奇:OpenAI 渴望将它交到人们手中,看看人们会如何利用它。

现在还是这样吗?他们异口同声地回答。“是的!”陈说。“某种程度上是这样,”帕乔基说。陈笑着说:“不,你继续说吧。”

“我不会说研究会迭代产品,”帕乔基说。“但现在模型已经达到了传统基准能够衡量的能力的极限,而且我们一直在思考的许多长期挑战也开始显现,我们正处于一个关键时刻,真正重要的是模型在现实世界中能做什么。”

就像在编程比赛中与人类较量一样。在今年日本举办的 AtCoder 大赛上,击败 OpenAI 模型的是一位名叫 Przemysław Dębiak(又名 Psyho)的程序员。这项比赛是一场解谜马拉松,参赛者必须在 10 小时内找到解决复杂编程问题的最有效方法。获胜后,Psyho 在 X 上发帖称:“我累坏了……我快要撑不住了。”

陈和帕乔基与竞技编程界有着密切的联系。两人都曾参加过国际编程比赛,陈还是美国计算机奥林匹克团队的教练。我问他们,这种对竞技编程的个人热情是否影响了他们对模型在这样的挑战中取得优异成绩的重要性的认识。

两人都笑了。“当然,”帕乔基说。“这么说吧,Psyho 算是个传奇人物了。他多年来一直是头号选手。他其实也是我的朋友——我们以前一起参加过这些比赛。” 德比亚克也曾与帕乔基在 OpenAI 共事。

帕乔基参加编程比赛时,他偏爱那些专注于简短问题并有具体解决方案的比赛。但德比亚克则喜欢较长、开放式、没有明显正确答案的问题。

“他以前常取笑我,说我参加的那种比赛,比他喜欢的比赛早得多实现自动化,”帕乔基回忆道,“所以我非常重视这个模型在最近这次比赛中的表现。”

帕乔基告诉我,他全神贯注地观看东京的深夜直播,看着他的模特获得第二名:“Psyho 暂时抵抗了。”

“我们一直在追踪法学硕士在编程竞赛中的表现,”陈说。“我们看着他们变得比我更优秀,比雅库布更优秀。感觉就像李世石下围棋一样。”

李世石是围棋大师,2016年他接连败于DeepMind的围棋模型AlphaGo。这场比赛的惨败震惊了国际围棋界,也导致李世石放弃了职业比赛。去年,他告诉《纽约时报》:“输给人工智能,某种程度上意味着我的整个世界都崩塌了……我再也无法享受围棋的乐趣了。” 然而,与李世石不同的是,陈林和帕乔基很高兴自己被超越。

但我们其他人为什么要关心这些小众的胜利呢?显然,这项旨在模仿并最终取代人类智能的技术,是由那些认为巅峰智力就是在数学竞赛中取得优异成绩或与传奇程序员抗衡的人打造的。这种对智力的看法偏向数学和分析能力,这有问题吗?

“我的意思是,我认为你说得对——你知道,虽然说得有点自私,但我们确实想创造一些能加速我们自身发展的模式,”陈告诉我。“我们认为这是快速进步的一个因素。”

陈和帕乔基等研究人员提出的论点是,数学和编程是更普遍的智能的基石,这种智能能够以我们自身可能未曾想到的方式解决各种各样的问题。帕乔基说:“我们这里讨论的是编程和数学,但真正的智能在于创造力,在于提出新颖的想法,以及将来自不同来源的想法联系起来。”

看看最近的两场比赛:“两场比赛中,都存在一些需要非常艰苦、突破常规思维的问题。Psyho 花了一半的编程比赛时间进行思考,然后想出了一个非常新颖的解决方案,与我们的模型所研究的任何方案都截然不同。”

“这正是我们追求的,”帕乔基继续说道。“我们如何让模型发现这种新颖的见解?如何真正推进我们的知识?我认为它们在某些有限的方式上已经具备了这种能力。但我认为这项技术有潜力真正加速科学进步。”

我回到了关注数学和编程是否有问题的问题,承认如果我们构建的工具是为了帮助我们进行科学研究,那或许没问题。我建议,我们不一定希望大型语言模型能够取代政客,并具备人际交往能力。

陈做了个鬼脸,抬头看着天花板: “为什么不呢?”

缺少什么

OpenAI 成立之初的狂妄自大甚至以硅谷的标准来看也显得格格不入。早在通用人工智能 (AGI) 还只是个噱头的时候,它就吹嘘自己的目标是打造通用人工智能 (AGI)。OpenAI对通用人工智能 (AGI) 依然一如既往地充满热情,并且比大多数公司都更努力地将 AGI 打造成一个价值数十亿美元的主流项目。然而,它还没有达到这个程度。我问陈和帕乔基,他们认为目前还缺少什么。

“我认为展望未来的方式是真正深入地研究我们今天所见的技术,”帕乔基说道。“从一开始,OpenAI 就将深度学习视为一种非常神秘且显然非常强大、潜力巨大的技术。我们一直在努力了解它的瓶颈。它能做什么?它不能做什么?”

陈教授表示,目前最前沿的是推理模型,它将问题分解成更小、更易于管理的步骤,但即使是推理模型也有局限性:“你知道,这些模型知道很多东西,但却无法将这些知识串联起来。这是为什么呢?为什么它不能像人类那样做到这一点呢?”

OpenAI 正在竭尽全力回答这个问题。

“我们可能还处于这种推理范式的初始阶段,”帕乔基告诉我。“实际上,我们正在思考如何让这些模型进行长期学习和探索,并真正带来全新的想法。”

陈强调了这一点:“我真的不认为推理已经完成了。我们肯定还没有解决这个问题。你必须阅读大量的文本才能大致了解人类的知识。”

OpenAI 不会透露它使用什么数据来训练其模型,也不会提供有关其大小和形状的详细信息——只是它正在努力使开发过程的所有阶段更加高效。

这些努力使他们相信,所谓的缩放定律(即模型在投入的计算越多,就会越完善)不会失效。

“我认为没有任何证据表明缩放定律在任何意义上已经失效,”陈坚称。“瓶颈一直存在,对吧?有时与模型构建方式有关。有时与数据有关。但从根本上来说,关键在于找到能够突破当前瓶颈的研究。”

对进步的信念不可动摇。我提到了帕乔基今年5月接受《自然》杂志采访时关于通用人工智能的言论:“2017年我加入OpenAI时,仍然是公司里最怀疑的人之一。” 他看起来有些怀疑。

“我不确定我当时是否对这个概念持怀疑态度,”他说。“但我想我是——”他顿了顿,看着放在面前桌子上的双手。“我加入OpenAI的时候,就预料到要花更长的时间才能达到现在的水平。”

“人工智能会带来很多后果,”他说,“但我最关心的是自动化研究。纵观人类历史,很多内容都是关于技术进步,关于人类创造新技术。计算机能够自主开发新技术的时刻似乎是一个非常重要的转折点。”

“我们已经看到这些模型对科学家有所帮助。但当他们能够放眼更长远——当他们能够为自己建立研究项目时——世界将会焕然一新。”

对陈来说,让模型能够更长时间地自主工作至关重要。“我的意思是,我确实认为每个人对通用人工智能都有自己的定义,”他说。“但自主时间的概念——也就是模型能够在解决难题时取得有效进展而不陷入死胡同的时间——才是我们追求的重大目标之一。”

这是一个大胆的愿景,远远超出了当今模型的能力。但陈和帕乔基让 AGI 听起来几乎平凡无奇,这仍然让我感到震惊。相比之下,18 个月前我与 Sutskever 交谈时,他的反应是这样的。“这将是里程碑式的、惊天动地的,”他告诉我。“会有前后之分。”面对他所构建的巨大工程,Sutskever 将职业重心从设计越来越好的模型转向了研究如何控制他认为很快就会比他自己更聪明的技术。

两年前,苏茨克弗组建了一个所谓的超级协同团队,他将与另一位 OpenAI 安全研究员简·莱克 (Jan Leike) 共同领导。他声称,这个团队将投入 OpenAI 五分之一的资源,研究如何控制一个假设的超级智能。如今,包括苏茨克弗和莱克在内的超级协同团队的大多数人都已离开公司,团队也不复存在。

Leike 辞职时表示,是因为团队没有得到他认为应得的支持。他在 X 上发帖称:“打造比人类更聪明的机器本身就危险。OpenAI 代表全人类肩负着巨大的责任。但在过去几年里,安全文化和流程已经让位于光鲜亮丽的产品。” 其他离职研究人员也表达了类似的看法。

我问陈和帕乔基,他们对这些担忧有何看法。“很多事情都是非常私人的决定,”陈说。“你知道,研究人员可以,你知道……”

他又开口了。“他们可能相信这个领域会以某种方式发展,他们的研究会取得成功,结出硕果。但你知道,公司可能不会按照你希望的方式重塑。这是一个充满活力的领域。”

“很多事情都是个人决定,”他重复道。“有时候,这个领域的发展方向与你的研究方式不太一致。”

但他们两人都坚持认为,协调一致如今已成为核心业务的一部分,而非某个特定团队的关注点。帕乔基认为,除非这些模型能够按照预期运行,否则根本无法发挥作用。而且,由于现有模型本身就极具挑战性,因此很少有人愿意专注于将假设的超级智能与你的目标相协调。

“两年前,我们设想的风险大多只是理论上的风险,”帕乔基说。“如今的世界已经大不相同,我认为很多协调问题现在都具有非常实际的动机。”

尽管如此,实验性技术正以前所未有的速度转化为大众市场产品。这真的从未导致他们之间产生分歧吗?

我经常有机会认真思考长远发展,思考技术的未来发展方向,”帕乔基说道。“应对流程的现实——无论是人员方面,还是公司更广泛的需求——都落在了马克身上。这其实并非真正的分歧,只是我们之间,这些不同的目标和公司面临的不同挑战之间存在着一种天然的冲突。”

陈插话说:“我认为这只是一种非常微妙的平衡。”

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap