首页 景点排名文章正文

AlphaFold诺奖成功 不靠堆算力全靠笨功夫

景点排名 2026年06月27日 16:30 2 aa

2024年诺贝尔化学奖颁给AlphaFold核心开发者John Jumper,整个AI圈都在把这当作Scaling Law的又一场胜利。可刚刚跳槽到Anthropic的Jumper本人,却在最新访谈里亲口推翻了这个结论。

AlphaFold的成功,根本不是无脑堆算力的结果,反而恰恰是对AI圈流传多年的“苦涩教训”的反驳。这背后藏着的研究逻辑,远比我们看到的要颠覆认知,为什么一个解决了半个世纪难题的诺奖成果,缔造者偏偏要和主流观点对着干?

AlphaFold诺奖成功 不靠堆算力全靠笨功夫

AlphaFold的蛋白质结构预测对比图 / 展示AlphaFold CASP14的多组蛋白质预测结

被主流叙事忽略的关键真相

说起AlphaFold的突破,行业内最流行的解释就是:足够大的模型、足够多的数据,算力堆到一定程度自然就涌现出了能力。这个解释完美契合了当下AI圈“Scaling Law至上”的叙事,所以越传越广。

可Jumper在访谈里直接戳破了这个童话。他拿出了当年做的大量消融实验结果:外界吹得神乎其神的SE(3)对称性和等变性,拿掉之后模型性能只掉了2-2.5分,而AlphaFold2比AlphaFold1整整提升了30分。

真正决定性能飞跃的,是那个被绝大多数人忽略的定制化损失函数FAPE,还有为蛋白质折叠任务从头搭建的架构EvoFormer。这个主干占用了90%以上的计算量,也贡献了90%以上的准确率。

真正的突破从来不是算力堆出来的,而是针对具体问题一点点磨出来的定制化创新。

最有说服力的证据来自第三方验证:AlQuraishi实验室只用1%的PDB数据重训AlphaFold2,准确率竟然就超过了训练数据多得多的AlphaFold1。这意味着定制化架构带来的,是100倍的数据效率飞跃。

AlphaFold诺奖成功 不靠堆算力全靠笨功夫

蛋白质序列、结构及扩散模型示意图 / 呈现蛋白质从序列到互作及扩散模型流程

AI做科研的真正价值:帮人类找对“该拧哪颗螺丝”

很多人对AlphaFold的想象停留在“预测蛋白质结构”,可在实际科研中,它的价值远不止于此。Jumper举了一个非常典型的研究案例,就能说明问题。

研究者在研究细胞清除废弃蛋白质的机制时,锁定了一种此前无人了解的蛋白质Midnolin,它的运作方式完全不符合已知路径。研究者把Midnolin和近五百种受影响的蛋白质一起输入AlphaFold做联合预测,很快发现了关键特征:40%的目标蛋白质都会被Midnolin的两个结构域牢牢夹住,像被一把铁钳固定。

后续实验室验证显示,移除预测出的结合位点后,蛋白质降解立刻停止;10个样本里9个完全吻合,剩下1个是因为AlphaFold识别出了第二个结合位点,移除后降解也彻底消失。

Jumper用了一个非常生动的比喻:工厂机器坏了,拧螺丝只值五毛钱,知道该拧哪颗螺丝值九千九百九十五块五。这恰恰就是AlphaFold在科研中的真实定位。

AlphaFold诺奖成功 不靠堆算力全靠笨功夫

John Jumper的肖像照 / AlphaFold核心开发者John Jumper的单人肖像

很多人担心AlphaFold会替代生物学家做研究,甚至会出现“预测了结构就等于解决了问题”的幻觉。可Jumper本人对此非常克制,他说AlphaFold从来不是整个细胞的通用模型,它只是一个精准的预测器。

过去做这样的实验可能要花一两年时间筛选靶点,现在几天就能得到明确的方向。剩下的探索和验证,还是要交给生物学家自己完成。这种“窄而准”的定位,恰恰是它最可贵的地方。

“苦涩教训”为什么错了?它忽略了一个核心变量

AI圈有个非常有名的结论叫“苦涩的教训”,说凡是依赖人类领域知识和人工设计架构的方法,长期来看都会被纯算力和纯数据堆出来的模型击败。这个结论近年来被很多人奉为圭臬,可AlphaFold的成功直接反驳了这一点。

Jumper的核心逻辑很简单:如果完全放弃人类对问题的理解,全部交给数据和算力去涌现,那么你需要投入指数级的成本,才能换来线性的能力提升。而针对具体问题做定制化的架构设计,能把数据效率提升几个数量级。

这个结论放在今天特别有现实意义。现在很多大模型团队都在疯狂堆参数堆算力,却很少有人沉下心针对具体场景打磨架构。AlphaFold的案例告诉我们,纯Scaling的路径已经碰到了效率天花板,定制化创新才是下一个破局点。

AlphaFold诺奖成功 不靠堆算力全靠笨功夫

AlphaFold的中心法则示意图 / 展示DNA到蛋白质的转录翻译过程及AlphaFold标识

连AlphaFold3也一样,外界习惯性把它贴上“扩散模型”的标签,觉得只是跟风用了新热点技术。可Jumper澄清说,AlphaFold3的扩散和图像领域的扩散逻辑完全相反。

图像扩散是从乱到整,先生成色块再拼出结构;而蛋白质折叠最难的是宏观结构,所以AlphaFold3是先靠大主干搞定整体结合方式,再用扩散细化微观细节。本质上还是延续了AlphaFold2针对问题定制架构的思路,和跟风热点没关系。

从预测到理解,这道坎永远要人类自己跨

Jumper在访谈里区分了三个非常容易混淆的概念,值得所有AI研究者仔细琢磨:预测是知道仪器上会出现什么数值,控制是知道怎么干预得到想要的结果,而理解是能用紧凑的形式把规律传递给另一个人。

现在AI已经能给我们非常精准的预测,也能帮我们实现很多过去做不到的控制,可理解这件事,永远必须由人类自己完成。AlphaFold预测了2.14亿个蛋白质结构,相当于给全世界研究者打开了一个巨大的宝库,但怎么从这些结构里挖出真正的生物学规律,还是要靠人类自己一步步推导。

AlphaFold诺奖成功 不靠堆算力全靠笨功夫

John Jumper访谈画面 / John Jumper在访谈中抬手讲解的场景

Jumper自己就是这种科研态度最好的代表:他解决了半个世纪的难题,拿了诺贝尔奖,却公开说自己做研究十次有九次是错的。他说真正成功的研究者,就是要接受大部分尝试都会出错,每错一次就对问题多理解一分,最后才能碰到那个正确的方向。

现在整个AI圈都在追求“一次做对”,追求大模型涌现出来的神奇效果,却慢慢忘了科研原本该有的样子:真正的突破,从来都是从无数次错误里磨出来的;针对具体问题的笨功夫,永远比无脑堆算力更有价值。

AlphaFold给整个AI行业上的最重要一课,从来不是“AI能解决大科学问题”,而是不管技术怎么发展,尊重问题本身、愿意沉下心磨细节的笨功夫,永远不会过时。当所有人都在追Scaling的风口,有人愿意停下来给具体问题做定制化创新,这样的人,下一次带来突破只是时间问题。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap