诺贝尔化学奖再颁给AI,我们不再需要科学家了?

文章来源: - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
被阅读次数



2024年诺贝尔化学奖刚刚揭晓,美国科学家大卫·贝克(David Baker)获得了一半奖金,以表彰他在蛋白质结构设计领域所做的开创性贡献,另一半则共同授予英国科学家德米斯·哈萨比斯(Demis Hassabis)和美国科学家约翰 ·江珀(John Jumper),以表彰他俩在蛋白质结构预测方面所做的贡献。

这两个成果都非常新,但目的都是为了解决一个非常古老的问题,那就是如何从蛋白质的一维结构预测其三维结构。

科学家们很早就知道,蛋白质是生命体内最重要的化学物质,从身体结构到生化功能都是蛋白质在发挥作用。化学家们也很早就知道蛋白质是由氨基酸首尾相连组成的一条线性分子,并很快就掌握了如何测量蛋白质氨基酸序列的方法。可问题在于,生命是三维的,蛋白质要想发挥作用,必须先从一维的氨基酸链条转变成三维的立体结构。不同的蛋白质之所以有着不同的功能,主要原因就是它们的三维结构有所不同。

打个比方,同样的一盒乐高积木既可以搭成一幢房子又可以搭成一辆汽车,这盒积木对于玩家的价值取决于最终的结果。

按照常识推断,一个蛋白质的三维结构应该是由它的一维结构,即氨基酸序列所决定的。早年间曾经有人猜测蛋白质是在某个外力的帮助下折叠成特定的三维结构的,但在上世纪60年代有人发现蛋白质完全不需要任何外力的帮助就可以在合适的溶液里瞬间折叠成特定结构,整个过程用不了一秒钟的时间。这就好比说你把一个乐高房子拆散,那些木块可以在一瞬间迅速自我搭建成原来那幢房子,模样丝毫不差。

这个过程貌似神奇,但其原理倒是一点都不复杂。大家知道,氨基酸是由碳氢氧氮等原子组成的小分子,这些原子依靠化学键彼此相连,构成了或亲水、或疏水、或中性的各种基团。当蛋白质分子溶于水中时,亲水基团很自然地会暴露在外,疏水基团则倾向于躲在内部。除此之外,氨基酸的各个基团有的带正电,有的带负电,彼此之间也会发生或吸引或排斥的反应。如果位置不当,蛋白质内部会有一种紧张感,只有当每个氨基酸都恰好坐落在最合适的位置上时,这个蛋白质才算安定下来,达到能量的最低状态。

蛋白质折叠的原理虽然很容易理解,但从一维结构推测三维结构却难上加难,因为蛋白质是由成百上千个氨基酸组成的。其中一部分氨基酸形成的多肽链被称为蛋白质的初级结构;之后,这些多肽链会先折叠成一些简单的三维结构,好像是螺旋线或者梯子,科学术语称之为二级结构;这些简单的二级结构再会叠加成更加复杂的三维构象,这就是蛋白质的三级结构;最后,不同的蛋白质还会和一些化学元素组合成更加复杂的蛋白质复合物,这才是最终起作用的蛋白质四级结构。

科学家们忙乎了半天,发现他们只能从氨基酸序列推测出蛋白质的二级结构,再往下就走不动了,因为实在是太过复杂,计算量太大了。

X射线晶体衍射技术的出现部分地解决了这个问题。简单来说,科学家先把要研究的蛋白质进行提纯,然后让它在合适的条件下结晶,之后就可以利用X射线的衍射作用对它进行拍照,从中推测出这个蛋白质的三维结构了。事实上,这个技术可以适用于任何有机大分子,当初DNA双螺旋结构就是这么被画出来的。

在这个领域做得最好的人就是中国科学家颜宁,她的实验室是蛋白质三维结构预测领域的国际领先者,发表过无数论文。但是,这个技术需要首先获得蛋白质结晶,这并不是一件很容易的任务,需要耗费大量的时间精力,成本也极其高昂。更何况很多蛋白质很难在自然条件下结晶,很多跨膜蛋白甚至不可能按照这个方法来研究,所以说这个技术路线只能解决一部分问题。

有没有办法直接从氨基酸序列推测出蛋白质的三维结构呢?理论上是有可能的,但因为数据量太大,计算过程实在是太复杂,很多科学家前仆后继地投入这个领域,却均铩羽而归。

最先获得决定性突破的就是获得今年诺贝尔化学奖一半奖金的贝克,他从1993年进入这个领域,开发出了一系列能够根据氨基酸序列预测蛋白质结构的软件,取名为罗塞塔(Rosetta)。这套软件在国际蛋白质结构预测评估大赛(CASP)上保持了多年的领先优势,是这个领域最早的明星。

更可贵的是,贝克没有试图垄断这个具有很大盈利潜力的技术,而是建立了一个罗塞塔社区,让所有感兴趣的人都可以下载这套软件并参与开发,这种开源精神在当今这个追求金钱的时代显得极其难能可贵。

2018年的CASP大赛出现了一位神秘的参赛者,这就是大名鼎鼎的DeepMind团队,他们因为开发出了围棋程序阿法狗(AlphaGo)而享誉全世界。成功之后,团队领导人哈萨比斯很快就把注意力转向了蛋白质结构预测这个生物学领域的珠穆朗玛峰,并雇佣了一批生物学家和计算机科学家一起组成了一个团队集体攻关,于2018年开发出了第一代基于人工智能技术的蛋白质结构预测软件AlphaFold,在2018年的CASP大赛上力压其他97个参赛者。

2020年,DeepMind公司又开发出了AlphaFold2,彻底碾压了此前所有的预测软件,其中就包括罗塞塔。而AlphaFold2团队的领导者就是和哈萨比斯分享另一半奖金的江珀。2021年,AlphaFold2已经能够成功预测98.5%的人类蛋白质结构,其准确性和实验结果相差无几。

就在今年5月,DeepMind团队又推出了AlphaFold 3,以前所未有的精确度预测了几乎所有的生命分子,包括蛋白质、DNA和RNA的三维结构,以及它们之间的相互作用模式。这项成果在新药研发领域具有无比巨大的潜力,从此科学家们就可以事先在计算机上设计出新的药物,而不需要费劲地从大自然里筛选新药候选人了。

那今后是不是不再需要人类科学家了呢?起码从目前看来,答案是否定的,因为人工智能尚不具备从复杂现象中总结出普遍规律的能力,或者说人工智能在这方面的能力尚未达到顶尖人类大脑的水平。

就拿蛋白质来说,科学家们发现很多蛋白质和某个目标物结合后会改变性质,科学术语称之为别构调节(allosteric regulation)。比如人体内有大约一半的蛋白质有被磷酸化的潜力,而蛋白质的磷酸化不是0和1的差别,而是线性的,计算机在研究这种线性变化时会显得无能为力。

除此之外,科学家们还发现了很多无序蛋白,它们在天然条件下没有确定的三维结构,但却具有相当广泛的功能。事实上,无序蛋白的结构灵活性恰恰是很多生物功能所必须的,因为自然环境千变万化,蛋白质也必须随时进行线性的微调才能跟得上,这又是目前的计算机难以驾驭的领域。

总之,今年的3个理科诺奖其实都和复杂系统有关。获得医学或生理学奖的microRNA虽然本身属于传统的经典遗传学范畴,但它背后所代表的基因调控是一个庞杂到无以复加的复杂系统,很难用简单的因果链条加以解释。获得物理学奖的神经网络其实就是这种复杂系统的一个计算机模拟程序,我们已经在人工智能领域看到了这个模拟程序的巨大潜力。化学奖同样体现了科学家试图利用计算机来模拟蛋白质复杂的三维结构的努力,同样在新药研发领域展现出了巨大潜力。

所以,与其说今年的诺贝尔奖是人工智能的胜利,不如说是复杂系统的胜利。科学研究的范式正在从过去的推导因果关系进化到研究因果关系不明的复杂系统,传统物理学在今年的缺失也从另一个侧面说明科学的范式转变已经来临。

我是一个四川人 发表评论于
阿法狗横空出世,颜宁就被AI失业了,所以选择回国当官是明智之举啊!
令胡冲 发表评论于


DeepMind其实没有任何技术和现象。只是花钱做了一些应用玩具。多数不成功,比如给NHS分析病理档案。少数成功,因为平均450M做一个模型。

————-
kingdale1 发表评论于 2024-10-10 07:55:32 这位太小看哈撕比斯了。DeepMind是他共同创立的,里面的技术方向都是他主持的。它的技术模式和现象的ChatGPT的不一样,并不是LLM。它的技术早就应用在谷歌内部的各个方面。比如数据中心的优化,每年给谷歌省的电费数亿。你这个人无知负面。
Mary888 发表评论于
AI真的很棒,学古希腊语言的《圣经》时,chatgbt可以帮助翻译希腊语单词,很准确。
胖得理直气壮 发表评论于
今年诺奖忘了初心
生肖迷宫 发表评论于
AI其实已经进化到相当高的程度了,其分析能力远远超过了人,而且其分析功能并不是按人的设计实现的,而是按其自己发现的规律进行的,其发现的规律是什么呢?因为数据量太大,往往人是看不懂的,这也是AI危险性的原因。
泥川 发表评论于
kingdale1 发表评论于 2024-10-10 07:55:32
-----------------------------------------------------

哈撕比斯创立DeepMind是一回事,但他多大程度上参与了ALphafold,他在算法上有多大贡献?

如果他没有主要技术上的贡献,他就不应该得奖。
泥川 发表评论于
没有观察和实验,就没有AI的基础。Alphafold能预测蛋白质结构,是从已知3D结构学会的。而结构是科学家实验测出来的。

AI离自己能观察和实验,还差得太远太远。

所有AI的所谓能力,都是建立在人手工获得的知识之上。离开人来打底子,AI就是一堆0和1,没任何意义。
kingdale1 发表评论于
这位太小看哈撕比斯了。DeepMind是他共同创立的,里面的技术方向都是他主持的。它的技术模式和现象的ChatGPT的不一样,并不是LLM。它的技术早就应用在谷歌内部的各个方面。比如数据中心的优化,每年给谷歌省的电费数亿。你这个人无知负面。
===============================================
令胡冲 发表评论于 2024-10-10 06:36:36
AlphaFold根本就不是哈撕比斯做的。既不是他个人原创,他也没有生化背景。他只是拉来了谷歌收购的大笔投资,重金招募AI工程师而已。6年前他在Kings Cross的团队平均基本工资已有27万。这些年他花了谷歌十几亿,没有一天盈利一元钱。多数产品不了了之。谷歌花钱供他玩玩具一样。AlphaFold也是最近才用Transfomer。里面没有任何独创技术。仅仅是一种应用创新。
大河边的人 发表评论于
生成式AI可以根据情况自动添加考虑因素和计算程序,强大的计算能力和联想能力保证了空间结构和蛋白质功能的高度吻合,在药物筛选和设计中节省了无数的经费。这个问题和要不要科学家没有直接关系,但对搞蛋白质晶体结构的人的需求是越来越少了。
初春时节 发表评论于
这篇文章写的很好,把问题讲的很清楚。
令胡冲 发表评论于


AlphaFold根本就不是哈撕比斯做的。既不是他个人原创,他也没有生化背景。他只是拉来了谷歌收购的大笔投资,重金招募AI工程师而已。6年前他在Kings Cross的团队平均基本工资已有27万。这些年他花了谷歌十几亿,没有一天盈利一元钱。多数产品不了了之。谷歌花钱供他玩玩具一样。AlphaFold也是最近才用Transfomer。里面没有任何独创技术。仅仅是一种应用创新。


诺贝尔奖根本不应该发给这个人。至少应该是个团队。


硅谷工匠 发表评论于
Demis Hasbis是个奇人, 希腊父亲新加坡母亲,四岁就学下棋。剑桥少年班,后来选择先参加工作(17岁)。
真环 发表评论于
文章写得不错有知识有思想,就是颜宁算广告植入吗?啥时拿诺奖。呵呵
令胡冲 发表评论于



谁说过不需要科学家了?科学家可以给AI公司打工啊,负责收集、处理、标注数据。负责培训AI工程师的生化知识。这些活都是苦劳力。而且工资不会涨。AI工程师工资会十倍增长。AI资本家工资会千倍增长,都是百亿身家起步。但生化科学家和普通码工会成铁锈蓝领,工资多年停滞。


码农个体户 发表评论于
在今后很长阶段,AI只能扮演干活苦力角色,会提高科研效率,无法取代科学家
罗马军团 发表评论于
此文这个观点说得很好:复杂大系统。其实换成另一个词就是:多样性。市场经济对计划经济最终总是能笑到最后的原因也在于此,它的生命力根源也就是因为它的复杂性,或者说:多样性。

这个世界就是基于多样性运行发展的。无论是宇宙还是生物都是如此。这个现象很早就被人发现,就是所谓的“幸存者偏差”。大自然不会去设计什么,它就是暴力堆叠,产生千千万万种不同的东西随机组合,最终最有效最稳定的东西取得统治地位,所谓一将功成万骨枯,我们所看到的每一个“自然”的东西,都是竞争中胜出的那一个,背后是数不清的被淘汰的“代价”。

生物进化是如此,没人去设计什么进化方向,它就是暴力突破,产生千千万万个变种,向所有的方向探寻,最终胜出的就是进化的方向。能产生的变种越多,这个物种越有生存适应力,越能更快速地进化。市场经济也是如此,没人能决定什么方向才是正确的方向,千千万万个人向不同的方向探索,有些方向众望所归,有些方向匪夷所思,有些方向“大逆不道”,没人能知道最终胜出的是什么,也没人能决定。这是复杂性,多样性的胜利。