据介绍,该模型以前所未有的精确度预测了蛋白质与其他生物分子的结构和相互作用。该研究团队表示,阿尔法折叠3将有助于改变人们对生物世界和药物发现的理解,进而开启人工智能细胞生物学的新时代。
(来源/《自然》)
绘制蛋白质结构约600万种
早在2018年的CASP13(蛋白质结构预测评估)竞赛中,阿尔法折叠1就引起了广泛关注,因为它在蛋白质结构预测方面表现出色,当时阿尔法折叠1的表现远超其他参赛团队。
2020年,Deep Mind发布了阿尔法折叠2。在那年的CASP14竞赛中,阿尔法折叠2展示了前所未有的准确率,在预测蛋白质结构方面取得了突破性进展。据当时的评估结果报告,阿尔法折叠2的平均误差大概只有一个原子的直径(0.1纳米),其预测准确度与传统实验方法相当,当时在科学界引起了巨大反响。Deep Mind随后也与科学界合作,通过使用阿尔法折叠2解析了多种生物学上重要的蛋白质结构,加速了生物医学研究的进程。
据了解,2021年,Deep Mind与欧洲生物信息学研究所合作,公开了阿尔法折叠DB,这是一个包含数以万计的蛋白质结构预测的数据库。这些数据的公开让全球的科研人员都能够免费访问这些蛋白质结构信息。在2022年,阿尔法折叠2也进行了全面升级。
据Deep Mind此前表示,在短短3年里,阿尔法折叠2已被180万研究人员使用,绘制出约600万种不同的蛋白质结构。但这些图是单个静态蛋白质的图像,不包含细胞内部发生的化学通讯。“生物学是一个动态系统,”Deep Mind首席执行官戴密斯·哈萨比斯解释,“你必须了解细胞中不同分子之间的相互作用如何产生生物学特性。”
AI助力治疗疾病、药物研发
6年后的今天,谷歌Deep Mind推出了最新的阿尔法折叠3,旨在帮助科学家更有效地设计药物和针对疾病。Isomorphic Labs首席人工智能官马克斯·贾德伯格表示,阿尔法折叠3的功能为研究人员快速识别潜在的新药物分子提供了新的机会。据了解,此前Isomorphic Labs已与制药公司礼来和诺华建立了合作伙伴关系。
马克斯·贾德伯格说:“这使得我们的科学家、药物设计师能够在原子水平上创建和测试假设,然后在几秒钟内使用阿尔法折叠3生成高度准确的结构预测。相比之下,传统实验方法可能需要数月甚至数年的时间。”
据该团队称,与许多现有的专用工具(包括基于其前身的工具)相比,阿尔法折叠3的预测准确性“显著提高”。与现有的预测方法相比,这个版本的阿尔法折叠在预测蛋白质与其他分子之间的结构和相互作用方面至少提高了50%。在一些关键的研究领域,其预测准确度甚至提高了一倍,达到了100%的改进。阿尔法折叠3能够精确预测蛋白质、DNA、RNA和配体的结构及它们之间的相互作用。这一进展为治疗癌症、自身免疫性病症等疾病提供了希望。
Deep Mind的阿尔法折叠团队负责人约翰·詹珀表示:“我们看到了令人难以置信的进步,我们认为这些进步将解锁许多新科学。”他指出该技术在提高植物生物学知识以及粮食安全方面同样具有潜力。“我们已经开始看到生物学家和早期测试人员使用它来了解细胞如何工作,并开始思考它可能会出现什么样的误差。”他说。
记者梳理其论文概述后发现,最新的阿尔法折叠3有着几项重大的更新。
最新版本的阿尔法折叠将更少依赖于与目标序列相关的蛋白质信息。同时阿尔法折叠3还使用一种称为扩散模型的机器学习网络,该网络可以被图像生成式人工智能使用。约翰·詹珀表示:“这是一个相当大的变化。”
同时,研究人员表示,阿尔法折叠3在预测蛋白质及其结构方面远远优于现有的软件工具。例如,对寻找新药感兴趣的科学家通常使用一款名为docking的软件来模拟化学物质与蛋白质的结合程度,而阿尔法折叠3被证明优于这个软件,同时也被证明优于另一个名为RoseTTAFoldAll-Atom4的基于人工智能的工具。
约翰·詹珀和他的同事在稍早的报告中也用数据验证了他们的说法。报告显示,在400多个测试案例中,阿尔法折叠3能够正确模拟已知的蛋白质和类药小分子之间的相互作用,其中76%的案例能够正确模拟,而RoseTTAFoldAll-Atom的这一比例约为40%。对于蛋白质和抗体之间的相互作用,阿尔法折叠3的正确率为62%,而AlphaFoldMultimer(该公司之前用于模拟蛋白质与其他生物分子相互作用的软件包)的正确率为30%。
据了解,为了鼓励新模型被广泛采用,Deep Mind研究人员还发布了阿尔法折叠服务端,这是一个免费的在线使用平台,Deep Mind研究人员为此发布了一个包含约2亿个蛋白质结构的数据库。
新模型的优与劣
波士顿咨询集团本周发表的一项研究表明,与其他方法发现的药物相比,人工智能发现的药物在早期试验中的成功率更高。该研究指出这些数据是对该技术在药物发现及有效性的早期分析,研究表示人工智能可以使制药研发的生产力提高一倍。
据另一国际知名学术期刊《科学》对这一模型的介绍与解读,伦敦国王学院的生物学家朱利安·伯杰龙获得了测试阿尔法折叠3的机会,他称该软件在加快研究速度方面具有变革性。研究人员无需花费数年时间在实验室研究蛋白质,而是可以在几分钟内得到结果。“我们可以开始在计算机中测试假设,”朱利安·伯杰龙说,“我非常确定世界上每个结构生物学和蛋白质生物化学研究小组都会立即采用这个系统。”
加州大学旧金山分校的药物化学家布赖恩·肖伊切特一直在使用阿尔法折叠来寻找药物,他说,由于对蛋白质与可能的药物相互作用建模的限制,他并不觉得阿尔法折叠3具有阿尔法折叠2在之前所带来的影响大。
正如该研究团队在报告所介绍,阿尔法折叠3仍在很多方面存在局限性,需要进一步的迭代和改进。包括立体化学限制、预测准确性问题、结构构象限制、缺乏动态信息、特定目标预测限制等。