人工智能或将引发科学革命

Mitch Leslie

工程(英文) ›› 2024, Vol. 35 ›› Issue (4) : 4 -6.

PDF (850KB)
工程(英文) ›› 2024, Vol. 35 ›› Issue (4) : 4 -6. DOI: 10.1016/j.eng.2024.03.002
新闻热点

人工智能或将引发科学革命

作者信息 +

A rtificial Intelligence Could Revolutionize Science—If We Can Trust It

Author information +
文章历史 +
PDF (869K)

引用本文

引用格式 ▾
Mitch Leslie. 人工智能或将引发科学革命[J]. 工程(英文), 2024, 35(4): 4-6 DOI:10.1016/j.eng.2024.03.002

登录浏览全文

4963

注册一个新账户 忘记密码

无论是试图开发新癌症疗法的药物研发者、研究病毒如何侵入细胞的病毒学家,还是探究突变对生物体适应性影响的进化生物学家,他们都需要了解特定蛋白质的三维结构。然而,通过实验推断蛋白质的结构既费力又昂贵[1]。到21世纪20年代初,研究人员仅成功解析了约20万种蛋白质,不到已知生物产生的总量的0.1% [2]。但在2022年中期,科学家宣布,由总部位于英国伦敦的谷歌子公司DeepMind开发的人工智能(AI)模型AlphaFold,已经预测了超过2.2亿个几乎所有未解决蛋白质的结构(图1)[34]。美国康涅狄格州新伦敦的康涅狄格学院化学教授Marc Zimmer说,研究人员花了大约50年的时间和大约20亿美元来通过实验确定20万种蛋白质的结构。“AlphaFold可以在几天内做到这一点,而且几乎不花任何费用,因为它是在线运行的。”
AI不仅阐明了现有分子的结构。它还在发明新的分子。几种AI设计的药物已经进入临床试验,其中一种药物首次进入II期试验,以测试其是否有效[5]。AI正在其他研究领域带来了值得关注的发现,包括地质学[6]、物理学[7]、神经科学[8]和数学[9]。“AI正在建立我们以前从未建立过的联系。这是突破性的。”Zimmer说。
但一些研究人员担心科学领域越来越依赖AI。AI可能会误导人类,捏造假结果,这个问题被称为幻觉[1011]。即使是准确的结果也可能与科学无关。像所有科学发现一样,由AI做出的发现也需要被证实。但许多研究人员忽略了这一步,美国伊利诺伊州芝加哥的德保罗大学计算和数字媒体助理教授Casey Bennett说,“很多人没有遵循科学流程来正确地验证答案。”此外,由于AI得出结论的过程通常不透明,研究人员可能无法验证AI的一些结果,一些专家担心这可能会在科学领域引发“可重复性危机”[1213]。
AI包含了多种技术,其中包括机器人技术。但研究人员通常使用的是被称为机器学习的AI种类,在此技术中,计算机通过分析大量数据集来推断或识别分子形状[14]。“机器学习擅长挑选超出我们认知能力的模式,”Bennett说。这种能力已经使AI在包括天文学等多个领域不可或缺。如果没有机器学习的帮助,天文学家就无法分析望远镜和其他仪器产生的大量数据,美国亚利桑那州图森的亚利桑那大学天文学教授Chris Impey说。例如,他指出,智利的Vera C. Rubin天文台将于2024年开始对南部天空进行为期十年的观测,每晚将产生多达40 TB数据。他说,AI检测异常的能力特别有价值,它使研究人员能够识别可能被忽视的新天体。“在天文学中,你并不总是知道你在寻找什么。”天文学家已经使用AI发现了我们太阳系外的一颗新行星,揭示一颗可能撞击地球的小行星,还取得其他发现[1516]。
如上所述,一些研究人员试图破解生物学中最棘手的问题之一——预测蛋白质如何折叠成复杂形状,他们也从AI中获得了颠覆性的推动[4]。蛋白质的结构决定了它的工作原理,但仅从其氨基酸序列或化学构建块预测蛋白质的形状是极其困难的[17]。尽管研究人员几十年来一直在测试AI模型(包括以前版本的AlphaFold)的预测能力,但直到2020年的蛋白质折叠竞赛——蛋白质结构预测的关键评估——才让这项技术展现了其实力。AlphaFold以很大的优势击败了其他50多个竞争对手,其三分之二的预测与实验确定的结构一样准确——这是AI模型性能的重大飞跃[1819]。
DeepMind的科学家通过向模型提供大约17万种蛋白质的已知结构来训练该模型。当AlphaFold的任务是预测未解析蛋白质的形状时,它使用这些结构作为指南来确定哪些氨基酸可能彼此靠近[18]。该模型的开发者在前一版的AlphaFold基础上进行了改进,增加了一种算法,该算法可以通过从小片段开始,然后逐渐过渡到更大的片段来构建蛋白质的结构[18,20]。
AlphaFold的成功引发了它的应用热潮。在AlphaFold数据库上线后的前9个月内就有超过40万人访问了该数据库,同一时间引用该模型的论文数量增加了四倍多[21]。研究人员已经利用AlphaFold来发现一种治疗肝癌的潜在新药[22],预测了一种来自危险病毒的关键蛋白质的结构[23],并生成了最全面的核孔复合体模型,核孔复合体是控制细胞核内外物质进出的复杂分子通道[21]。“我们突然可以很容易地完成以前非常困难或不可能的事情,”Zimmer说。DeepMind还发布了AlphaFold的升级版本,可以预测蛋白质将如何与其他类型的分子相互作用,这一功能可能会惠及药物开发者[24]。
一些新闻文章宣称AlphaFold已经“解决”了蛋白质折叠问题,但是加州大学洛杉矶分校生物化学教授Tamir Gonen警告说,AI模型并不提供分子结构的最终结论。他说,AlphaFold通常可以正确解析蛋白质的整体结构。这种能力使研究特定蛋白质的科学家更容易获得分子可能的模型,这“可能帮助他们解释他们的实验,”Gonen说。“我谨慎地选择我的措辞,”他补充道,因为AlphaFold的预测结构也可能是错的。“你必须验证这些模型。如果你不这样做,而是把它们当作真理,你可能会有很大的问题,”Gonen说。简而言之,他说,AI还没有准备好取代生物学家。“也许有一天,我们不再需要通过实验来解析结构,但我们还没有达到那个地步。”
加拿大多伦多儿童医院研究所的高级科学家Julie Forman-Kay和其他研究人员发现,AlphaFold在处理某些蛋白质特征时也存在困难。所有人类蛋白质都包含称为固有无序区域的部分,这些部分不会折叠成明确的形状,而是在不同构象之间不断变换[25]。蛋白质中超过三分之一的氨基酸处于无序区域,蛋白质的无序程度从几乎没有无序到完全无序不等[26]。2023年,Forman-Kay和她的团队分析了AlphaFold如何处理固有的无序区域。研究人员原以为,AlphaFold会将对这些区域的预测标记为不确定,从而警告用户这些假定结构可能不正确。但Forman-Kay和她的同事报道[27],在大约15%的时间,该模型假设这些区域将折叠成特定的形状,并对其预测给予了高置信度。Forman-Kay说,在大多数情况下,无序区域可能在某些条件下采用特定的形状,例如,当它与另一种蛋白质结合时。但这些条件是未知的,很多时候无序区域在不同的条件下折叠成不同的结构,这使得AlphaFold的预测结构不准确。Forman-Kay说,很少有科学家意识到这些局限性,他们可能会错误地得出结论,认为该模型的预测是确定的。她仍然认为,AI为蛋白质折叠提供了重要的见解,但研究人员需要认识到“它只是一种工具”,需要谨慎应用。
AI不仅仅帮助研究人员分析数据。在空间科学和天体物理学等领域,它还可以帮助决定科学家看到数据的内容。如今,航天器和观测卫星可以收集的数据远远超过它们传回地球的带宽。这就是为什么越来越多的太空任务还包括配备AI模块的机载计算机。这些AI系统过滤掉不良或低质的数据,让飞船只将高质量的数据发回地球[28]。美国马里兰州劳雷尔的约翰霍普金斯大学应用物理实验室的物理学家Simon Wing说道,赋予AI算法这种能力也给它们带来很大的负担。他说,“如果使用AI来减少数据,我们要小心。”如果AI没有得到适当的训练或应用,“它可能会将有用的数据误认为是坏数据。如果这样,数据将永远丢失。”
Bennett担心许多由AI模型产生的已发表结果是错误的或无关紧要的。他说,研究人员没有仔细检查他们的发现是否准确且具有科学价值。“问题不在于‘我能找到一个模式吗?’这很容易,而是在于找出哪些模式在现实世界中有意义,这很难。”根据Bennett的说法,根本原因是研究人员不了解AI的微妙之处和局限性就急于使用它。他认为,在科学家将AI应用于研究之前,他们应该通过由专业机构设立的认证课程,就像为律师和医生颁发执照的组织那样。“机器学习,就像手术一样,需要适当水平的培训和经验,”他说。“否则,可能会产生误导性的答案和糟糕的解决方案。”
其他研究人员并没有走那么远。但一些承认AI局限性的科学家正在努力使其结果更加可信。AI所谓的黑箱问题——模型如何得出结论往往是个谜——长期以来是一个令人担忧的问题[29]。甚至AlphaFold的一些“思考”过程也难以解释,DeepMind的首席执行官已经承认了这一点[30]。为了克服这个问题,研究人员正在开发所谓的可解释AI,即遵循特定规则和程序的模型,以使其推理是透明的[31]。
专家表示,这只是使AI结果更可信的第一步,科学家还需要更清楚地了解这些模型可以实现和不能实现什么。Wing说,“只要AI工具使用得当,并且它们的局限性得到承认,AI工具可以很有启发性。”

参考文献

[1]

Seay TH. Has AlphaFold actually solved biology’s protein-folding problem? [Internet]. Washington, DC: Science News; 2023 Sep 23 [cited 2023 Dec 31]. Available from:

[2]

Metz C. A.I. predicts the shape of nearly every protein known to science [Internet]. New York City: The New York Times; 2022 Jul 28 [cited 2023 Dec 31]. Available from:

[3]

Callaway E. ‘The entire protein universe’: AI predicts shape of nearly every known protein. Nature 2022;608(7921):15‒6. . 10.1038/d41586-022-02083-2

[4]

O’Neill S. Machine learning turbocharges structural biology. Engineering 2022;12:9‒11. . 10.1016/j.eng.2022.03.007

[5]

Smyth J. Biotech begins human trials of drug designed by artificial intelligence [Internet]. London: Financial Times; 2023 Jun 26 [cited 2023 Dec 31]. Available from:

[6]

Witze A. AI predicts how many earthquake aftershocks will strike—and their strength [Internet]. London: Nature; 2023 Sep 28 [cited 2023 Dec 31]. Available from: 10.1038/d41586-023-02934-6

[7]

Jarman S. Particle physicists get AI help with beam dynamics [Internet]. Bristol: Physics World; 2023 May 23 [cited 2023 Dec 31]. Available from:

[8]

Rosso C. New AI tracks neurons in moving animals [Internet]. New York City: Psychology Today; 2023 Dec 15 [cited 2023 Dec 31]. Available from:

[9]

Castelvecchi D. DeepMind AI outdoes human mathematicians on unsolved problem. Nature 2024;625(7993):12‒3. . 10.1038/d41586-023-04043-w

[10]

Thorbecke C. AI tools make things up a lot, and that’s a huge problem [Internet]. New York City: CNN Business; 2023 Aug 29 [cited 2023 Dec 31]. Available from:

[11]

Mackenzie D. Surprising advances in generative artificial intelligence prompt amazement—and worries. Engineering 2023;25:9‒11. . 10.1016/j.eng.2023.04.004

[12]

Ball P. Is AI leading to a reproducibility crisis in science? Nature 2023;624(7990):22‒5. . 10.1038/d41586-023-03817-6

[13]

Wong M. Science is becoming less human [Internet]. Washington, DC: The Atlantic; 2023 Dec 11 [cited 2023 Dec 31]. Available from:

[14]

Brown S. Machine learning, explained [Internet]. Cambridge: MIT Sloan School of Management; 2021 Apr 21 [cited 2023 Dec 31]. Available from:

[15]

Sutter P. AI is already helping astronomers make incredible discoveries. Here’s how [Internet]. New York City: Space; 2023 Oct 4 [cited 2023 Dec 31]. Available from:

[16]

Impey C. AI is helping astronomers make new discoveries and learn about the universe faster than ever before [Internet]. Melbourne: The Conversation; 2023 May 3 [cited 2023 Dec 31]. Available from:

[17]

Service RF. ‘The game has changed’. AI triumphs at solving protein structures. Science 2020;370:1144‒5. . 10.1126/science.abf9367

[18]

Heaven WD. DeepMind’s protein-folding AI has solved a 50-year-old grand challenge of biology [Internet]. Cambridge: MIT Technology Review; 2020 Nov 30 [cited 2023 Dec 31]. Available from:

[19]

O’Neill S. Artificial intelligence cracks a 50-year-old grand challenge in biology. Engineering 2021;7(6):706-‒8. . 10.1016/j.eng.2021.04.003

[20]

Howes L. DeepMind AI predicts protein structures [Internet]. Washington, DC: Chemical & Engineering News; 2022 Dec 1 [cited 2023 Dec 31]. Available from:

[21]

Callaway E. What’s next for the AI protein-folding revolution. Nature 2022;604:234‒8. . 10.1038/d41586-022-00997-5

[22]

First application of AlphaFold in identifying potential liver cancer drug [Internet]. New Rochelle: Genetic Engineering & Biotechnology News; 2023 Jan 24 [cited 2023 Dec 31]. Available from: 10.1089/gen.43.02.12

[23]

Callaway E. How AlphaFold and other AI tools could help us prepare for the next pandemic. Nature 2023;622:440-1. . 10.1038/d41586-023-03201-4

[24]

Palmer K, Trang B. DeepMind touts AlphaFold’s new skills as protein-folding AI models face off [Internet]. Boston: STAT; 2023 Oct 31 [cited 2023 Dec 31]. Available from:

[25]

Timmer J. Google’s AI protein folder IDs structure where none seemingly existed [Internet]. New York City: Ars Technica; 2023 Sep 20 [cited 2023 Dec 31]. Available from:

[26]

Tsang B, Pritišanac I, Scherer SW, Moses AM, Forman-Kay JD. Phase separation as a missing mechanism for interpretation of disease mutations. Cell 2020;183(7):1742‒56. . 10.1016/j.cell.2020.11.050

[27]

Alderson TR, Pritišanac I, Kolaric´ Ð, Moses AM, Forman-Kay JD. Systematic identification of conditionally folded intrinsically disordered regions by AlphaFold2. Proc Natl Acad Sci USA 2023;120(44):e2304302120. . 10.1073/pnas.2304302120

[28]

Artificial intelligence in space [Internet]. Paris: European Space Agency; 2023 Aug 3 [cited 2023 Dec 31]. Available from: 10.1093/law/9780192882486.003.0012

[29]

Bagchi S. What is a black box? A computer scientist explains what it means when the inner workings of AIs are hidden [Internet]. Melbourne: The Conversation; 2023 May 22 [cited 2023 Dec 31]. Available from:

[30]

Lewis T. The AI biologist: DeepMind’s Demis Hassabis explains how artificial intelligence solved one of the biggest problems in biology. Sci Am 2023;328(2):28‒30. . 10.1038/scientificamerican0223-28

[31]

What is explainable AI [Internet]. Armonk: IBM; [cited 2023 Dec 31]. Available from: 10.1007/978-3-031-09974-8_1

AI Summary AI Mindmap
PDF (850KB)

4510

访问

0

被引

详细

导航
相关文章

AI思维导图

/