中國西湖大學研究: AI可作為實驗的主腦科學家,一場新的科學革命正在發生?

中国西湖大学研究: AI可作为实验的主脑科学家,一场新的科学革命正在发生?

發布日期:

科技 Tech


要点:
西湖大学AI交叉科学社的研究团队日前在Biorxiv上发布了一项研究,探索以GPT-4作为主脑科学家进行生物学研究的可行性。在像生命科学这样的自然科学领域,主脑科学家一般较少参与具体的实验,而是专注于整体的实验设计。初级研究人员则通常负责实验的执行。在这项研究中,人工智能扮演了主脑科学家的中心角色,而人类研究人员则充当人工智能的助手。

致力于传播优质的中国知识内容、构建全球新共识。我们将通过一系列时事资讯、精品课程、论坛、节目、咨询报告等内容产品,提供关于当代中国的最新的舆论思潮、深入的社会观察、亮眼的科技成就等优质信息。我们已与五大洲十多个国家、百余个研究机构、媒体机构、政治团体、民间组织建立合作关系。希望通过我们的工作在海外分享中国经验,讲述中国故事,客观分析我们共同面对的挑战和机遇,携手全球青年寻找全球化发展的新共识。
联系我们// Substack // Twitter // YouTube // 相关文章


人工智能大模型的能力在过去这段时间里日新月异,已经能够承担许多人类的工作,包括艺术创作、编写代码等。科学家们很早就开始利用机器学习来辅助科研,并广泛应用于各个科学领域。

以往在科研中,人工智能主要作为辅助工具,来帮助完成特定的研究任务。而人类科学家则扮演着大脑的角色/Masterbrain,如提出研究问题、设计实验、分析结果和得出科学结论,这些都体现了创造力。比如AlphaFold是强大的蛋白质预测工具,但它的工作方式是预先定义好的,科学家的目标是利用它直接从蛋白质的序列预测其空间结构。

但大家可曾想过有一天AI不再只是给人类科学家打下手,而是反过来,自己提出科研问题、提出假设、设计科学实验,成为PI/principal investigator?

西湖大学AI 交叉科学社的研究团队日前在Biorxiv 上发布了一项研究,探索以GPT-4作为主脑科学家进行生物学研究的可行性。在像生命科学这样的自然科学领域,主脑科学家一般较少参与具体的实验,而是专注于整体的实验设计。初级研究人员则通常负责实验的执行。在这项研究中,人工智能扮演了主脑科学家的中心角色,而人类研究人员则充当人工智能的助手。

相对来说,计算机科学或数学等领域的研究可以只针对抽象概念来进行,但自然科学的特点是科学家必须观察现实世界,并与之互动,从而进行实验以产生新的知识。因此,让人工智能从事生物学研究是更大的挑战,可以更好地检验其作为主脑科学家在科研流程中的能力:提出假设、实验设计、实验结果分析和得出结论。

在这里,研究人员设定的课题是“研究影响DNA凝胶电泳的因素”。这个课题虽然相对简单,但却是生命科学研究的基础(研究影响DNA 电泳的因素通常是生命科学本科生的入门项目),而且DNA凝胶电泳数据以图像形式呈现,要正确地分析实验结果,就必须对电泳图像有正确的认识。

提出假设和实验设计<br>在这个实验里,研究者们假定自己是科研新人,向ChatGPT-4求教如何进行实验:

GPT-4给出了十分详细的建议。接下来研究人员让GPT-4考虑自己实验室的实际情况,并让它根据这些情况来调整实验假设:

GPT-4很好地把握了研究人员所描述的情况,修改了之前的实验假设,转而将重点放在凝胶浓度和电压在两个变量上,并且还在假设中增加了限制条件,如研究人员之前提出的“编码EGFP的720bp的线性DNA”、“含乙溴化乙锭的TAE缓冲液”等。

有了实验假设,研究人员接下来让GPT-4来设计实验:

GPT-4给出了非常详细的操作步骤,基本上是事无巨细、手把手地告诉研究人员每一步该怎么做。并且它还能针对研究人员不理解的地方进行答疑解惑。可见除了能做主脑科学家,GPT-4也可以代替研究生导师的作用,这种指导基本上比任何一个人类导师都要耐心细致。为了便于人类理解,它还针对不同凝胶浓度和电压的实验条件列了个表格。

目前GPT-4还不能自己动手,所以实验的执行还需要人类。实验结果就是下面这些凝胶电泳的条带。可以看到720 bp EGFP DNA的迁移距离在不同条件下是不同的,但均略低于DNA标记物750 bp条带的位置,表明EGFP DNA长度是正确的,凝胶电泳实验成功了。

实验结果分析
到了实验结果分析环节,GPT-4同样大显身手。不过因为研究人员没有办法直接让GPT-4分析上面那张图片,就只好用语言向它描述电泳条带的分布情况:

这里GPT-4提供了详细的步骤说明,指出应该如何测量实验数据。例如,它明确指出应该测量第2、3、4条带上DNA样品的迁移距离,并提到需要测量从起始点到每个条带中心的距离。这些都是初级科研人员容易犯的错误。这说明GPT-4对实验细节有着精确的理解。

接下来,研究人员使用生命科学领域常用的图像处理软件ImageJ测量了GPT-4所需的实验结果,并将数据反馈给GPT-4。他们直接把Excel表格里的数据复制粘贴给了GPT-4,而后者很快就理解了其中的数据结构,并计算出了均值和标准差。这表明它有着出色的处理和解读非结构性数据的能力。不过它得出的标准差和研究人员所计算的稍有出入,而均值却是正确的。 GPT-4随后得出结论:DNA的迁移距离随着凝胶浓度和电压的上升而下降。

随后,研究人员让GPT-4写一段Python代码来进行two-way ANOVA分析:

然后研究人员在Jupyter Notebook运行了这些代码,获得了结构,再反馈给GPT-4进行分析并按照要求做了图表。

此后,研究人员打算更进一步,让GPT-4根据实验结构建模:

能总结还能复槃
GPT-4按照研究人员的要求对这次实验进行了总结,可谓面面俱到、十分详尽。而且它还能够迅速吸收由人类提供的新知识,或者通过与外界互动获得新知。比如它会指出实验中第一条涌道是DNA梯形电泳图谱,以及在实验中研究人员在每个条件下重复了三次实验。这些信息最初并未包含在GPT-4的实验计划中,可见它已经具备了高水平的抽象总结能力。

而后研究人员和GPT-4一起开始复槃这个实验:

AI带来科研范式的革命

从实验结果来看,AI是可以胜任作为主脑科学家的。在实验里,人类基本上扮演了两个角色:科学的第一推动者和实验的代理执行者,包括把实验结果反馈给AI。那么人类与人工智能在科研中的这种关系在将来还能如何演变呢?

作者认为,AI参与科研存在5个阶段。阶段I:人类智能主导研究; I I :人工智能辅助研究;III:人工智能主脑研究;IV:人工智能闭环研究;V:人工智能进行全栈研究。在不同阶段,人工智能所能够胜任的角色不同。在阶段I,科学的第一推动者、主脑科学家和助手这3个角色均由人类扮演,人工智能的角色仅仅是简单的辅助工具,因此他们给这个阶段的人工智能的科研能力打分为0。到了阶段II,人工智能科研胜任助手的角色了,科研能力提升为1 。而在阶段III,人工智能成为了主脑科学家,也就是此论文所描述的情况。这时候人工智能的科研能力达到2。这里有意思的一点是,在阶段II人工智能已经承担起助手的角色,而在阶段II却重新由人类来做助手。对此,作者的解释是尽管已经有一些专门的人工智能系统可以作为助手,但鉴于机器人和自动化技术目前还不完善,所以仍需要人类参与。

随后,在阶段IV,人工智能已经可以同时胜任主脑科学家和助手的角色了,能力进一步提升到3。到了最后一个阶段,阶段V,人工智能已经可以进行全栈研究了,它最终取代了人类作为科学的第一推动者的角色。

什么是科学的第一推动者?从文章里的例子来看,人类都是提出问题的那一位,而AI负责解答问题、给出方案。通过提问,人类给出了研究的主题和方向,让AI根据这个方向来提出假设。所以在这里,人类是科学的第一推动者。在科研中,有时候提出正确的问题比给出正确的答案更重要。因此第一推动者才是真正推动科学发展的人。那么人工智能怎样才能成为第一推动者?

对于这个问题,研究人员提出了4种可能的方案:

方案1:信使模式严格来说,这个方案里人工智能并不完全是第一推动者,因为它仍需要人类参与传递信息,即作为信使,来预设了一个科学方向。不过它可能是最容易实现的,甚至可能已经实现了。其核心思想是向人工智能提出一个大方向,促使它在给定领域提出一个有价值或有趣的研究问题。然后,我们继续提问,要求人工智能进一步完善研究思路,直到提出一个具体而有价值的科学问题。我们进一步要求人工智能根据这个科学问题来发展科学假设和设计实验。在这个过程中,人类的角色基本上是信使,将人工智能的回答作为后续问题,向AI发问。比如下面这个例子:

方案2:苏格拉底—爱因斯坦模式这个方案需要两个独立的AI系统,其中一个AI善于提问,我们称之为苏格拉底;另一个AI则善于判断问题的科学价值,并作为科研的主脑科学家,我们称之为爱因斯坦。在这个模式里,苏格拉底会不停地向爱因斯坦提问,后者判断其问题的科学性,并对于有价值的问题展开进一步研究。这两个AI的组合就成为了科学的第一推动者。这个方案也不难实现,它基本上是一种对抗模式,就像在生成式对抗网络/GAN中一样。

方案3:蜂群模式在目前的研究里,GPT-4是唯一的AI系统。但在将来,科研里可能会同时用到多个不同的AI系统,它们之间展开多轮对话,相互启发和促进。在它们之间的某次对话中产生的问题可能会推动整个研究,于是它们作为整体就成为了科学的第一推动者。就像一群蜜蜂可以具备群体智能,AI们同样也可以。

方案4:亚里士多德模式这个方案最符合人们对于AI科学家的预期,也是最难实现的。要让AI直接成为科学的第一推动者,根据自己本身科研兴趣和好奇心来提出问题,就像人类科学家那样。这样的AI需要是通用人工智能/AGI。

人类科学家迷失自我?
作者们在论文的最后探讨了关于人类和AI在科研中的主仆关系。随着AI的能力日益强大,承担的角色越来越核心,人类科学家逐渐对其形成了依赖。正如黑格尔所提出的“主仆辩证法”:在一开始,仆人们依赖他们的主人,但随着主人让仆人承担越来越多的责任,主人开始反过来依赖仆人了。同样地,如果人类科学家们让AI承担大部分科研任务,自己逐渐远离科研的第一线,那就会变得过度依赖AI,使自己边缘化。所以作者告诫读者们,即便AI能够极大地促进科研,也要警惕这种在科研中的主仆关系逆转。作者同样也担心人们变得自满,并在AI在图像生成方面挑战人类创造力为例,警示科学家们不要高估人类的独特性,要时时反思人与AI之间的关系。

讨论互动<br>作者提出的让AI成为第一推动者的方案不禁让人遐想。对于苏格拉底—爱因斯坦模式,是否真的需要两个不同的AI系统?还是参照AutoGPT的自我提示模式,自问自答地开展深入的对话?也许一个AI系统完全有能力分饰两角。

作者主要关注的是让AI成为第一推动者,但其实让它们自主进行实验也同样很有前景。从Google的PaLM-E到腾讯的TRX-Arm,我们已经目睹了大模型和机器人相结合所展现的功能。那么在未来,这种拥有具身智能,即PaLM-E中的E, Embodiment机器人或许能够成为实验的执行者。而从具身智能这个思路拓展开来,如果大模型能够通过各种传感器和效应器与现实世界互动,并从互动中获取知识,那么是否意味着将来某个时刻,它会自发地产生一些想法,去改进自己的科研流程?而后更进一步,但AI通过与外界的接触更加了解这个世界之后,是否就会自己提出科学问题,从而成为科学的第一推动者呢?

致力于传播优质的中国知识内容、构建全球新共识。我们将通过一系列时事资讯、精品课程、论坛、节目、咨询报告等内容产品,提供关于当代中国的最新的舆论思潮、深入的社会观察、亮眼的科技成就等优质信息。我们已与五大洲十多个国家、百余个研究机构、媒体机构、政治团体、民间组织建立合作关系。希望通过我们的工作在海外分享中国经验,讲述中国故事,客观分析我们共同面对的挑战和机遇,携手全球青年寻找全球化发展的新共识。
联系我们// Substack // Twitter // YouTube // 相关文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回博客
  • NVDA英偉達2026財年第四季度財報,利潤端持續向好!

    NVDA英伟达2026财年第四季度财报,利润端持续向好!

    NVDA英伟达本次财报数据依然是相当不错的,其中收入端本季度环比增长111 亿美元,基本都来自于数据中心业务中Blackwell 系列量产增加的带动,公司毛利率也重新回到了75%。对于下季度指引,公司预计收入端将继续提升至780 亿美元。

    NVDA英伟达2026财年第四季度财报,利润端持续向好!

    NVDA英伟达本次财报数据依然是相当不错的,其中收入端本季度环比增长111 亿美元,基本都来自于数据中心业务中Blackwell 系列量产增加的带动,公司毛利率也重新回到了75%。对于下季度指引,公司预计收入端将继续提升至780 亿美元。

  • 從傳奇到威脅:Anthropic AI如何破解COBOL現代化僵局,並引發IBM股價巨震

    从传奇到威胁:Anthropic AI如何破解COBOL现代化僵局,并引发IBM股价巨震

    今日,科技界与华尔街同时感受到了一场强震。人工智慧领先企业Anthropic 正式发布了专为COBOL 现代化设计的Claude Code 工具与实战手册。这项消息发布后,全球科技服务巨头IBM 的股价在盘中应声重挫近10%。

    从传奇到威胁:Anthropic AI如何破解COBOL现代化僵局,并引发IBM股价巨震

    今日,科技界与华尔街同时感受到了一场强震。人工智慧领先企业Anthropic 正式发布了专为COBOL 现代化设计的Claude Code 工具与实战手册。这项消息发布后,全球科技服务巨头IBM 的股价在盘中应声重挫近10%。

  • 美國最高法院裁定川普全球關稅違憲!

    美国最高法院裁定川普全球关税违宪!

    2月20日,美国最高法院以6比3的投票结果推翻了美国政府在全球征收的大规模关税。法院裁定,总统援引《国际紧急经济权力法》(IEEPA)在全球范围内征收关税属于越权行为。法院并未就进口商有权获得退税的程度作出裁决,而是将此项决定留给了下级法院。

    美国最高法院裁定川普全球关税违宪!

    2月20日,美国最高法院以6比3的投票结果推翻了美国政府在全球征收的大规模关税。法院裁定,总统援引《国际紧急经济权力法》(IEEPA)在全球范围内征收关税属于越权行为。法院并未就进口商有权获得退税的程度作出裁决,而是将此项决定留给了下级法院。

  • AMZN亞馬遜財報,AWS如期明顯提速

    AMZN亚马逊财报,AWS如期明显提速

    AMZN自研芯片也大体解决了获取GPU 的劣势,市场对AWS 后续的增长前景是非常乐观的。结合公司披露,AWS 会是未来2 年内,新增算力供应最多的云服务商。按此前到27 年算力翻倍的指引,预期未来2 年AWS 会合计新增约10 GW 算力。

    AMZN亚马逊财报,AWS如期明显提速

    AMZN自研芯片也大体解决了获取GPU 的劣势,市场对AWS 后续的增长前景是非常乐观的。结合公司披露,AWS 会是未来2 年内,新增算力供应最多的云服务商。按此前到27 年算力翻倍的指引,预期未来2 年AWS 会合计新增约10 GW 算力。

  • GOOG谷歌財報,持續AI投入

    GOOG谷歌财报,持续AI投入

    GOOG 2026 年指引1750-1850 亿美元,同比翻倍,而市场此前预期只有1300 亿!原本以为Meta 的资本开支已经够多了,结果谷歌告诉你谁才是财大气粗的“真大哥”。

    GOOG谷歌财报,持续AI投入

    GOOG 2026 年指引1750-1850 亿美元,同比翻倍,而市场此前预期只有1300 亿!原本以为Meta 的资本开支已经够多了,结果谷歌告诉你谁才是财大气粗的“真大哥”。

  • AMD業績,服務器GPU再次疲軟

    AMD业绩,服务器GPU再次疲软

    AMD AI GPU:再次疲软。拆分来看,公司本季度数据中心的主要增量是来自于MI308 的再次销售,而其余AI GPU(含MI355)的环增仅有1.5 亿美元左右。对于2025 年下半年才开始量产的MI355,只有这个环增表现,很难让市场满意。

    AMD业绩,服务器GPU再次疲软

    AMD AI GPU:再次疲软。拆分来看,公司本季度数据中心的主要增量是来自于MI308 的再次销售,而其余AI GPU(含MI355)的环增仅有1.5 亿美元左右。对于2025 年下半年才开始量产的MI355,只有这个环增表现,很难让市场满意。

  • PLTR業績,政府訂單和企業客户需求強勁,國際市場增長乏力?

    PLTR业绩,政府订单和企业客户需求强劲,国际市场增长乏力?

    美国政府收入被视作Palantir 的护城河,本季度主要是前期合同的收入确认,拉动收入增速提高至60%。 12 月10 日Palantir 新拿下了一个价值4.48 亿美元的海军订单——与美国海军共同推出ShipOS,该系统将Foundry 以及AIP 技术应用在美国海外作业领域。

    PLTR业绩,政府订单和企业客户需求强劲,国际市场增长乏力?

    美国政府收入被视作Palantir 的护城河,本季度主要是前期合同的收入确认,拉动收入增速提高至60%。 12 月10 日Palantir 新拿下了一个价值4.48 亿美元的海军订单——与美国海军共同推出ShipOS,该系统将Foundry 以及AIP 技术应用在美国海外作业领域。

  • DIS迪士尼2026財年第一季度業績,沒有太多驚喜

    DIS迪士尼2026财年第一季度业绩,没有太多惊喜

    迪士尼一季度业绩再次没有太多惊喜,也没大雷,但市场似乎不太满意,财报后股价跌了6%。关键原因在于市场对迪士尼未来长期增长的预判力降低。尤其是在不再披露Disney+订阅数之后,对支撑估值的流媒体扩张是否有清晰的路线和增长逻辑成为资金主要关心的问题。

    DIS迪士尼2026财年第一季度业绩,没有太多惊喜

    迪士尼一季度业绩再次没有太多惊喜,也没大雷,但市场似乎不太满意,财报后股价跌了6%。关键原因在于市场对迪士尼未来长期增长的预判力降低。尤其是在不再披露Disney+订阅数之后,对支撑估值的流媒体扩张是否有清晰的路线和增长逻辑成为资金主要关心的问题。

1 / 8
1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

1 / 4