要點:
西湖大學AI交叉科學社的研究團隊日前在Biorxiv上發布了一項研究,探索以GPT-4作為主腦科學家進行生物學研究的可行性。在像生命科學這樣的自然科學領域,主腦科學家一般較少參與具體的實驗,而是專注於整體的實驗設計。初級研究人員則通常負責實驗的執行。在這項研究中,人工智能扮演了主腦科學家的中心角色,而人類研究人員則充當人工智能的助手。
致力於傳播優質的中國知識內容、搆建全球新共識。我們將通過一系列時事資訊、精品課程、論壇、節目、咨詢報告等內容產品,提供關於當代中國的最新的輿論思潮、深入的社會觀察、亮眼的科技成就等優質信息。我們已與五大洲十多個國家、百余個研究機搆、媒體機搆、政治團體、民間組織建立合作關系。希望通過我們的工作在海外分享中國經驗,講述中國故事,客觀分析我們共同面對的挑戰和機遇,攜手全球青年尋找全球化發展的新共識。
聯系我們 // Substack // Twitter // YouTube//相關文章
人工智能大模型的能力在過去這段時間里日新月異,已經能夠承擔許多人類的工作,包括藝朮創作、編寫代碼等。科學家們很早就開始利用機器學習來輔助科研,并廣泛應用於各個科學領域。
以往在科研中,人工智能主要作為輔助工具,來幫助完成特定的研究任務。而人類科學家則扮演着大腦的角色/Masterbrain,如提出研究問題、設計實驗、分析結果和得出科學結論,這些都體現了創造力。比如AlphaFold是強大的蛋白質預測工具,但它的工作方式是預先定義好的,科學家的目標是利用它直接從蛋白質的序列預測其空間結搆。
但大家可曾想過有一天AI不再只是給人類科學家打下手,而是反過來,自己提出科研問題、提出假設、設計科學實驗,成為 PI/principal investigator?
西湖大學 AI 交叉科學社的研究團隊日前在 Biorxiv 上發布了一項研究,探索以GPT-4作為主腦科學家進行生物學研究的可行性。在像生命科學這樣的自然科學領域,主腦科學家一般較少參與具體的實驗,而是專注於整體的實驗設計。初級研究人員則通常負責實驗的執行。在這項研究中,人工智能扮演了主腦科學家的中心角色,而人類研究人員則充當人工智能的助手。
相對來說,計算機科學或數學等領域的研究可以只針對抽象概念來進行,但自然科學的特點是科學家必須觀察現實世界,并與之互動,從而進行實驗以產生新的知識。因此,讓人工智能從事生物學研究是更大的挑戰,可以更好地檢驗其作為主腦科學家在科研流程中的能力:提出假設、實驗設計、實驗結果分析和得出結論。
在這里,研究人員設定的課題是“研究影響DNA凝膠電泳的因素”。這個課題雖然相對簡單,但卻是生命科學研究的基礎(研究影響 DNA 電泳的因素通常是生命科學本科生的入門項目),而且DNA凝膠電泳數據以圖像形式呈現,要正確地分析實驗結果,就必須對電泳圖像有正確的認識。
提出假設和實驗設計
在這個實驗里,研究者們假定自己是科研新人,向ChatGPT-4求教如何進行實驗:
GPT-4給出了十分詳細的建議。接下來研究人員讓GPT-4考慮自己實驗室的實際情況,并讓它根據這些情況來調整實驗假設:
GPT-4很好地把握了研究人員所描述的情況,修改了之前的實驗假設,轉而將重點放在凝膠濃度和電壓在兩個變量上,并且還在假設中增加了限制條件,如研究人員之前提出的“編碼EGFP的720bp的線性DNA”、“含乙溴化乙錠的TAE緩沖液”等。
有了實驗假設,研究人員接下來讓GPT-4來設計實驗:
GPT-4給出了非常詳細的操作步驟,基本上是事無巨細、手把手地告訴研究人員每一步該怎么做。并且它還能針對研究人員不理解的地方進行答疑解惑。可見除了能做主腦科學家,GPT-4也可以代替研究生導師的作用,這種指導基本上比任何一個人類導師都要耐心細致。為了便於人類理解,它還針對不同凝膠濃度和電壓的實驗條件列了個表格。
目前GPT-4還不能自己動手,所以實驗的執行還需要人類。實驗結果就是下面這些凝膠電泳的條帶。可以看到720 bp EGFP DNA的遷移距離在不同條件下是不同的,但均略低於DNA標記物750 bp條帶的位置,表明EGFP DNA長度是正確的,凝膠電泳實驗成功了。
實驗結果分析
到了實驗結果分析環節,GPT-4同樣大顯身手。不過因為研究人員沒有辦法直接讓GPT-4分析上面那張圖片,就只好用語言向它描述電泳條帶的分布情況:
這里GPT-4提供了詳細的步驟說明,指出應該如何測量實驗數據。例如,它明確指出應該測量第2、3、4條帶上DNA樣品的遷移距離,并提到需要測量從起始點到每個條帶中心的距離。這些都是初級科研人員容易犯的錯誤。這說明GPT-4對實驗細節有着精確的理解。
接下來,研究人員使用生命科學領域常用的圖像處理軟件ImageJ測量了GPT-4所需的實驗結果,并將數據反饋給GPT-4。他們直接把Excel表格里的數據復制粘貼給了GPT-4,而后者很快就理解了其中的數據結搆,并計算出了均值和標准差。這表明它有着出色的處理和解讀非結搆性數據的能力。不過它得出的標准差和研究人員所計算的稍有出入,而均值卻是正確的。GPT-4隨后得出結論:DNA的遷移距離隨着凝膠濃度和電壓的上升而下降。
隨后,研究人員讓GPT-4寫一段Python代碼來進行two-way ANOVA分析:
然后研究人員在Jupyter Notebook運行了這些代碼,獲得了結搆,再反饋給GPT-4進行分析并按照要求做了圖表。
此后,研究人員打算更進一步,讓GPT-4根據實驗結搆建模:
能總結還能復槃
GPT-4按照研究人員的要求對這次實驗進行了總結,可謂面面俱到、十分詳盡。而且它還能夠迅速吸收由人類提供的新知識,或者通過與外界互動獲得新知。比如它會指出實驗中第一條涌道是DNA梯形電泳圖譜,以及在實驗中研究人員在每個條件下重復了三次實驗。這些信息最初并未包含在GPT-4的實驗計划中,可見它已經具備了高水平的抽象總結能力。
而后研究人員和GPT-4一起開始復槃這個實驗:
AI帶來科研范式的革命
從實驗結果來看,AI是可以勝任作為主腦科學家的。在實驗里,人類基本上扮演了兩個角色:科學的第一推動者和實驗的代理執行者,包括把實驗結果反饋給 AI。那么人類與人工智能在科研中的這種關系在將來還能如何演變呢?
作者認為,AI參與科研存在5個階段。階段I:人類智能主導研究;II:人工智能輔助研究;III:人工智能主腦研究;IV:人工智能閉環研究;V:人工智能進行全棧研究。在不同階段,人工智能所能夠勝任的角色不同。在階段I,科學的第一推動者、主腦科學家和助手這3個角色均由人類扮演,人工智能的角色僅僅是簡單的輔助工具,因此他們給這個階段的人工智能的科研能力打分為0。到了階段II,人工智能科研勝任助手的角色了,科研能力提升為1 。而在階段III,人工智能成為了主腦科學家,也就是此論文所描述的情況。這時候人工智能的科研能力達到2。這里有意思的一點是,在階段II人工智能已經承擔起助手的角色,而在階段II卻重新由人類來做助手。對此,作者的解釋是盡管已經有一些專門的人工智能系統可以作為助手,但鑒於機器人和自動化技朮目前還不完善,所以仍需要人類參與。
隨后,在階段IV,人工智能已經可以同時勝任主腦科學家和助手的角色了,能力進一步提升到3。到了最后一個階段,階段V,人工智能已經可以進行全棧研究了,它最終取代了人類作為科學的第一推動者的角色。
什么是科學的第一推動者?從文章里的例子來看,人類都是提出問題的那一位,而AI負責解答問題、給出方案。通過提問,人類給出了研究的主題和方向,讓AI根據這個方向來提出假設。所以在這里,人類是科學的第一推動者。在科研中,有時候提出正確的問題比給出正確的答案更重要。因此第一推動者才是真正推動科學發展的人。那么人工智能怎樣才能成為第一推動者?
對於這個問題,研究人員提出了4種可能的方案:
方案1:信使模式
嚴格來說,這個方案里人工智能并不完全是第一推動者,因為它仍需要人類參與傳遞信息,即作為信使,來預設了一個科學方向。不過它可能是最容易實現的,甚至可能已經實現了。其核心思想是向人工智能提出一個大方向,促使它在給定領域提出一個有價值或有趣的研究問題。然后,我們繼續提問,要求人工智能進一步完善研究思路,直到提出一個具體而有價值的科學問題。我們進一步要求人工智能根據這個科學問題來發展科學假設和設計實驗。在這個過程中,人類的角色基本上是信使,將人工智能的回答作為后續問題,向AI發問。比如下面這個例子:
方案2:蘇格拉底—愛因斯坦模式
這個方案需要兩個獨立的AI系統,其中一個AI善於提問,我們稱之為蘇格拉底;另一個AI則善於判斷問題的科學價值,并作為科研的主腦科學家,我們稱之為愛因斯坦。在這個模式里,蘇格拉底會不停地向愛因斯坦提問,后者判斷其問題的科學性,并對於有價值的問題展開進一步研究。這兩個AI的組合就成為了科學的第一推動者。這個方案也不難實現,它基本上是一種對抗模式,就像在生成式對抗網絡/GAN中一樣。
方案3:蜂群模式
在目前的研究里,GPT-4是唯一的AI系統。但在將來,科研里可能會同時用到多個不同的AI系統,它們之間展開多輪對話,相互啟發和促進。在它們之間的某次對話中產生的問題可能會推動整個研究,於是它們作為整體就成為了科學的第一推動者。就像一群蜜蜂可以具備群體智能,AI們同樣也可以。
方案4:亞里士多德模式
這個方案最符合人們對於AI科學家的預期,也是最難實現的。要讓AI直接成為科學的第一推動者,根據自己本身科研興趣和好奇心來提出問題,就像人類科學家那樣。這樣的AI需要是通用人工智能/AGI。
人類科學家迷失自我?
作者們在論文的最后探討了關於人類和AI在科研中的主仆關系。隨着AI的能力日益強大,承擔的角色越來越核心,人類科學家逐漸對其形成了依賴。正如黑格爾所提出的“主仆辯證法”:在一開始,仆人們依賴他們的主人,但隨着主人讓仆人承擔越來越多的責任,主人開始反過來依賴仆人了。同樣地,如果人類科學家們讓AI承擔大部分科研任務,自己逐漸遠離科研的第一線,那就會變得過度依賴AI,使自己邊緣化。所以作者告誡讀者們,即便AI能夠極大地促進科研,也要警惕這種在科研中的主仆關系逆轉。作者同樣也擔心人們變得自滿,并在AI在圖像生成方面挑戰人類創造力為例,警示科學家們不要高估人類的獨特性,要時時反思人與AI之間的關系。
討論互動
作者提出的讓AI成為第一推動者的方案不禁讓人遐想。對於蘇格拉底—愛因斯坦模式,是否真的需要兩個不同的AI系統?還是參照AutoGPT的自我提示模式,自問自答地開展深入的對話?也許一個AI系統完全有能力分飾兩角。
作者主要關注的是讓AI成為第一推動者,但其實讓它們自主進行實驗也同樣很有前景。從Google的PaLM-E到騰訊的TRX-Arm,我們已經目睹了大模型和機器人相結合所展現的功能。那么在未來,這種擁有具身智能 ,即PaLM-E中的 E, Embodiment機器人或許能夠成為實驗的執行者。而從具身智能這個思路拓展開來,如果大模型能夠通過各種傳感器和效應器與現實世界互動,并從互動中獲取知識,那么是否意味着將來某個時刻,它會自發地產生一些想法,去改進自己的科研流程?而后更進一步,但AI通過與外界的接觸更加了解這個世界之后,是否就會自己提出科學問題,從而成為科學的第一推動者呢?