中國科學院高彩霞團隊最新突破:借助人工智能開發出新型堿基編輯器

中國科學院高彩霞團隊最新突破:借助人工智能開發出新型堿基編輯器

發布日期:

科技 Tech


要點:
近年來隨着測序技朮的進步,導致數據量暴增,隨之而來的數據噪聲和批次效應顯現。此外還有多模態數據的整合等挑戰。針對單細胞轉錄組的數據,AI大模型就有了用武之地。它通過自監督學習和微調兩個階段,學習基因之間的編碼關系,降低數據維度和噪聲,增強模型魯棒性。

致力於傳播優質的中國知識內容、搆建全球新共識。我們將通過一系列時事資訊、精品課程、論壇、節目、咨詢報告等內容產品,提供關於當代中國的最新的輿論思潮、深入的社會觀察、亮眼的科技成就等優質信息。我們已與五大洲十多個國家、百余個研究機搆、媒體機搆、政治團體、民間組織建立合作關系。希望通過我們的工作在海外分享中國經驗,講述中國故事,客觀分析我們共同面對的挑戰和機遇,攜手全球青年尋找全球化發展的新共識。
聯系我們 // Substack // Twitter // YouTube//相關文章

AlphaFold2是一種由DeepMind開發的用於預測蛋白質結搆的機器學習算法,它可以從蛋白質數據銀行/PDB的訓練數據集中,基於其氨基酸序列推斷出蛋白質的三維搆象。在CASP14比賽中,AlphaFold2表現非常出色,超過了所有其他方法。迄今為止,AlphaFold2已經被用於為21種模式生物做蛋白質結搆預測,還有預測SwissProt和UniRef90數據庫中的所有蛋白質的搆象,并生成了超過35萬個蛋白質結搆模型。

自從2021年推出以來,AlphaFold2已經對生物研究產生了巨大影響。它既能夠研究不同蛋白質組中的蛋白質結搆-功能關系、相互作用、配體結合位點、錯義變異和結搆元素,還可以通過提供初始模型或改善低分辨率數據來作為實驗方法(如冷凍電鏡和X射線晶體學)的補充。

AlphaFold2的應用潛力顯然不止於此。中國科學院遺傳與發育生物學研究所高彩霞團隊首次運用AlphaFold2的蛋白結搆預測功能來輔助蛋白聚類,并開發出一系列堿基編輯工具,拓展了AlphaFold 2的應用范圍。

日前,該研究以“Discovery of deaminase functions by structure-based protein clustering” 為題,在線發表於“細胞”期刊上。

開創性的嘗試
蛋白質功能的解析以及在生物工程中的應用,在極大地推動着生命科學的發展。傳統的酶挖掘,僅基於氨基酸序列信息來對蛋白質功能和進化軌跡進行分類和預測。然而,一維的序列信息無法完全闡明蛋白質的功能特性。由於蛋白質功能最終由三維搆象,即蛋白質折疊決定,因此在蛋白質挖掘和聚類分類過程中,了解蛋白質結搆至關重要。

高彩霞團隊使用AlphaFold2來預測整個蛋白質家族的結搆,并根據預測出來的結搆的相似性對蛋白質進行聚類。在該項研究中,團隊對脫氨酶蛋白進行分析,并發現了許多之前未知的性質。

脫氨酶樣蛋白可以催化核苷酸和堿基的去氨基化。它們在突變、核酸代謝和其他生物過程中起着重要作用,還被用來作為可編程DNA和RNA的堿基編輯器。但是有個問題一直困擾着研究者們,那就是很難基於氨基酸序列來確定脫氨酶各種蛋白質家族之間的關系。所以AlphaFold2對三維結搆的預測能力使其成為解決這個問題的利器。

預測結果讓人意想不到的是,在雙鏈DNA脫氨酶毒素 A 樣脫氨酶/DddA-like支系中,大多數蛋白質并不是雙鏈DNA脫氨酶。研究團隊設計了尺寸最小的單鏈特異性胞嘧啶脫氨酶,這樣能夠將高效的胞嘧啶堿基編輯器/CBE打包到單個腺相關病毒/AAV中。隨后,對該支系的一種脫氨酶進行的分析發現它能夠在大豆植物中進行強有力的編輯,而原來CBE無法在大豆植物中使用。這些發現極大地擴展了堿基編輯器在醫療和農業中的應用前景。

根據AlphaFold2預測的結搆進行聚類
高彩霞團隊利用AlphaFold2根據氨基酸序列預測了重注區域的蛋白質結搆,并按照結搆相似性進行了聚類分析。這樣就能夠在植物和人類細胞中檢測這些蛋白質的ssDNA和dsDNA胞嘧啶去氨基化活性。團隊還利用結搆相似性矩陣比較了242種蛋白質(238 種胞嘧啶脫氨酶和 4 種 JAB 蛋白)的預測結搆,這些蛋白質分屬於16個脫氨酶家族和 1 個外類群。矩陣中不同顏色的區域反映了不同家族蛋白質之間的相似度差異。隨后,根據蛋白質結搆的特徵,它們被划分為不同的脫氨酶家族。

評估脫氨酶活性
隨后的研究發現,SCP1.201脫氨酶類群的一些蛋白質具有脫氨酶活性,可以讓單鏈DNA底物脫氨。這些蛋白質被稱為雙鏈 DNA 脫氨酶毒素 A 樣脫氨酶/DddA-like。然而,研究人員發現這些蛋白質也可以用於雙鏈 DNA 的基因編輯。對SCP1.201類群的489個脫氨酶進行重新分析表明,這些蛋白質可以被分為不同的亞類,具有獨特的核心結搆特徵。其中,SCP1.201類群中的Sdd蛋白質具有脫氨單鏈DNA的活性,而不是雙鏈DNA。因此,這些蛋白質應該被重新定義為Sdd,而不是DddA-like。

這些結果說明,基於蛋白質結搆的分類方法比基於一維氨基酸序列的分類方法更有效,可以為基因編輯提供新的機會,同時可以更准確地評估脫氨酶的功能關系。

新發現的Ddd蛋白
研究人員將13個屬於Ddd亞族的脫氨酶克隆到雙鏈DNA胞嘧啶堿基編輯器/DdCBE中,在HEK293T細胞內評估了在內源在JAK2和SIRT6位點的dsDNA堿基編輯。有趣的是,研究發現Ddd1、Ddd7、Ddd8和Ddd9的編輯效率與DddA相當或更高,而Ddd1和Ddd9在50-GC堿基序列上的編輯活性明顯高於DddA。此外,研究還發現新發現的dsDNA靶向脫氨酶可以編輯之前DddA無法接近的胞嘧啶堿基序列。這個發現擴展了DdCBE的實用性和靶向范圍。通過評估新發現的Ddd蛋白質和Sdd蛋白質的編輯活性,研究人員發現它們可以更准確地編輯胞嘧啶堿基序列,為基因編輯工具的開發提供了新途徑。

Sdd蛋白質在堿基編輯中的獨特性
接下來的研究發現,在人類和稻米細胞中,不同的Sdd-CBEs在所有測試的基因組靶點上顯示出不同的編輯模式。通過靶向報告錨定位置測序,研究人員發現與傳統的CBEs相比,Sdd蛋白質具有更高的編輯效率、不同的脫氨酶基序偏好和編輯窗口。研究還評估了Sdd蛋白質的Cas9獨立的非靶向效應,并發現Sdd6表現出最高的靶向/非靶向編輯比率,使其成為高保真堿基編輯的備選方案之一。

研究團隊使用AI輔助來制作Sdd蛋白質,并縮短其長度,於是得到了小型化的脫氨酶。它們小巧并具有相同、甚至更高的編輯效率。這些小型化的脫氨酶可以允許搆建單個AAV封裝的SaCas9-CBEs。這突顯了Sdd蛋白質在堿基編輯中的潛力以及AI在蛋白質工程中的作用。

SddCBE在堿基編輯中的應用
在水稻植物基因組編輯中,mini-Sdd7比農業中最常用的hA3A-CBE具有更高的效率和較低的毒性。在大豆中,研究團隊使用瞬時堿基編輯/transient base editing來評估在根細胞中的編輯百分比,并發現mini-Sdd7在所有測試位點上的胞嘧啶堿基編輯水平顯著增加,編輯效率高達67.4%。此外,團隊還成功地使用Sdd7獲得了經過堿基編輯的大豆植物,這讓在大豆植物中實現高效的堿基編輯成為可能,可以服務於將來的農業育種工作。

AI為生命科學帶來了新機遇
本研究釆用結搆預測為基礎的方法,對胞嘧啶脫氨酶類超家族進行了蛋白質分類和挖掘的概念驗證探索。研究表明,AlphaFold2預測的結搆可以很好地將脫氨酶分類為不同類群,這些類群具有不同的蛋白質折疊和催化功能。在此基礎之上可以設計的精准基因組編輯工具。這種由AI輔助的策略可以應用於任何蛋白質數據集的高通量分類和功能分析。

基於人工智能的蛋白質結搆預測和分類將為具有可變序列和低序列保守性的蛋白質分類提供新的視角。而這只是AI為科研所帶來的許多新機遇之一。在生命科學領域,除了這里提到的用於研究蛋白質結搆的AlphaFold,AI正大顯身手。

在生物制藥方面,機器學習、深度學習等AI技朮正在替代以往的大量實驗,對藥物結搆、功效等進行快速分析,以達到縮短試驗周期、節省成本、促進新藥發現、提升試驗成功率等目的。

而在組學研究上,近年來隨着測序技朮的進步,導致數據量暴增,隨之而來的數據噪聲和批次效應顯現。此外還有多模態數據的整合等挑戰。針對單細胞轉錄組的數據,AI大模型就有了用武之地。它通過自監督學習和微調兩個階段,學習基因之間的編碼關系,降低數據維度和噪聲,增強模型魯棒性。類似的,空間組學技朮也面臨數據量大、數據缺失以及需要定位細胞位置等挑戰。在這里,大模型可以利用遷移學習和空間信息Embedding,用於空間轉錄組數據的細胞類型注釋。研究人員利用人工智能技朮,特別是深度學習技朮,分析和挖掘單細胞測序數據和空間組學數據。大模型在多個數據集上顯示出優異的性能,為生命大數據的理解和應用提供新的思路和手段。這些或許將根本性地改變生物制藥,甚至生命科學研究的面貌。

致力於傳播優質的中國知識內容、搆建全球新共識。我們將通過一系列時事資訊、精品課程、論壇、節目、咨詢報告等內容產品,提供關於當代中國的最新的輿論思潮、深入的社會觀察、亮眼的科技成就等優質信息。我們已與五大洲十多個國家、百余個研究機搆、媒體機搆、政治團體、民間組織建立合作關系。希望通過我們的工作在海外分享中國經驗,講述中國故事,客觀分析我們共同面對的挑戰和機遇,攜手全球青年尋找全球化發展的新共識。
聯系我們 // Substack // Twitter // YouTube//相關文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回網誌
  • PDD拼多多2026年第一季財報,不及市場預期

    PDD拼多多2026年第一季財報,不及市場預期

    因國內主站營收增長不及預期,營銷支出也並未明顯下滑,因此實際利潤表現並不及預期。分板塊來看背後原因,我們認為一方面是 Temu 本季減虧的幅度大概率並沒有預期的那麼多,另外國內主站的經營利潤增長應當也相當有限。

    PDD拼多多2026年第一季財報,不及市場預期

    因國內主站營收增長不及預期,營銷支出也並未明顯下滑,因此實際利潤表現並不及預期。分板塊來看背後原因,我們認為一方面是 Temu 本季減虧的幅度大概率並沒有預期的那麼多,另外國內主站的經營利潤增長應當也相當有限。

  • 小米2026年第一季度財報,主要受手機和汽車毛利率同比回落影響

    小米2026年第一季度財報,主要受手機和汽車毛利率同比回落影響

    小米本季度汽車業務毛利率下滑至 20.1%,接近市場預期(20.5%),主要是受均價下滑的影響,其中包含了小米對購置税進行補貼的影響,並在本季度銷售了一部分的低價現車。由於毛利率再次回落,海豚君測算本季度小米汽車業務核心經營利潤再度陷入虧損 31 億元。

    小米2026年第一季度財報,主要受手機和汽車毛利率同比回落影響

    小米本季度汽車業務毛利率下滑至 20.1%,接近市場預期(20.5%),主要是受均價下滑的影響,其中包含了小米對購置税進行補貼的影響,並在本季度銷售了一部分的低價現車。由於毛利率再次回落,海豚君測算本季度小米汽車業務核心經營利潤再度陷入虧損 31 億元。

  • NVDA英偉達2027財年第一季度財報,收入752億美元,環比增量為129億美元

    NVDA英偉達2027財年第一季度財報,收入752億美元,環比增量為129億美元

    NVDA 核心經營指標:總收入 816 億美元,好於上調後的買方預期(780-800 億美元),其中季度環比增長 135 億美元,幾乎都來自於數據中心業務中 Blackwell 量產增加的帶動。

    NVDA英偉達2027財年第一季度財報,收入752億美元,環比增量為129億美元

    NVDA 核心經營指標:總收入 816 億美元,好於上調後的買方預期(780-800 億美元),其中季度環比增長 135 億美元,幾乎都來自於數據中心業務中 Blackwell 量產增加的帶動。

  • BYD比亞迪2025年第四季度業績仍然不及預期,賣車單價仍處於下行軌道

    BYD比亞迪2025年第四季度業績仍然不及預期,賣車單價仍處於下行軌道

    比亞迪的業績仍然不及預期。收入雖超預期,但主要由於非核心的比亞迪電子業務高增帶來,而在核心的賣車業務上,賣車單價仍處於下行軌道,賣車成本降幅不夠,最後賣車毛利率雖有回暖,但仍低於市場預期。

    BYD比亞迪2025年第四季度業績仍然不及預期,賣車單價仍處於下行軌道

    比亞迪的業績仍然不及預期。收入雖超預期,但主要由於非核心的比亞迪電子業務高增帶來,而在核心的賣車業務上,賣車單價仍處於下行軌道,賣車成本降幅不夠,最後賣車毛利率雖有回暖,但仍低於市場預期。

  • GOOG谷歌TurboQuant新聞導緻MU美光科技等內存股股價暴跌,但這合理嗎?

    GOOG谷歌TurboQuant新聞導緻MU美光科技等內存股股價暴跌,但這合理嗎?

    消息一出,華爾街一度陷入恐慌:如果 AI 突然間不再需要那麼多 RAM 就能運作,這是否意味著記憶體產業的「超級週期」即將結束?答案是否定的。事實上,從歷史規律與經濟學角度來看,情況正好相反。要理解這一點,我們只需要觀察你電腦上的網頁瀏覽器。

    GOOG谷歌TurboQuant新聞導緻MU美光科技等內存股股價暴跌,但這合理嗎?

    消息一出,華爾街一度陷入恐慌:如果 AI 突然間不再需要那麼多 RAM 就能運作,這是否意味著記憶體產業的「超級週期」即將結束?答案是否定的。事實上,從歷史規律與經濟學角度來看,情況正好相反。要理解這一點,我們只需要觀察你電腦上的網頁瀏覽器。

  • BABA財報AI投入比較激進

    BABA財報AI投入比較激進

    BABA發布第四季財報後股價下跌,財報顯示其營收和利潤均大幅低於預期。這家電商巨頭的季度淨利暴跌67%,而總營收僅成長1.7%約413億美元。這些表現引發了人們對阿里巴巴在AI人工智慧領域巨額投資(總額超過530億美元)有效性的擔憂。

    BABA財報AI投入比較激進

    BABA發布第四季財報後股價下跌,財報顯示其營收和利潤均大幅低於預期。這家電商巨頭的季度淨利暴跌67%,而總營收僅成長1.7%約413億美元。這些表現引發了人們對阿里巴巴在AI人工智慧領域巨額投資(總額超過530億美元)有效性的擔憂。

  • MU美光業績,季度毛利率達到 74.4%!

    MU美光業績,季度毛利率達到 74.4%!

    MU 整體業績:美光本季度營收 238.6 億美元,環比增長 75%,好於上調後的買方預期(199 億美元),本季度收入增長主要來自於 DRAM 和 NAND 業務的雙重帶動,兩大業務環增都在 70% 以上。

    MU美光業績,季度毛利率達到 74.4%!

    MU 整體業績:美光本季度營收 238.6 億美元,環比增長 75%,好於上調後的買方預期(199 億美元),本季度收入增長主要來自於 DRAM 和 NAND 業務的雙重帶動,兩大業務環增都在 70% 以上。

  • Tencent騰訊業績整體看無驚無喜?

    Tencent騰訊業績整體看無驚無喜?

    騰訊一口氣連發多個 “龍蝦” 產品,能夠看出公司在元寶春節大戰中失利後的焦慮,雖然倉促推出產品還不夠完善。不過這個緊迫感的轉變很關鍵也很必要。就目前來看,微信入口似乎在 AI 原生應用盛行的當下仍然有無法撼動的地位。

    Tencent騰訊業績整體看無驚無喜?

    騰訊一口氣連發多個 “龍蝦” 產品,能夠看出公司在元寶春節大戰中失利後的焦慮,雖然倉促推出產品還不夠完善。不過這個緊迫感的轉變很關鍵也很必要。就目前來看,微信入口似乎在 AI 原生應用盛行的當下仍然有無法撼動的地位。

1 / 8
  • Sharpa機器人削蘋果

    Sharpa機器人削蘋果

    對人類來說,削蘋果是件輕而易舉的晨間小事,但對機器人而言,這是雙手協調能力的「終極挑戰」。Sharpa機器人正在為能夠像人類一樣靈巧地完成複雜家務和工業裝配的機器人鋪平道路。

    Sharpa機器人削蘋果

    對人類來說,削蘋果是件輕而易舉的晨間小事,但對機器人而言,這是雙手協調能力的「終極挑戰」。Sharpa機器人正在為能夠像人類一樣靈巧地完成複雜家務和工業裝配的機器人鋪平道路。

  • 腫瘤療法突破,中國團隊給癌細胞打上“豬”標簽,癌細胞“偽裝朮”被破解

    腫瘤療法突破,中國團隊給癌細胞打上“豬”標簽,癌細胞“偽裝朮”被破解

    近期,中國科學家在“Cell”雜志上發表的一項突破性研究,為這一頑疾提供了全新思路。他們利用基因編輯技朮,將癌細胞改造成免疫系統眼中的“異類”,類似於人體對豬器官產生的超急性排斥反應,從而引發了一場針對癌細胞的精准“免疫殲滅戰”。

    腫瘤療法突破,中國團隊給癌細胞打上“豬”標簽,癌細胞“偽裝朮”被破解

    近期,中國科學家在“Cell”雜志上發表的一項突破性研究,為這一頑疾提供了全新思路。他們利用基因編輯技朮,將癌細胞改造成免疫系統眼中的“異類”,類似於人體對豬器官產生的超急性排斥反應,從而引發了一場針對癌細胞的精准“免疫殲滅戰”。

  • 新型大腦設備首次讀出內心聲音,腦機接口技朮打破失語者困境

    新型大腦設備首次讀出內心聲音,腦機接口技朮打破失語者困境

    新系統的核心原理與常見的“嘗試說話”型腦機介面相似,都是在大腦運動皮質植入感測器,這一區域負責向聲道肌肉下達運動指令。感測器捕捉到的神經活動會送入機器學習模型,模型依據個人化數據判斷信號對應的聲音,進而預測使用者想說的單字。

    新型大腦設備首次讀出內心聲音,腦機接口技朮打破失語者困境

    新系統的核心原理與常見的“嘗試說話”型腦機介面相似,都是在大腦運動皮質植入感測器,這一區域負責向聲道肌肉下達運動指令。感測器捕捉到的神經活動會送入機器學習模型,模型依據個人化數據判斷信號對應的聲音,進而預測使用者想說的單字。

  • “垃圾DNA”新發現:遠古病毒DNA在人類發育中發揮關鍵作用

    “垃圾DNA”新發現:遠古病毒DNA在人類發育中發揮關鍵作用

    自這類非編碼DNA片段首次被發現並被稱作“垃圾”以來,生物學家們一直在探討它們是否真的無用。如今的主流觀點認為,這些片段雖不直接參與蛋白質合成,卻在整體基因組中佔據了極大比例,顯示它們可能具有重要功能。

    “垃圾DNA”新發現:遠古病毒DNA在人類發育中發揮關鍵作用

    自這類非編碼DNA片段首次被發現並被稱作“垃圾”以來,生物學家們一直在探討它們是否真的無用。如今的主流觀點認為,這些片段雖不直接參與蛋白質合成,卻在整體基因組中佔據了極大比例,顯示它們可能具有重要功能。

1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    從中國經濟看背後困境及發展新構想?

    中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施,中國經濟可能有一個全新的契機注入新的動力,推動經濟穩定健康發展。

    從中國經濟看背後困境及發展新構想?

    中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施,中國經濟可能有一個全新的契機注入新的動力,推動經濟穩定健康發展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    隨著時代的變遷,人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同,有些人追求的是即時的快樂和成就感,而有些人則看重長期的進步和自我超越。

    在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    隨著時代的變遷,人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同,有些人追求的是即時的快樂和成就感,而有些人則看重長期的進步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再見愛人:探索現代婚姻中的情感困境

    芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子,麥琳、李行亮,葛夕、劉爽三對情感關系10年以上的夫妻,以“婚姻紀實觀察”為切口,呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

    再見愛人:探索現代婚姻中的情感困境

    芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子,麥琳、李行亮,葛夕、劉爽三對情感關系10年以上的夫妻,以“婚姻紀實觀察”為切口,呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短劇新風潮:中老年人成為新的增長點?

    近日,不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十,閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事,成了當下短劇創作的“新流量密碼”。

    抖音短劇新風潮:中老年人成為新的增長點?

    近日,不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十,閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事,成了當下短劇創作的“新流量密碼”。

1 / 4