中國科學院高彩霞團隊最新突破:借助人工智能開發出新型堿基編輯器

中国科学院高彩霞团队最新突破:借助人工智能开发出新型堿基编辑器

發布日期:

科技 Tech


要点:
近年来随着测序技术的进步,导致数据量暴增,随之而来的数据噪声和批次效应显现。此外还有多模态数据的整合等挑战。针对单细胞转录组的数据,AI大模型就有了用武之地。它通过自监督学习和微调两个阶段,学习基因之间的编码关系,降低数据维度和噪声,增强模型鲁棒性。

致力于传播优质的中国知识内容、构建全球新共识。我们将通过一系列时事资讯、精品课程、论坛、节目、咨询报告等内容产品,提供关于当代中国的最新的舆论思潮、深入的社会观察、亮眼的科技成就等优质信息。我们已与五大洲十多个国家、百余个研究机构、媒体机构、政治团体、民间组织建立合作关系。希望通过我们的工作在海外分享中国经验,讲述中国故事,客观分析我们共同面对的挑战和机遇,携手全球青年寻找全球化发展的新共识。
联系我们// Substack // Twitter // YouTube // 相关文章

AlphaFold2是一种由DeepMind开发的用于预测蛋白质结构的机器学习算法,它可以从蛋白质数据银行/PDB的训练数据集中,基于其氨基酸序列推断出蛋白质的三维构象。在CASP14比赛中,AlphaFold2表现非常出色,超过了所有其他方法。迄今为止,AlphaFold2已经被用于为21种模式生物做蛋白质结构预测,还有预测SwissProt和UniRef90数据库中的所有蛋白质的构象,并生成了超过35万个蛋白质结构模型。

自从2021年推出以来,AlphaFold2已经对生物研究产生了巨大影响。它既能够研究不同蛋白质组中的蛋白质结构-功能关系、相互作用、配体结合位点、错义变异和结构元素,还可以通过提供初始模型或改善低分辨率数据来作为实验方法(如冷冻电镜和X射线晶体学)的补充。

AlphaFold2的应用潜力显然不止于此。中国科学院遗传与发育生物学研究所高彩霞团队首次运用AlphaFold2的蛋白结构预测功能来辅助蛋白聚类,并开发出一系列堿基编辑工具,拓展了AlphaFold 2的应用范围。

日前,该研究以“ Discovery of deaminase functions by structure-based protein clustering ” 为题,在线发表于“细胞”期刊上。

开创性的尝试
蛋白质功能的解析以及在生物工程中的应用,在极大地推动着生命科学的发展。传统的酶挖掘,仅基于氨基酸序列信息来对蛋白质功能和进化轨迹进行分类和预测。然而,一维的序列信息无法完全阐明蛋白质的功能特性。由于蛋白质功能最终由三维构象,即蛋白质折叠决定,因此在蛋白质挖掘和聚类分类过程中,了解蛋白质结构至关重要。

高彩霞团队使用AlphaFold2来预测整个蛋白质家族的结构,并根据预测出来的结构的相似性对蛋白质进行聚类。在该项研究中,团队对脱氨酶蛋白进行分析,并发现了许多之前未知的性质。

脱氨酶样蛋白可以催化核苷酸和堿基的去氨基化。它们在突变、核酸代谢和其他生物过程中起着重要作用,还被用来作为可编程DNA和RNA的堿基编辑器。但是有个问题一直困扰着研究者们,那就是很难基于氨基酸序列来确定脱氨酶各种蛋白质家族之间的关系。所以AlphaFold2对三维结构的预测能力使其成为解决这个问题的利器。

预测结果让人意想不到的是,在双链DNA脱氨酶毒素A 样脱氨酶/DddA-like支系中,大多数蛋白质并不是双链DNA脱氨酶。研究团队设计了尺寸最小的单链特异性胞嘧啶脱氨酶,这样能够将高效的胞嘧啶堿基编辑器/CBE打包到单个腺相关病毒/AAV中。随后,对该支系的一种脱氨酶进行的分析发现它能够在大豆植物中进行强有力的编辑,而原来CBE无法在大豆植物中使用。这些发现极大地扩展了堿基编辑器在医疗和农业中的应用前景。

根据AlphaFold2预测的结构进行聚类
高彩霞团队利用AlphaFold2根据氨基酸序列预测了重注区域的蛋白质结构,并按照结构相似性进行了聚类分析。这样就能够在植物和人类细胞中检测这些蛋白质的ssDNA和dsDNA胞嘧啶去氨基化活性。团队还利用结构相似性矩阵比较了242种蛋白质(238 种胞嘧啶脱氨酶和4 种JAB 蛋白)的预测结构,这些蛋白质分属于16个脱氨酶家族和1 个外类群。矩阵中不同颜色的区域反映了不同家族蛋白质之间的相似度差异。随后,根据蛋白质结构的特征,它们被划分为不同的脱氨酶家族。

评估脱氨酶活性<br>随后的研究发现,SCP1.201脱氨酶类群的一些蛋白质具有脱氨酶活性,可以让单链DNA底物脱氨。这些蛋白质被称为双链DNA 脱氨酶毒素A 样脱氨酶/DddA-like。然而,研究人员发现这些蛋白质也可以用于双链DNA 的基因编辑。对SCP1.201类群的489个脱氨酶进行重新分析表明,这些蛋白质可以被分为不同的亚类,具有独特的核心结构特征。其中,SCP1.201类群中的Sdd蛋白质具有脱氨单链DNA的活性,而不是双链DNA。因此,这些蛋白质应该被重新定义为Sdd,而不是DddA-like。

这些结果说明,基于蛋白质结构的分类方法比基于一维氨基酸序列的分类方法更有效,可以为基因编辑提供新的机会,同时可以更准确地评估脱氨酶的功能关系。

新发现的Ddd蛋白<br>研究人员将13个属于Ddd亚族的脱氨酶克隆到双链DNA胞嘧啶堿基编辑器/DdCBE中,在HEK293T细胞内评估了在内源在JAK2和SIRT6位点的dsDNA堿基编辑。有趣的是,研究发现Ddd1、Ddd7、Ddd8和Ddd9的编辑效率与DddA相当或更高,而Ddd1和Ddd9在50-GC堿基序列上的编辑活性明显高于DddA。此外,研究还发现新发现的dsDNA靶向脱氨酶可以编辑之前DddA无法接近的胞嘧啶堿基序列。这个发现扩展了DdCBE的实用性和靶向范围。通过评估新发现的Ddd蛋白质和Sdd蛋白质的编辑活性,研究人员发现它们可以更准确地编辑胞嘧啶堿基序列,为基因编辑工具的开发提供了新途径。

Sdd蛋白质在堿基编辑中的独特性<br>接下来的研究发现,在人类和稻米细胞中,不同的Sdd-CBEs在所有测试的基因组靶点上显示出不同的编辑模式。通过靶向报告锚定位置测序,研究人员发现与传统的CBEs相比,Sdd蛋白质具有更高的编辑效率、不同的脱氨酶基序偏好和编辑窗口。研究还评估了Sdd蛋白质的Cas9独立的非靶向效应,并发现Sdd6表现出最高的靶向/非靶向编辑比率,使其成为高保真堿基编辑的备选方案之一。

研究团队使用AI辅助来制作Sdd蛋白质,并缩短其长度,于是得到了小型化的脱氨酶。它们小巧并具有相同、甚至更高的编辑效率。这些小型化的脱氨酶可以允许构建单个AAV封装的SaCas9-CBEs。这突显了Sdd蛋白质在堿基编辑中的潜力以及AI在蛋白质工程中的作用。

SddCBE在堿基编辑中的应用<br>在水稻植物基因组编辑中,mini-Sdd7比农业中最常用的hA3A-CBE具有更高的效率和较低的毒性。在大豆中,研究团队使用瞬时堿基编辑/transient base editing来评估在根细胞中的编辑百分比,并发现mini-Sdd7在所有测试位点上的胞嘧啶堿基编辑水平显著增加,编辑效率高达67.4 %。此外,团队还成功地使用Sdd7获得了经过堿基编辑的大豆植物,这让在大豆植物中实现高效的堿基编辑成为可能,可以服务于将来的农业育种工作。

AI为生命科学带来了新机遇<br>本研究釆用结构预测为基础的方法,对胞嘧啶脱氨酶类超家族进行了蛋白质分类和挖掘的概念验证探索。研究表明,AlphaFold2预测的结构可以很好地将脱氨酶分类为不同类群,这些类群具有不同的蛋白质折叠和催化功能。在此基础之上可以设计的精准基因组编辑工具。这种由AI辅助的策略可以应用于任何蛋白质数据集的高通量分类和功能分析。

基于人工智能的蛋白质结构预测和分类将为具有可变序列和低序列保守性的蛋白质分类提供新的视角。而这只是AI为科研所带来的许多新机遇之一。在生命科学领域,除了这里提到的用于研究蛋白质结构的AlphaFold,AI正大显身手。

在生物制药方面,机器学习、深度学习等AI技术正在替代以往的大量实验,对药物结构、功效等进行快速分析,以达到缩短试验周期、节省成本、促进新药发现、提升试验成功率等目的。

而在组学研究上,近年来随着测序技术的进步,导致数据量暴增,随之而来的数据噪声和批次效应显现。此外还有多模态数据的整合等挑战。针对单细胞转录组的数据,AI大模型就有了用武之地。它通过自监督学习和微调两个阶段,学习基因之间的编码关系,降低数据维度和噪声,增强模型鲁棒性。类似的,空间组学技术也面临数据量大、数据缺失以及需要定位细胞位置等挑战。在这里,大模型可以利用迁移学习和空间信息Embedding,用于空间转录组数据的细胞类型注释。研究人员利用人工智能技术,特别是深度学习技术,分析和挖掘单细胞测序数据和空间组学数据。大模型在多个数据集上显示出优异的性能,为生命大数据的理解和应用提供新的思路和手段。这些或许将根本性地改变生物制药,甚至生命科学研究的面貌。

致力于传播优质的中国知识内容、构建全球新共识。我们将通过一系列时事资讯、精品课程、论坛、节目、咨询报告等内容产品,提供关于当代中国的最新的舆论思潮、深入的社会观察、亮眼的科技成就等优质信息。我们已与五大洲十多个国家、百余个研究机构、媒体机构、政治团体、民间组织建立合作关系。希望通过我们的工作在海外分享中国经验,讲述中国故事,客观分析我们共同面对的挑战和机遇,携手全球青年寻找全球化发展的新共识。
联系我们// Substack // Twitter // YouTube // 相关文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回博客
  • PDD拼多多2026年第一季財報,不及市場預期

    PDD拼多多2026年第一季财报,不及市场预期

    因国内主站营收增长不及预期,营销支出也并未明显下滑,因此实际利润表现并不及预期。分板块来看背后原因,我们认为一方面是 Temu 本季减亏的幅度大概率并没有预期的那么多,另外国内主站的经营利润增长应当也相当有限。

    PDD拼多多2026年第一季财报,不及市场预期

    因国内主站营收增长不及预期,营销支出也并未明显下滑,因此实际利润表现并不及预期。分板块来看背后原因,我们认为一方面是 Temu 本季减亏的幅度大概率并没有预期的那么多,另外国内主站的经营利润增长应当也相当有限。

  • 小米2026年第一季度財報,主要受手機和汽車毛利率同比回落影響

    小米2026年第一季度财报,主要受手机和汽车毛利率同比回落影响

    小米本季度汽车业务毛利率下滑至 20.1%,接近市场预期(20.5%),主要是受均价下滑的影响,其中包含了小米对购置税进行补贴的影响,并在本季度销售了一部分的低价现车。由于毛利率再次回落,海豚君测算本季度小米汽车业务核心经营利润再度陷入亏损 31 亿元。

    小米2026年第一季度财报,主要受手机和汽车毛利率同比回落影响

    小米本季度汽车业务毛利率下滑至 20.1%,接近市场预期(20.5%),主要是受均价下滑的影响,其中包含了小米对购置税进行补贴的影响,并在本季度销售了一部分的低价现车。由于毛利率再次回落,海豚君测算本季度小米汽车业务核心经营利润再度陷入亏损 31 亿元。

  • NVDA英偉達2027財年第一季度財報,收入752億美元,環比增量為129億美元

    英伟达2027财年第一季度财报,收入752亿美元,环比增量为129亿美元

    NVDA核心经营指标:总收入816亿美元,好于上调后的买方预期(780-800亿美元),其中季度环比增长135亿美元,几乎都来自于数据中心业务中Blackwell量产增加的带动。

    英伟达2027财年第一季度财报,收入752亿美元,环比增量为129亿美元

    NVDA核心经营指标:总收入816亿美元,好于上调后的买方预期(780-800亿美元),其中季度环比增长135亿美元,几乎都来自于数据中心业务中Blackwell量产增加的带动。

  • BYD比亞迪2025年第四季度業績仍然不及預期,賣車單價仍處於下行軌道

    比亚迪2025年第四季度业绩仍然不及预期,卖车单价仍处于下行轨道

    比亚迪的业绩仍然不及预期。收入虽超预期,但主要由于非核心的比亚迪电子业务高增带来,而在核心的卖车业务上,卖车单价仍处于下行轨道,卖车成本降幅不够,最后卖车毛利率虽有回暖,但仍低于市场预期。

    比亚迪2025年第四季度业绩仍然不及预期,卖车单价仍处于下行轨道

    比亚迪的业绩仍然不及预期。收入虽超预期,但主要由于非核心的比亚迪电子业务高增带来,而在核心的卖车业务上,卖车单价仍处于下行轨道,卖车成本降幅不够,最后卖车毛利率虽有回暖,但仍低于市场预期。

  • GOOG谷歌TurboQuant新聞導緻MU美光科技等內存股股價暴跌,但這合理嗎?

    GOOG谷歌TurboQuant新闻导致MU美光科技等内存股股价暴跌,但这合理吗?

    消息一出,华尔街一度陷入恐慌:如果 AI 突然间不再需要那么多 RAM 就能运作,这是否意味着内存产业的“超级周期”即将结束?答案是否定的。事实上,从历史规律与经济学角度来看,情况正好相反。要理解这一点,我们只需要观察你电脑上的网页浏览器。

    GOOG谷歌TurboQuant新闻导致MU美光科技等内存股股价暴跌,但这合理吗?

    消息一出,华尔街一度陷入恐慌:如果 AI 突然间不再需要那么多 RAM 就能运作,这是否意味着内存产业的“超级周期”即将结束?答案是否定的。事实上,从历史规律与经济学角度来看,情况正好相反。要理解这一点,我们只需要观察你电脑上的网页浏览器。

  • BABA財報AI投入比較激進

    BABA财报AI投入比较激进

    BABA发布第四季财报后股价下跌,财报显示其营收和利润均大幅低于预期。这家電商巨头的季度净利暴跌67%,而总营收仅增长1.7%约413亿美元。这些表现引发了人们对阿里巴巴在AI人工智能领域巨额投资(总额超过530亿美元)有效性的担忧。

    BABA财报AI投入比较激进

    BABA发布第四季财报后股价下跌,财报显示其营收和利润均大幅低于预期。这家電商巨头的季度净利暴跌67%,而总营收仅增长1.7%约413亿美元。这些表现引发了人们对阿里巴巴在AI人工智能领域巨额投资(总额超过530亿美元)有效性的担忧。

  • MU美光業績,季度毛利率達到 74.4%!

    MU美光业绩,季度毛利率达到 74.4%!

    MU 整体业绩:美光本季度营收 238.6 亿美元,环比增长 75%,好于上调后的买方预期(199 亿美元),本季度收入增长主要来自于 DRAM 和 NAND 业务的双重带动,两大业务环增都在 70% 以上。

    MU美光业绩,季度毛利率达到 74.4%!

    MU 整体业绩:美光本季度营收 238.6 亿美元,环比增长 75%,好于上调后的买方预期(199 亿美元),本季度收入增长主要来自于 DRAM 和 NAND 业务的双重带动,两大业务环增都在 70% 以上。

  • Tencent騰訊業績整體看無驚無喜?

    腾讯业绩整体看无惊无喜?

    腾讯一口气连发多个“龙虾”产品,能够看出公司在元宝春节大战中失利后的焦虑,虽然仓促推出产品还不完善。不过这个紧迫感的转变很关键也很必要。就目前来看,微信入口似乎在 AI 原生应用盛行的当下仍然有无法撼动的地位。

    腾讯业绩整体看无惊无喜?

    腾讯一口气连发多个“龙虾”产品,能够看出公司在元宝春节大战中失利后的焦虑,虽然仓促推出产品还不完善。不过这个紧迫感的转变很关键也很必要。就目前来看,微信入口似乎在 AI 原生应用盛行的当下仍然有无法撼动的地位。

1 / 8
  • Sharpa機器人削蘋果

    Sharpa机器人削苹果

    对人类来说,削苹果是件轻而易举的晨间小事,但对机器人而言,这是双手协调能力的「终极挑战」。 Sharpa机器人正在为能够像人类一样灵巧地完成复杂家务和工业装配的机器人铺平道路。

    Sharpa机器人削苹果

    对人类来说,削苹果是件轻而易举的晨间小事,但对机器人而言,这是双手协调能力的「终极挑战」。 Sharpa机器人正在为能够像人类一样灵巧地完成复杂家务和工业装配的机器人铺平道路。

  • 腫瘤療法突破,中國團隊給癌細胞打上“豬”標簽,癌細胞“偽裝朮”被破解

    肿瘤疗法突破,中国团队给癌细胞打上“猪”标签,癌细胞“伪装术”被破解

    近期,中国科学家在“Cell”杂志上发表的一项突破性研究,为这一顽疾提供了全新思路。他们利用基因编辑技术,将癌细胞改造成免疫系统眼中的“异类”,类似于人体对猪器官产生的超急性排斥反应,从而引发了一场针对癌细胞的精准“免疫歼灭战”。

    肿瘤疗法突破,中国团队给癌细胞打上“猪”标签,癌细胞“伪装术”被破解

    近期,中国科学家在“Cell”杂志上发表的一项突破性研究,为这一顽疾提供了全新思路。他们利用基因编辑技术,将癌细胞改造成免疫系统眼中的“异类”,类似于人体对猪器官产生的超急性排斥反应,从而引发了一场针对癌细胞的精准“免疫歼灭战”。

  • 新型大腦設備首次讀出內心聲音,腦機接口技朮打破失語者困境

    新型大脑设备首次读出内心声音,脑机接口技术打破失语者困境

    新系统的核心原理与常见的“尝试说话”型脑机介面相似,都是在大脑运动皮质植入感测器,这一区域负责向声道肌肉下达运动指令。感测器捕捉到的神经活动会送入机器学习模型,模型依据个人化数据判断信号对应的声音,进而预测使用者想说的单字。

    新型大脑设备首次读出内心声音,脑机接口技术打破失语者困境

    新系统的核心原理与常见的“尝试说话”型脑机介面相似,都是在大脑运动皮质植入感测器,这一区域负责向声道肌肉下达运动指令。感测器捕捉到的神经活动会送入机器学习模型,模型依据个人化数据判断信号对应的声音,进而预测使用者想说的单字。

  • “垃圾DNA”新發現:遠古病毒DNA在人類發育中發揮關鍵作用

    “垃圾DNA”新发现:远古病毒DNA在人类发育中发挥关键作用

    自这类非编码DNA片段首次被发现并被称作“垃圾”以来,生物学家们一直在探讨它们是否真的无用。如今的主流观点认为,这些片段虽不直接参与蛋白质合成,却在整体基因组中占据了极大比例,显示它们可能具有重要功能。

    “垃圾DNA”新发现:远古病毒DNA在人类发育中发挥关键作用

    自这类非编码DNA片段首次被发现并被称作“垃圾”以来,生物学家们一直在探讨它们是否真的无用。如今的主流观点认为,这些片段虽不直接参与蛋白质合成,却在整体基因组中占据了极大比例,显示它们可能具有重要功能。

1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

1 / 4