要点:
曾被视为“垃圾DNA”的远古病毒序列,现被发现在人类基因调控中扮演关键角色,尤其影响胚胎发育并可能促成物种差异,正改写我们对基因组功能的认知。
过去被科学家视为“垃圾DNA”的部分,现如今可能是我们基因组中最具力量的调控密码之一。自这类非编码DNA片段首次被发现并被称作“垃圾”以来,生物学家们一直在探讨它们是否真的无用。如今的主流观点认为,这些片段虽不直接参与蛋白质合成,却在整体基因组中占据了极大比例,显示它们可能具有重要功能。
根据一项国际研究,潜藏在人体基因内的远古病毒DNA,在控制基因的启动与关闭方面发挥了关键作用,尤其在人类胚胎发育初期尤为重要。这些病毒序列原属于早已消失的病毒,经过演化后转变为微型的基因开关。
近日,一支来自亚洲的国际研究团队发表成果,指出这些非编码区域中某些特定片段,很可能是调控细胞功能不可或缺的关键因子。这一发现正逐步改写我们对人类基因组运作方式的基本认知。研究团队透过新型分析技术与大规模实验,发现部分病毒DNA片段在启动基因表达上效果特别显著,甚至可能参与塑造人类与其他灵长类物种间的差异。
从“垃圾DNA”到基因调控主角:转座子的功能新解
自1869年瑞士医生弗里德里希·米歇尔首次分离出DNA以来,科学家对基因的结构与功能展开了长达一个多世纪的探索。其中一个重大突破发生于1940年代,细胞遗传学家芭芭拉·麦克林托克首次发现了转座因子/transposable elements,简称TEs也被称为“跳跃基因”,这些DNA片段能够在基因组中移动位置,打破了当时对基因稳定性的认知。
随着人类基因组计画的展开,研究人员惊讶地发现,约有45%的基因组由转座子构成。这些序列之所以能在演化过程中大量累积,与它们特有的“复制-粘贴”机制密切相关。然而,由于其高度重复、来源可疑(多与古老病毒有关),TE长期以来被视为无用的“垃圾DNA”,甚至被误认为是基因组的演化负担。
近年来,随着分子生物学技术的进步,对转座子的看法开始显著改变。越来越多证据显示,TE不仅在基因组的结构维持上扮演角色,也与基因调控、染色体重组、甚至物种形成密切相关。然而,正因为其序列重复性与跨物种分布的复杂性,使得科学家在技术上仍难以深入研究这类序列的实际功能。
近期,一项发表于“科学进展/Science Advances”的国际合作研究提出了一种全新的TE分类方法。研究团队来自日本、中国、美国与加拿大,他们跳脱传统的序列比对工具,转而以演化保存度与物种间的比较基因组学为核心,重新编码与分类这些跳跃基因,为探究其功能开启新局。
研究人员特别锁定了MER11这个转座子家族,这是一组起源于数千万年前、广泛存在于灵长类基因组中的序列。为了深入分析,团队根据其演化年代将MER11分为四个亚组(MER11_G1至G4),其中G1为最古老,G4则为最新。这一分类不仅有助于追溯其演化历程,也为评估其功能潜力提供了新依据。
令人意外的是,研究显示最年轻的MER11序列(G4)具有最强的基因调控能力。这些序列在胚胎发育早期扮演重要角色,能够影响关键基因的开启与关闭。这一现象暗示,随着演化进展,转座子并非持续退化,而是被选择性地保留下来并担负起新的功能。
更进一步的推论指出,像MER11这样的转座子可能参与了物种形成的过程。因其对基因调控网络有极强影响,甚至可能导致不同族群在发育与生理上的分化,从而促进新物种的产生。这种微小但广泛的基因调控变化,正是演化能量积累的重要来源之一。
尽管并非所有TE都具备明确功能,这项研究再次挑战了“垃圾DNA”的传统观点。在基因组中,每一段看似沉默的序列都有可能是潜在的调控因子,或在特定条件下发挥关键作用。与其将未知视为无用,不如承认我们对基因组的理解仍处于初步阶段。而TE的研究,正是通往全貌的关键之一。
基因组的潜行者:MER11与转座因子的逆转命运
近期国际团队的一项研究指出,部分转座因子不仅能够插入基因组,更可能改变周围基因的活性。特别是在特定细胞类型(如干细胞或神经细胞)中,某些TE会充当基因调控元素,精确调节基因的开启与关闭,进而影响细胞的命运与功能。
而进一步分析显示,人类与近亲物种如黑猩猩、恒河猴的MER11_G4序列,经历了不同程度的突变与演化。这些细微差异导致转录因子结合能力出现改变,进而影响调控功能。首席研究员陈迅博士指出,这些差异可能正是物种分化的遗传根基,让转座子成为推动物种演化的潜在驱动力。
MER11的研究提供了一个鲜明例证:即便最初以入侵者身分进入基因组,TE仍可能被细胞「收编」,演化为具有调控功能的元件。透过分析这些序列在不同物种间的保存程度,并以功能性测试加以验证,研究人员首次系统性地展示古老病毒DNA如何参与塑造现代灵长类的基因调控网络。
为了验证MER11在实际生物系统中的功能,研究团队运用了“慢病毒大规模平行报告基因检测”/lentiMPRA技术。他们在人类干细胞与早期神经细胞中测试了超过7000个MER11序列。结果显示,最新一代的G4序列对基因表现影响最大,并与调控基序,即影响基因活性的短DNA片段高度相关。
尽管我们早在20世纪末便已完成人类基因组测序,但井上文隆博士指出,许多基因组区域的功能依然是谜。像MER11这样的转座因子正好揭示了非编码区的潜能,这些看似沉默的DNA区域,实际上可能参与著复杂的基因调控网络,甚至牵动着个体发育、疾病风险与物种演化的关键节点。
虽然有些人仍将转座子视为无用,仅为了自身复制而存在的寄生基因,但这项研究指出,演化往往不会长期容忍毫无贡献的基因元素。生命倾向于将所有现有材料转化为可用资源,转座子正是一例。从病毒残留物到调控工具,它们的转变也反映出基因组的灵活性与生物进化的创造力。
这项研究不仅重塑了我们对“垃圾DNA”的认知,也提醒我们,科学从来不是一成不变的结论,而是一场不断修正与深化的探索。那些曾被忽略、甚至贬低为无用的基因片段,如今正一步步揭示其潜藏的价值与功能。在未来的基因医学、发育生物学乃至演化研究中,这些沉默的序列可能将成为最具潜力的线索,帮助我们理解人类的起源、差异与命运,并开启一个真正全面解读基因组的时代。