本文来自微信公众号:nextquestion(ID:gh_2414d982daee),作者:Jake Buehler,译者:Vicky,校对&编辑:EY,头图来自:unsplash
把人类基因组想象成一根绳子,它延伸到了一个足球场那么长,而编码了蛋白质的所有基因则位于末端,在你的脚边。向前迈出两大步,你便把所有蛋白质信息置之身后。
人类基因组的DNA里面有30亿对碱基对(base pairs),但是其中只有2%编码了蛋白质。其余似乎只是无用之物,充斥着大量重复的基因序列和基因组的死胡同,它们通常被标记为“垃圾DNA”(junk DNA)。这些遗传物质的分配方式极其浪费,令人咋舌,但这一现象并不仅仅存在于人类基因组中:有很多细菌貌似也会将20%的基因组“浪费在”非编码的填充物上。
什么是非编码DNA?围绕这一话题,仍有许多未解之谜。它是毫无价值的垃圾还是另有用途?从生物学角度来说,至少部分非编码DNA对生命体是至关重要的。但即便是抛开功能性不谈(或是缺少功能性),研究者们逐渐开始注意到非编码DNA是如何成为细胞的基因源,又是如何成为新基因演化的“育婴室”。
伦敦布鲁内尔大学遗传学家克里斯蒂娜·西苏(Cristina Sisu)表示:“‘垃圾DNA’这一术语已经逐渐消失不见了。”
“垃圾DNA”具有何种功能?
“垃圾DNA”的说法可追溯到20世纪60年代,当时科学家们只是随口一提。但是到了1972年,他们逐渐在更为正式的语境下援引这个术语。正是这一年,遗传学家和演化生物学家大野乾(Susumu Ohno)使用了这一术语,来辩证大量基因组在经过了数千年的被动积累之后,不可避免地会存储一些没有编码任何蛋白质信息的基因序列。在那之后不久,研究者们搜集到了有力证据,证明了基因组中这样的“垃圾DNA”数量是如何之多、其源头是如何的多样化、以及即便缺少蛋白质相关信息,有多少仍然转录为了RNA。
西苏表示,基因测序技术的进步,尤其是过去20年间的进步,已经很大程度上改变了科学家们对非编码DNA和RNA的看法。尽管这些非编码基因序列没有编译任何蛋白质信息,它们有时会被演化所塑造,以满足不同目的。结果就是,各种各样的“垃圾DNA”所具有的功能正逐渐明朗起来——如果它们有任何功能的话。
细胞用部分的非编码DNA来创造出多样化的RNA分子,从多个途径调节和辅助蛋白质生成。这些分子的种类不断增加,包括小核RNA、微小RNA、小干扰RNA以及多种其它类型的RNA。有些是短片段,典型特征是少于24对碱基对;还有一些碱基对数量更多,片段更长。有些呈现出双链结构或是自我向后折叠,形成发卡环(hairpin loops)。但它们都可以选择性地结合某个目标,比如信使RNA转录物,以促进或抑制该目标转化为蛋白质。
这些RNA对有机体的健康影响很大。举例来说,实验性地阻断小鼠的某些微小RNA会诱发一些失调症状,例如震颤和肝功能障碍。
迄今为止,人类和其他很多有机体基因组中最大类别的非编码DNA由转座子(transposons)和能够改变其在基因组中位置的DNA片段组成。昆士兰大学的遗传学家赛斯·奇塔姆(Seth Cheetham)表示,这些“跳跃基因”倾向于在整个基因组中多次自我复制——有时甚至可以产生成百上千个副本。最常见的是反转录转座子,通过复制自己的RNA,它们可以在基因组中其它位置反转录为DNA,从而实现高效扩散。人类基因组约有一半由转座子组成;在某些玉米植株中,这一比例可高达90%。
非编码DNA还出现在人类和其他真核生物体(拥有复杂细胞的有机体)基因里的内含子序列中,这些内含子序列会干扰编码了蛋白质的外显子序列。当基因发生转录时,外显子RNA会被编接进mRNA,同时大部分内含子RNA会被丢弃。但是有些内含子RNA会转化为参与蛋白质生成的小RNA。我们尚未得知为什么真核生物体会有内含子,但是研究者们猜想,内含子让外显子更容易重新排序,形成新的组合,以此来加速基因演化。
基因组中大量多变的非编码DNA由高度重复、长短不一的基因序列组成。例如位于染色体末端的端粒,就是由大量此类基因序列组成。这样的重复似乎能帮助染色体维持其完整性。(重复减少导致的端粒缩短与衰老有关。)但是细胞中很多重复性的活动目的未知,它们在演化的过程中得而复失、失而复得,似乎并没有产生什么不良的后果。
“假基因”也有实际价值?
最近,许多科学家都对一类非编码DNA感兴趣,那就是假基因(pseudogenes)。通常认为这类基因是工作基因的残留物,被意外复制之后通过变异被分解。只要原始基因有一个副本在工作,自然选择对保持多余副本的完整性影响不大。
假基因与断裂基因类似,看上去像是典型的基因废弃物。但是奇塔姆警告说,有些假基因也许根本不“假”。他表示,有许多假基因被认为是已知基因的缺陷性副本,这些基因虽然被打上了“假”的标签,但却并没有实验去证明他们缺乏实用价值。
假基因也可以演化出新的功能。奇塔姆表示,如果这些基因的RNA与工作基因足够相似,那么“有时它们可以实际控制原基因的活动。”西苏注意到,2010年,有一项科学研究发现,假基因PTENP1也是可以调控肿瘤生长的RNA。这一发现促使许多研究人员更为仔细地研究看似无用的假基因。
由于非编码基因序列是动态的,它们对基因的影响也是千变万化,既可能成为新基因演化的助推力,也可能是原材料。研究人员发现,基因ERVW-1就是一个很好的例子。该基因编码了一种蛋白质,对旧世界猴(Old World Monkeys)、猿猴和人类胎盘生长至关重要。其诞生要追溯到大约2500万年前,一种远古灵长类生物经历了逆转录病毒感染,这个基因搭上了逆转录转座子的“顺风车”,进入到了动物基因组中。逆转录转座子“几乎是指派了这个元件,在基因组周围上蹿下跳,最后将其转化为了某种对人类发展非常关键的东西”。
但是,到底有多少这样的DNA真正符合“垃圾DNA”的标准,也就是说对细胞毫无用处呢?有关这个话题的争论非常激烈。2012年,DNA元件百科全书(Encyclopedia of DNA Elements, Encode)研究计划宣布,他们发现人类基因组中有80%的区域似乎可以发生转录,或是从生物化学的角度来说处于活跃状态,因此可能是有一定实际功能的。但是,科学家围绕这一结论展开了广泛地争论,他们指出DNA转录的原因中有很多与生物效用毫无关联。
多伦多大学的亚历山大·帕拉佐(Alexander Palazzo)和圭尔夫大学的T·瑞安·格雷戈里(T. Ryan Gregory)提出了一些证据,包括演化考量和基因组规模,这些都有力表明“真核生物的基因组充满了低层次转录的垃圾DNA”。休斯顿大学的丹·格罗尔(Dan Graur)争辩称,由于基因突变,人类基因组中只有不到四分之一的区域在演化过程中能够保留功能。然而,这些观点都可以佐证转座子“自私”的行为影响了其宿主基因的演化。
奇塔姆认为关于“垃圾DNA”的固有观念已经阻碍了科学家们提出问题,探索其是否名副其实。他说:“这个称呼已经打消了大家去探索这些DNA是否具有某些功能的念头。”另一方面,得益于基因测序技术和其它科学手段的进步,“我们现在正处于了解非编码DNA和非编码RNA的黄金时代,”多伦多大学遗传学家张兆雷(Zhaolei Zhang)表示。他主要研究基因序列在某些疾病中所扮演的角色。
未来,研究人员们可能会越来越少称呼任何非编码基因序列为“垃圾”,因为现在有更多更为精准的描述方式。对于西苏来说,该领域研究要想前进,最好的方式就是用开放的心态去评估非编码DNA和RNA的“古怪之处”,以及它们的生物重要性。人们应该“退一步去思考,甲之砒霜可以是乙之蜜糖”。
来源:https://www.quantamagazine.org/the-complex-truth-about-junk-dna-20210901/
本文来自微信公众号:nextquestion(ID:gh_2414d982daee),作者:Jake Buehler