本文来自复旦大学管理学院主办的“我们︱WOMEN”2023复旦科创先锋论坛主题演讲,演讲嘉宾:付巧妹(中国科学院古脊椎动物与古人类研究所研究员、分子古生物学实验室主任),题图来自:视觉中国(付巧妹,2020年)
我今天报告的主题是《古DNA破译东亚人群演化图谱》,我将着重介绍我们近几年取得的科研成果。希望通过这次报告,能让老师和同学们对这个领域有所了解。
古DNA研究的优势与困难
可能很多人好奇,了解人类演化到底有什么意义。其实,人类演化中有很多重要的科学之谜,比如:是什么样的遗传造就了独特的人?地球上曾经有多少种族共存?传统的形态学和遗传学能帮助我们取得一些了解,但存在很多不足;而通过古DNA直接研究古代人群,具有非常独特的优势,为解决问题带来了更多可能性。
但古DNA研究也面临着很大困境。上世纪80年代就已经出现了古DNA研究,但直到2010年前后,通过古DNA研究人类演化才掀起了大浪潮。为什么会这样?主要原因就是,本源的古DNA很难获取。比如上世纪90年代,很多人尝试从化石、琥珀、甚至恐龙蛋中获得DNA,后来却发现都不是本源DNA,而是来自污染。
古DNA有什么特征?看下面这张图就会非常明确。首先第一点,相对于新鲜组织DNA而言,古DNA是碎片化的,片段很短。即便是从埋藏的骨骼中获得的DNA,可能大量都不来自骨骼个体本身,而是由于埋藏环境的原因,含有很多微生物,属于本源DNA非常少。在发现化石的过程中,手的接触也会带来污染。
可能对于新鲜组织而言,由于内源DNA含量很高,这些污染影响不大;但是对于古DNA而言,跟内源DNA比起来,这些污染影响非常大,有时甚至没有内源DNA,错把污染当作人类自体的DNA,这对研究人类演化造成了很大困难。直到2010年前后,跟二代测序结合,再加上新开发的一系列古DNA技术,研究人类古DNA才成为可能。
这个领域的主要研究内容,跟两个基本问题有关:第一,在共存时间里,现已灭绝的古人类跟现代人有没有互动,如何互动;第二,现代人在不同时间阶段是如何演变的。针对这两个问题,我们团队在2021年,也就是人类基因组草图发布20周年之际,受《Science》特刊之邀,写了一篇关于人类演化史的综述,回溯从40万年前到现在的人群的演变特点,系统梳理近万年来的现代人群遗传史,包括非洲、欧亚大陆以及美洲人群的迁徙和变化,并提出对未来古DNA研究的展望。
灭绝古人类和现代人的互动
很多人会问,现代人是不是指现代生活的人?其实现代人的范围要大得多,只要跟现代生活的人没有明显遗传或者体质差异的都包括在内,这些人在20万年前已经出现,都是现代人。除此以外,其实在共存时间里,还存在别的类型的人,他们在体质上、DNA上都跟我们不一样,没有留下直接后代。但是这些人并不见得是完全灭绝,为什么呢?比如尼安德特人的基因,在我们体内有1%到4%——在座的你我,只要不是非洲人,都有尼安德特人的成分。
接下来,我就以灭绝古人类——丹尼索瓦人为例,给大家稍微介绍一下我们的研究。第一次找到丹尼索瓦人,是在阿尔泰山脉的丹尼索瓦洞穴中,通过一个小手指骨DNA发现的,这也是第一次通过遗传找到未知的古人类。2010年获得第一个丹尼索瓦人的基因组信息以后,一直到2020年,这一人群所有的DNA基因都来自这个洞穴。
然而,我们目前仅仅了解丹尼索瓦人对现今大洋洲及东亚人群影响,对于他们在亚洲、尤其是东亚的分布,是非常不清楚的。这种情况下,我们团队希望在东亚找到丹尼索瓦DNA,或者是其他类型古人的DNA,所以另辟蹊径,尝试从沉积物中获取DNA,相当于是从古人生存过的土里,对每一地层进行试验,通过一系列实验室技术获取DNA。
怎么获取?大家可能觉得奇怪,土里大多数是微生物DNA,怎么拿到人的DNA?我们的方法是,利用杂交原理,通过242种动物的DNA,和我们样品中的DNA融合、杂交,然后把剩下的DNA洗涤掉,起到一个富集作用,最后对这些生物DNA进行分析,探究它们属于哪种DNA,其中是否可能存在人类DNA。
我们做了这么多年,将近20个遗址,涵盖40万年到2万年之间的漫长时期,但目前只做出来一个遗址,也就是白石崖溶洞。它在甘肃南部,海拔3200米,离丹尼索瓦洞穴非常远,但我们就是在这里找到了丹尼索瓦人DNA,主要存在于第七层沉积物,就是约10万年以及6万年、可能至4.5万年的地层中。
这个时间不见得那么准确,但很重要的一点是,我们看到在不同区域中确实存在着丹尼索瓦人,而且不同时间段都一直存在。而且,这些地层中只有丹尼索瓦人,没有现代人以及尼安德特人的成分。所以,这个遥远地区的人群与晚期丹尼索瓦洞穴人群直接相关。
这时我们不由产生疑问:白石崖溶洞的人群为什么跟晚期丹尼索瓦人相关,而不是另外一个族群?这些晚期人群到底是怎么分布的?从哪里来?朝哪个方向迁徙?为了解决这些问题,我们将进一步研究古人的时空分布和迁徙扩散。
这个研究在2020年入选为国际人类起源研究十大新认知之一。我们看到,丹尼索瓦人DNA不仅在东亚、大洋洲人群里有残留,其实对现代人中的不少人群都有贡献和影响。比如西藏人相对内陆人群而言,会更适应高原环境,是因为他们有一个相关控制基因,EPAS1基因,而这个基因的很长片段跟丹尼索瓦人有关。于是我们会思考,丹尼索瓦人基因对适应高海拔环境有什么帮助,这又打开了更多研究方向。
除此以外,在极地生活的因纽特人有非常强的脂肪代谢能力,他们产生的大多是棕色脂肪,能快速把脂肪转换成能量,而这可能跟丹尼索瓦人基因也有关系。这一系列现象都让我们思考,灭绝的古人类虽然消失了,但仍在我们体内产生一定影响,在某些人群中甚至具有很重要的作用,尤其是生理上的作用。
现代人在不同时间阶段的演变
第二个问题是现代人在不同时间阶段的演变。就像我刚刚提到的,现代人涵盖了非常长的时间跨度。我们不由思考,现在所说的南北方人群的遗传差异是自古有之,还是在不断演变过程中慢慢产生的?我们的报告或许能给大家一些启发。
接下来,我将介绍近几万年到现在,东亚人群的遗传特点和一些关键适应基因的演变。早期我关注较多的是欧洲及北亚现代人研究,近几年在东亚研究中,我们也作出了非常多贡献。2017年之前,中国很缺乏针对人类的古基因组研究,而我们团队于2017年在北方的房山获得了第一例在中国的人类古基因组,也是目前为止最老的一例东亚现代人基因组。可能很多同学和老师们听说过北京猿人和山顶洞人。我们所研究的田园洞人,要比山顶洞人早一万多年。
田园洞人的研究意义很大,他给我们提供了几个很重要的信息:首先,在四万年前就已经存在遗传意义上的东亚人。这之所以重要,是因为同一时间阶段的欧洲和北亚,还有一些人群没有分化成遗传意义上的欧洲人或北亚人。除此以外,它还提供了现在生活的东亚人身上无法直接看到的线索,比如跟美洲、欧洲某些人群之间的关联。
这些现象告诉我们一个重要的事实:四万年前,东亚人群是相对复杂的,欧亚史前人群具有不可忽视的多样性。《Science》杂志也评价说,该基因组填补了东亚古人类研究的巨大空白。
但是,仅通过单独的个体,我们很难知道东亚人适应性基因的演化过程,所以我们团队从2016年、2017年前后到2021年,针对黑龙江流域,对三万多年到三千年的人群进行了一系列研究。我们首先发现,三万年前在松花江生活的人群,虽然地理上离田园洞人很远,时间上也晚几千年,但跟田园洞人有很强的关联,是同一群人。而跟他们生活在同一时间的蒙古人群,除了拥有田园洞人的遗传成分以外,还带有北亚人群的影响。
可以肯定的是,在三万年前,也是末次盛冰期之前,田园洞人对于整个东亚北部的影响非常大。末次盛冰期是一个极度寒冷的阶段,主要包括两万七千年前到一万九千年前;一万九千年之后,环境相对好些——这时我们发现一个有意思的现象:一万九千年之后,田园洞人特有的遗传成分,并未在后期人群中出现。一万九千年前的人群已经出现古北方人的遗传成分,说明当时南北方人群可能已经分化,而田园洞相关人群很可能在末次盛冰期消失了。此外,松花江人群从一万四千年前到现在相对连续。
有一个值得重视的现象,它让我们了解到,松花江人群对于北亚贝加尔湖、远东人群都有影响。在我们开展研究之前,存在着一个重要的遗留问题:美洲人中的东亚成分源自哪里?是来自黄河流域,还是东北,还是其他地方?我们分析之后发现,它的主要来源是黑龙江一万四千年以来的相关人群。
此外,我们还通过研究表型和基因型的联系,了解到东亚人的一些特征。复旦团队在这方面也做了非常深入的工作。在这些问题上,古DNA研究能作出很大的贡献。我们知道,相对欧洲人而言,东亚人的毛发会粗一点、硬一点,汗腺也不一样,这主要跟东亚特有的EDAR基因有关。古DNA能帮我们了解,这些基因是什么时候在东亚出现的。
一些学者认为是两万年前后,末次盛冰期的尾声。那时非常寒冷,出现了长期低紫外线的情况,需要增加母乳维他命的吸收,因此出现了这样的突变。另外一些学者认为是三万年前后,因为当时的气候非常温暖、潮湿,人们需要通过出汗来调节体温。而事实上,我们的古DNA研究发现,至少在一万九千年前,也就是末次盛冰期快结束的时候,这种变异就出现了,所以很可能与低紫外线环境选择有关。
东亚南北方地区及东亚和东南亚的联系
我们讲了很多发生在万年前的一些演化历史。接下来,我想介绍我们对近万年以来东亚南北方以及东亚跟东南亚之间联系的研究。
对于近万年来南北方格局的特点,我们做了将近八年,最后在2020年做出来了,并入选了当年的中国十大科学进展。不难发现,现在的南北方人在生活习惯、遗传特征上都有差异,而我们想解决的问题就是:那时的差异比起现在,是更大还是更小。按照常规的理解,随着时间变化,积累的差异应该越来越多。但通过古DNA研究,我们发现如今南北方的差异远低于过去。
之前提到南北方的差异在一万九千年前已经存在,到九千年前后继续存在。在五千年到三千年这个阶段,南方仍然以古南方人群为主;但到了四千年之后,大量北方人群对南方产生影响,使得古南方成分下降。这并不意味着北方人取代了南方人,只是说明南方融合了越来越多北方的影响。
我们还能看到,欧洲和中国的演化历程很不一样。欧洲在九千年前农业出现以来,一直受外来人群的影响,比如九千年以来的外来农耕人群,对现在欧洲人的影响达到40%。到四千多年前后,欧洲人可能跟欧亚草原人群也有联系。但在中国,虽然南北方一直有交流,但并没受到大量外来人群的影响,主要影响来自内部,整个内部人群是连续的。我们还可以看一下汉族的情况:生活在南北方的汉族人群一直在融合,体现出大熔炉的特点。
这个研究还让我们无意中解决了一个很重要的问题,就是南岛语族的起源问题。南岛语族是目前唯一一个分布在岛屿上的语系,包括1300多种语言,使用者主要生活在台湾岛和太平洋岛屿上,南方内陆则没有分布。一些学者认为台湾岛是它的起源地,另外一些认为南方内陆才是,但都没有找到确凿的证据。而我们研究了四千多年前、八千多年前、甚至一万多年前南方内陆的人群,发现他们跟南岛语族直接相关,尤其是四千多年前的人群跟三千多年前的南岛语族岛民是同一批人。
再看一个更直观的例子。当我们把四千多年、八千多年以及一万多年前在福建生活的人群,跟在南方内陆生活的傣族,以及在台湾岛生活的阿美族、泰雅族进行直接比较的时候,会发现,相比于跟傣族,古福建人群跟阿美族有更直接的关系。这是由于四千年之后,大量北方人群对南方人群产生了影响,使得古南方的成分急剧下降。所以,现在的南方人具有更多北方成分,看起来和南岛语族没有那么相关。我们古DNA的研究从根源上解决了问题。
还有一个很重要的现象:东南亚的人群是不连续的,早期人群跟晚期人群非常不同,而且早期人群在印度安达曼群岛的人群有残留,却对本地人没有影响。但在我们刚才说的东南沿海福建地区及周边,人群都是相对连续的。东南亚和东南沿海如此不一样。那么处于交汇位置的广西是怎么的呢?
对广西人群的研究,我们做了九年,取得不少发现。首先,在广西一万一千年的人群中,存在一个我们之前不知道的古老的东亚支系,即隆林人。之前的形态学研究认为,他们的颅骨形态呈现出灭绝古人类和早期现代人混合的特征,因此可能是两者混合的后代;但我们发现,他们携带的尼安德特人或丹尼索瓦人的基因含量并不高于其他东亚现代人——隆林人实际上就是东亚的现代人。
但他们同时是一个未知的古老东亚人群。这是什么意思?前面讲到,一万九千年出现了古北方人群,而一万一千年时,隆林人在广西生活,这是否意味着隆林人就是古南方人?通过分析,我们发现隆林人的支系早于南北方分离之前,也就是说,他们对现在的南方人和北方人都没有影响。
我们看到,广西九千多年、八千多年人群中,都有隆林人的成分。一万一千年时,广西人跟福建人、东南亚人很不一样,有自己的特点;直到六千多年,广西人已跟东南沿海、东南亚人群发生了频繁的基因交流时,这些特点仍然存在,说明以隆林人为代表的人群并不是偶然出现的。
到了历史时期人群那里,就看不到隆林人的成分了,而是具有南北方人群的特点;如果跟现今人群进行比较,会发现历史时期人群跟侗傣和苗瑶人群直接相关。这项研究在《Cell》发表之后,国际同行也在《Cell》写了一则专门评述,点评了它的重要性。
总体而言,古DNA能给我们提供意想不到的结果,使我们发现更多关于人类演化的未解之谜,也让很多过去存在但现在看不到的人群重新浮出水面。
交叉学科视域下的古DNA研究
2022年,受《Cell》杂志之邀,针对生物技术前沿,我们写了一篇关于古DNA技术发展状况及前景的文章。总体来看,古DNA是很典型的交叉学科,研究手段和研究途径是遗传学、生物信息学,但研究问题、研究对象都跟考古人类学分不开。
把不同学科串联起来的关键,就在于研究的问题;解决这些问题,需要所有相关学科的合作。正因如此,交叉学科具有独特的优势,它鼓励创新性思维,鼓励不断探索。在交叉学科视域下,古DNA研究产生了重要的影响,像2022年的诺贝尔生理学或医学奖,就授予了这个领域。
我们也可以看到,在交叉学科以及相关的基础研究中,自由探索是非常重要的。正是自由探索的精神,让我们保持好奇心,不给自己设限,不断去思辨、去质疑。科研最有魅力的地方,就是探索未知。很幸运我最终找到了感兴趣的方向,选择了热爱的事业。即便一些同学还没有搞清楚自己的兴趣点,我认为最重要的就是怀抱梦想、追寻梦想,在追寻的过程中做好当下、了解自己,把想法变成行动,一点点去实现。在这个过程中,我们会面对各种挑战,痛苦而又快乐地成长。
本文来自复旦大学管理学院主办的“我们︱WOMEN”2023复旦科创先锋论坛主题演讲,演讲嘉宾:付巧妹(中国科学院古脊椎动物与古人类研究所研究员、分子古生物学实验室主任)