古人类学家摆弄着一块块化石,研究着一个个头骨,从中解读人类起源与演化的秘密。分子生物学家却发现,原来人类演化的秘密隐藏在DNA中。从一个线粒体、一条Y染色体就可看到人类演化的足迹。
撰文/李珊珊
古人类学经过了上百年的研究,虽然对人类的起源和演化勾画出一个大致的轮廓,但由于化石的缺失,人们一直不能得出一个一致的结论。根据部分化石证据,主流的人类学家曾经倾向于人类起源的多地区学说,且留下了一个个谜团。分子生物学诞生之后,让人们有了新的视角,也看到了新的希望。实际上,人类演化的足迹不仅留在化石之中,也刻印在现代人的基因等生物学特征上。
基因组是部“天书”,人类的每一滴血里都包含着一部用基因语言写就的历史书,解读基因中人类起源与演化的信息,构成了分子人类学的主要内容。这门学科虽然起步较晚,但一出手就身手不凡,已经给原有的人类学造成了巨大的冲击。
金力教授领导的复旦大学生命科学院现代人类学教育部重点实验室在分子人类学方面做了大量研究,所得出的结论向“东亚地区独立起源说”提出了巨大的挑战。分子生物学究竟是如何研究人类演化的?为此我们采访了金力教授。
看金力教授的办公室就知道他是个爽朗、精力充沛的人。他面前是张巨大的办公桌,桌上层叠地散放着各种资料。采访中他随手拿起一本杂志,扉页背面便是著名的DHPLC技术(变性高效液相色谱技术)的整版广告—这项技术是由他和美国斯坦福大学的几个同事发明,并成为上个世纪90年代中期开始的大规模进行分子人类学研究的催化剂,现在也是突变检测领域的主流技术。
从这项技术开始,金力教授向我们介绍了分子生物学如何研究人类的演化以及他本人的一些研究工作。
用倒霉的兔子滴血验亲
20世纪60年代,分子人类学还不具备研究DNA序列的技术时,已经有科学家开始用生物化学的方法来探索人类的起源了。
当时科学家注意到,当外来的细菌等异物进入到动物体内时,生命系统为了自我保护,某些部分会被激活以清除这些异物,这就是机体的免疫机制。例如,把人类的某种蛋白质注射到兔子体内,兔子体内很快会产生一种抗体,这种抗体与被注入的人蛋白结合在一起,以便去除这种异物。异物(抗原)第一次进入体内时,生命体制造抗体需要花一段时间,但下一次同样的抗原再进入身体的时候,身体就会迅速做出强烈反应。如果此时与原来的抗原稍有差异的蛋白进入体内,机体也会做出反应,只是强度会有所减弱,差别越大,反应越弱。
那么,我们能不能应用这种免疫反应的强度变化来检测人和类人猿之间在遗传上的差异呢?最先想到这个问题的是美国韦恩州立大学的生化学家莫里斯·古德曼(Morris Goodman)。
古德曼作了一个设想:用一只倒霉的兔子来比较两种动物之间的遗传学差别。具体的方法是:首先从要进行比较的动物A和动物B体内提取血清蛋白,并纯化;然后把A的血清蛋白注射到兔子体内,使之产生针对A的血清蛋白抗体;再从兔子体内采集到这种血清蛋白抗体,把它与B的血清蛋白混合在一起,通过检测这一抗体与抗原之间的反应强度来测定A和B之间的遗传距离。
这听起来颇有点滴血验亲的味道。1962年,古德曼首次利用这一方法对人类和猩猩的遗传关系远近进行测试,当时的结论是:与人类亲缘关系更密切的是黑猩猩和大猩猩之类的非洲类人猿,而亚洲猩猩与他们比较起来和人类的关系较远。这一结果显然激起当时分类学家的不满。按照当时的分类,黑猩猩、大猩猩和猩猩同属猩猩科,而人属人科。一个生化学家竟擅自更改生物的分类方法,如此的超越被视为侵犯他人研究领域的可耻行径。正是这一行径,古德曼开创了一个完全不依赖于化石来研究进化的新时代。
美国加利福尼亚大学伯克利分校在读人类学的研究生萨里奇与同校的生化学家阿伦·威尔逊(Allan Wilson)看到了这种方法的重要意义,他们继续了古德曼的工作,进行了比古德曼的方法精度更高的实验。两人用数字定量地表达了不同生物物种之间蛋白质抗原的差异。这样,在他们的实验中,不仅尝试着确定了不同动物分支的分化顺序,而且他们证明并引入了一套分子生物钟的方法,即用蛋白质结构差异和演化速率来试图确定分化的年代。最终得出结论:人类是在从非洲类人猿中分化出来后的短短500万~600万年的时间内进化到现在这种状态的。在当时,早于400万年前的人类化石非常稀少,化石的证据还是空白,只是近10年来,人们才不断发现更早期的人类化石,证明当时的结论基本是正确的。
寻找线粒体夏娃
自从人们掌握了DNA的测序技术,解读基因中的详尽信息就有了可能。人类的基因是一代一代传承下来的,尽管不同的人的基因稍有差别,但全世界的人类基因组中有99.9%是相同的。在人类的进化过程中,某些基因会发生变异,并被遗传下来,这就在基因中留下了印记。这些印记既可以分出不同的人群,也可以按照变异的速率推算出不同人群分离的时间。
人类的基因组有多达30亿个碱基对,不同人群中的一些基因变异在通婚过程中相互交叉,很难确定哪些变异可以作为人群的标记。但人们发现,人体细胞内的线粒体DNA既简单又在遗传过程中不发生重组,线粒体只来自母系的遗传。换句话说:你的线粒体只能来自你的母亲,在线粒体的传宗接代过程中,男性不起任何作用。线粒体的DNA自身也发生突变,但发生突变的速率基本是不变的,这样,我们就有可能区分不同的人群,而且还能确定人群分离的时间。
又是这位敏锐的威尔逊认识到线粒体在人类学研究中的价值,决定去收集世界各地的线粒体,从DNA数据中了解人类祖先的女人生活在什么时代、什么地点等。威尔逊的研究组研究了来自非洲、亚洲、澳大利亚土著、新几内亚以及欧洲人在内的147个人的线粒体DNA后,利用她们线粒体DNA的差异构建了一棵“进化树”。
这棵进化树的显著特征是被分为两大分支:一个分支包括非洲人,另一个分支包括非洲人、亚洲人、澳大利亚土著人、新几内亚人和欧洲人。这也就有力地说明了,“很有可能是非洲人中有一部分人由于某种原因而扩散到了亚洲和欧洲”。
威尔逊根据来自世界各地的妇女们的线粒体之间的碱基对的差异,构建出了一棵人类线粒体DNA的进化树,在进化树上,古老的分支靠近根部。在这棵进化树的根部,有一个线粒体DNA的总分叉点,位于这一分叉点的女子就是我们所有现存人类的线粒体祖先,即我们的线粒体夏娃。根据他们当时的推算,这一分叉点出现在距今15万~25万年前。
这是否说明,我们找到了共同的母亲呢?也许,在20万年前的非洲草原的某个部落里,出生了一个普通的女婴。女婴既不是特别的聪明、也没有特别的勤劳或美丽,她只是平凡地长大,生育了很多子女。然而,在随后漫长的岁月中,也许由于灾变,也许由于混战,结果,其他的线粒体家族一个又一个地倒下了,世界上剩下的只有这个女婴的后代,而一个单一的线粒体家族从此确立。这个幸运的女婴就成为我们共同的线粒体母亲—线粒体夏娃。
当然这只是一种推测,2000年《自然》杂志上发表的文章说,更精确的结果显示,我们的始祖母亲出现于14.3万年前;而到了2004年,美国科学家最新的研究显示,线粒体可能进行重组,所以有关线粒体的关键科学假设可能存在问题,使得追溯人类母系祖先所用的“分子钟”受到了挑战。科学便是在这样不断的反复中得到了发展。
M168:地区起源说的终结者
最初,威尔逊根据线粒体DNA的证据提出的“非洲起源说”并不能为主流人类学家所接受。到1991年7月,威尔逊因白血病去世时,他仍是个争议人物。“非洲起源说”认为我们现代人的祖先全部来自非洲,这是个太过肯定的假说,他的证明不可能单靠简单举证来进行,即使再多的理由,只需一个反例,就足以推翻整个理论。
直到有了新的实验方法,事情才开始出现转机。1995年,美国斯坦福大学的著名分子人类学家卡瓦利-斯福札(Luigi Luca Cavalli-Sforza)教授出版了他的新书《人类基因的历史地图》(The History and Geography of Human Genes)。这本有趣的书中提到了各个地区不同的人群的不同遗传结构,还展示了很多根据人群基因的差异画出的五彩斑斓的地图。这本书很快引起了当时也在卡瓦利-斯福札实验室的几个年轻人的注意,其中有皮特·昂德希尔(Peter Underhill)以及当时也在卡瓦利-斯福札实验室进行博士后研究的金力等。
几个年轻人考虑到,《人类基因的历史地图》中大量使用的是常染色体的相关数据,但因为常染色体的大量重组,使得我们的有效信息量很不够;而威尔逊的成就在于选择了当时认为很难发生重组的线粒体DNA。那么,我们为什么不选择有更长的不重组区域的Y染色体呢?
线粒体完全继承自母亲(无差别地遗传给儿女),但是Y染色体是男性独有的,它只会遗传给儿子,而且在遗传过程中不与其他染色体发生交叉重组。Y染色体中可能记录着人类演化更详尽的信息,只要打开这本“书”,就可能揭示人类演化的秘密。
怎样打开这本书呢?按照他们当时的设想,对于序列长度比线粒体长得多的Y染色体(线粒体16000个碱基对,Y染色体5000万个碱基对),很难像对线粒体那样利用直接序列比对的方法,所以只能寄希望于利用人群的特征遗传标记进行研究。
按照群体遗传学原理,当少数个体从原群体中迁移繁衍而形成新的群体时,会发生遗传漂变现象,使得新群体中只出现原群体的部分基因型。有效的群体数目越小,这种遗传漂变的效应就越明显。所以,人群中的相对数目较小的Y染色体也就更容易在小部分人群迁离非洲时发生遗传漂变,只出现特征的基因型,从而出现我们需要的遗传标记。因此,他们决定对Y染色体上的遗传标记进行大规模的筛选和研究。
如果某个原始基因在人类走出非洲之前便发生了突变,他的后代便都带有突变后的基因。这种突变后的基因型我们称之为“突变型”,未发生突变的原基因型称为“野生型”。如果我们能发现某个位于进化树根部的突变型(部分非洲人携带这种突变型,但非洲以外的人群全部携带这种突变型),那么我们就可以判断:这个突变产生于人类走出非洲之前,而且只有突变型被带出了非洲。这个突变位点就可以作为人类走出非洲时携带的遗传标记来证明“非洲起源说”了。
但受当时实验技术的限制,Y染色体上的标记还很少,要想完成上述的设想,必须要求实验技术上有较大的改进。几个年轻人便发明了一种促进分子人类学发展的重要工具:DHPLC—变性高效液相色谱技术。DHPLC廉价、快捷,不需测序即可进行基因序列比较,它可以快速地富集和检测突变位点,这正是当时分子人类学最需要的实验工具。在这种技术下,那些特定的突变型如同拜寿人家馒头上的红点,一目了然。
2000年,昂德希尔对来自世界范围内不同地区的1062个Y染色体样本进行研究,勾勒了一个全球人群遗传结构的地理分布图。在这个分布图上,非洲存在着现代人最古老的分支,而更年轻一些的进化分支则分布于非洲以及非洲以外的所有地区。
根据他的研究结果,在8.9万~3.5万年左右,Y染色体上的某一位点发生了从碱基C到T的突变,从而产生了一个M168突变型。M168突变型在部分东非人群中和非洲以外的人群中普遍存在,所以M168就可以作为我们走出非洲迁徙的遗传标记。
当时对非洲起源说的质疑主要集中在东亚。根据大量古化石证据,在东亚(如中国、东南亚等)这块土地上,人化石不仅在解剖学上与现代东亚人具有连续性,而且化石在时间和空间的分布上也有一定的连续性,现代东亚人究竟来源于非洲,还是具有独立起源的问题悬而未决。
当时,金力和他的学生意识到“非洲起源说”是个太强的命题,能否反过来尝试证明一个较弱的命题,即如果现在活着的现代人不都是非洲人的后代,而是非洲人群与当地人发生融合,那么,就能够在东亚地区找到非M168突变型的野生型或其他突变型,这样就可以找到原始人群与非洲人群融合的证据。
金力教授领导的小组对来自东亚163个群体的12127个Y染色体样本进行了大规模的筛选,希望能从中找到比M168突变型更古老的基因型。然而,最终的分析结果显示:这1万多个Y染色体样本共分为三种突变型:M89、M130和YAP,但最初都来源于M168突变型。东亚地区没有发现一例个体具有比M168更古老的突变型,结果基本上否定了独立起源说,甚至融合说。
据说,他与学生们后来做了一个统计,结果显示:如此大规模的采样,东亚独立起源的分子证据存在却没有被采集到的几率大约只有一百万分之一。也就是说,如果这仅仅是巧合,那“我们差不多可以去买彩票了”。
结果虽然令人兴奋,这也为我们留下了一个难题:原来的北京猿人等东亚直立人哪里去了?原来欧洲的尼安德特人哪里去了?我们目前只能虚构他们灭绝的场景了。
刻画东亚人群的遗传结构
对于“东亚现代人走出非洲”这个命题,金教授认为已经毋庸质疑,他们现在的兴趣已经主要集中在了怎样描述和刻画东亚人群的人群遗传结构。
对东亚人群而言,遗传结构主要体现在南方东亚人和北方东亚人之间的遗传差异,这些差异几乎在绝大部分位点都存在。“下一步我们希望知道的是产生东亚人群差异的机制是什么?此时,我们要研究的有三种机制:起源、迁徙(重大迁徙事件)和与环境的相互作用。”此时,金教授再次很自豪地说,“起源方面已经不再是遗传学上的主要问题”。
这种对遗传结构的刻画大量结合了语言学、民族学、历史地理学、考古学等各个人文领域,他举了自己曾经做过的汉藏同源方面的研究的例子:Y染色体的分析结果与汉藏语言学的分析结果一致显示,汉藏民族的差异大约需要6000年左右的时间积累起来。
而另一部分,人文科学里不足以解决的问题,利用遗传学的工具则可以很好地给出比较确定的结果。他们近期在汉文化扩张方面的研究工作便是很好地解决了一个人文科学方面的难题。
“中国南方的方言很多,北方则很少”,语言学上普遍认为这种差异一方面可能来源于地域上的隔离。因为汉文化在不同时期的渗透,方言所保留的可能是汉语在不同时期的主要特征;另一方面来源于当地的原住民语言,方言的基础是汉语,但某些词汇可能是典型的少数民族语言,如上海话中的“侬”在傣语中的意思是“人”,而汉语里没有这个词,这可能意味着长江三角洲地区原来是不说汉语的。
而对于南方汉化的成因,一种猜测是来自汉人的统治,导致语言的扩散;另一种猜测是来自大规模移民,通过人群迁徙进行文化迁徙。上述人文科学中的争议完全可以用遗传学的方法解决,我们只需要看一下南方汉族的基因中,有多少与北方汉族的基因一致。
遗传分析结果显示:南方汉族的基因中大约包含80%的北方汉族成分,如果把父母系分开,父系里大约有90%的北方汉族的贡献,而母系中大约有50%左右。这一结果说明了汉文化的扩散伴随着大量的人群迁徙。
结果出来后,金教授咨询了复旦大学历史地理研究所的周振鹤教授,从而得知这一结果在历史界早有共识。北方的汉民族在历史上经历了三次向南大迁徙:西晋、唐朝的安史之乱以及宋朝。
这一结果发表在了2004年的《自然》杂志上,金教授表示,希望通过这方面的研究,令西方的同行们看到,我们汉族的祖先不是侵略者,北方汉民族的迁徙历史不是强势民族好战南征的历史,而更有可能是受游牧民族驱赶的颠沛流离的移民史。
2005年4月,金力教授领导的实验室参加了美国国家地理与IBM联合发起的“基因地理计划”,并担任了东亚/东南亚部分的协调人。就在两个月前,他们的采样团队刚刚从老挝采集了1500个样本,覆盖整个老挝;不久,他们还将对整个东南亚进行大规模采样。正如金教授所说:“今天的中国不仅仅是一个经济大国,而且是一个政治、科技大国,作为一个科技大国的主要特征是,我们要走出去领导相关领域的发展,这一点是我们的责任。”而作为这一领域世界上最好的实验室之一,他们将义不容辞地承担起对整个东亚区人群遗传结构的研究工作,承担起这一领域的领导责任。
[《科学世界》]