来源: 发布时间:2016-01-21
本刊记者 钱朝军
从上世纪六七十年代奥地利学者孟德尔根据豌豆杂交实验提出遗传因子概念,总结出孟德尔遗传定律,到1990年10月人类基因组计划在美国正式启动,已经历了百余年。
1999年9月,中国加入人类基因组计划。这项堪比生命科学“登月计划”的行动于2001年宣告完成——首次绘成人类基因组“工作框架图”,包括中国在内的6个国家元首共同向世界宣布这一人类历史上认识自身的重大科研成果。而与此同时,各国发表联合声明,呼吁将人类基因组研究成果公开,以便世界各国的科学家都能自由地使用这些成果。从那时起,基因研究的大路愈发宽阔。
也就在此时,王希胤正式走进基因研究的大门,“当时也做了一些人类基因组的工作”,而他的身份还是北京大学的硕博连读研究生。选择了自己衷爱的科学研究,这一路他走了15年,从学生到老师,从研究小组负责人到院长,实现了角色的成功转变。而回报给他的是:人类和其他物种“生命之书”的神秘画卷正在徐徐展开。
做一些有意思的事儿
2000年,吉林大学数学系毕业的王希胤当了5年老师后,学校同意老师继续深造,这一机会让他迎来人生重要转折。如今回忆起,他也认为,“这个转变对我来说非常好”。自己得以参加全国研究生统考,并最终走进北京大学生命科学学院,走进基因组生物信息学的园地。
刚进北大时,王希胤学的是生化与分子生物学专业。“当时,生物信息学还不能作为一个独立的学科,所以作为一个方向附属于生化与分子生物学专业”。面对学科的转变,他非但没有感觉到吃力和不适应,反而觉得独具优势,“能把我在数学上的一些优势和生物学结合在一起”。这种多学科结合,还包括他大学时打下了很好的物理学基础,后来又自学了计算机、自动化理论,学科交叉的优势在科学探索的过程中日益凸显,“使得我可能看得更深入一些、想得稍微全面一些”。
当时在北大,王希胤在导师的带领下,和华大基因合作,参与到了水稻RNA和基因组结构分析的工作中。当时学界围绕水稻基因染色体加倍的现象展开了激烈的讨论,王希胤也参与其中。他向记者讲述了这一“有意思”的发现。
大约在数千万年之前,水稻发生了一次大范围的基因加倍的现象。当时国际上有两个知名研究组利用水稻的粳稻亚型基因组序列在开展研究:一个是比利时Van de Peer的研究组,一个是美国的Paterson研究组。比利时组发文章称,水稻不是基因组加倍,而只有部分染色体加倍。美国研究组则认为,这是一次全基因组的加倍。
没有研究就没有发言权,王希胤与合作者在导师的带领下,以水稻的另一亚型—籼稻作样本也开展了相关研究,2005年临近博士毕业,这项研究也有了结果。他的研究发现,禾本科的祖先物种在至少七千万年前原有7条染色体,经基因组加倍一夜间变成了14条。王希胤将发现的结果撰文总结并投稿,很幸运的是,文章很快被英国顶尖学术杂志New Phytologist接收。
恰逢毕业,如果需要继续做博士后研究,就得自己联系导师。循着兴趣点,他打算按投稿文章的方向联系出国做博士后研究,其中就联系了美国乔治亚大学的Andrew H. Paterson教授,也就是上面所提到的两个研究组之一的负责人;Paterson教授是物理图谱理论的创始人,在学术上有很高的造诣。通过电子邮件取得联系后,很巧的是,Paterson教授正在给他的文章写评论,准备在王希胤论文发表的同一杂志的同期发表一篇评论,对中国的这一研究给予肯定和高度评价。因为学术观点一致,Paterson教授非常欣赏这位来自中国有独到见解年轻学者,欢迎王希胤到他的实验室做博士后研究;这一小插曲很多年都为Paterson教授所乐道。
2005年对王希胤来说是“三喜临门”——博士顺利毕业、小孩出生、到世界著名的植物基因组学实验室做研究。2006年2月,怀着满心欢喜,他去到乔治亚大学植物基因组图谱实验室做博士后研究。年轻的王希胤在这所国际顶尖实验室里如鱼得水,开展了多个作物基因组的研究工作;超群的学术能力也得到导师的赞誉和认可,2009年3月,王希胤已经能独当一面了,升任助理研究员,作为实验室的生物信息研究组的组长,开始领导一个10多人的、由博士后和博士研究生构成的研究小组;而且,他从此担任了多种重要经济和粮食作物(西红柿、棉花、白菜、油菜、甘蓝、花生、桑树、甘蔗、芒草)基因组测序大型国际合作项目中的比较基因组学分析首席科学家。王希胤的想法很简单,“我就希望在基因组方面能做一些事情,有一些发现”。
基因研究的重要发现
王希胤反复提到,科学发现的根源在于兴趣。对基因研究的兴趣让他沉浸其中,找寻到发现的乐趣。
王希胤对禾本科作物8种植物10个基因组进行了细致的比较,并有了一些“有意思的发现”——水稻竟然是进化最慢的物种,并且更新了禾本科植物进化史主要事件发生的时间。
很早以前,科学家基于有限化石证据推测,恐龙是不吃草的,因为在恐龙灭绝时,草还没有产生。但从新发现的恐龙腹中花粉的化石证据表明,恐龙不仅吃草,而且吃的草已发生了禾本科主要类群的进化和分离。
结合全基因组水平的处于共线性的共源基因分析,基于最新化石证据,王希胤重新确定了禾本科作物的分歧及相关的一些重要进化事件发生的时间:在禾本科植物的共同祖先中近1亿年前发生一次全基因组加倍——即它们共有一个四倍体祖先,禾本科主要类群7000万年分化,也就是麦类和稻属的共同祖先与玉米、高粱及谷子的共同祖先分开了;然后在大约6000万年前稻与麦分歧;4000万年前高粱和玉米的共同祖先与谷子分开;而2600万年前,由于一次(玉米所特有的)全基因组加倍事件,一个新物种玉米产生了,并与高粱分开。这一工作全面更新了禾本科进化时间的描述。在研究的过程中,他还有一个重要发现:禾本科植物中两条染色体,在过去7000万年间,受到基因置换的影响,经历了奇妙而迷惑的进化过程。
基因分析、理论推断、进化溯源……整个过程都让王希胤着迷。兴趣使然,这15年间,他有了很多独到发现和成果。谈及此,王希胤说,自己比较得意的是,他提出了新的染色体数目减少的理论,阐明了真核生物染色体数量减少的理论和分子机制。他对真核生物染色体数目和细胞核型开展了研究。“比如大猩猩有24对染色体,人只有23对染色体,染色体增加和减少的过程究竟是怎样的?”基于植物多倍化后染色体数目增多并在一定时期内减少的情况,他进行了独创性深入的比较基因组学分析,并结合人类等哺乳动物、酵母等真菌的研究,在国际上首次明确提出以染色体端粒为中心的染色体数目减少的理论和具体的遗传学机制。
王希胤给记者打了个形象的比喻,每条染色体两头分别有两个端粒,就好比鞋带两头的“塑料箍”,起到稳定染色体结构的作用。“当时我提出,两条染色体重组后会形成没有端粒的染色体和一个只包含端粒的小染色体。这就是以端粒为中心的染色体数量减少的理论和分子机制。”这一理论,对认识真核生物染色体进化和功能有极为重要的理论和现实意义,是染色体理论上的重大创新性成果。谈到发现的过程,王希胤也坦言,自己“琢磨了好久”,白天夜晚都在思考这个问题。突然有一天晚上,科学的灵感迸发,他想出来了。
融入大数据时代的基因信息学
近年,许多重大科技新突破均源自学科之间的综合交叉融合。学科与学科之间、科学与技术之间、自然科学与人文社会科学之间的交叉、渗透、融合,已成为学科发展的必然趋势。王希胤对此深有感触,他说:“不同学科研究是对人们对客观世界人为的划分,当我们认识一个问题时,常常需要不同的知识,来了解事情的真相。”他提到,DNA测序技术发明人弗雷德里克·桑格是两次获得诺贝尔奖的英国生物化学家,他是学物理的,而最开始他做数学。
他所从事的基因组信息学是现代分子生物学发展的前沿领域,是典型的交叉学科,涉及生命科学、数学、计算机科学和信息科学。其中,生物学问题是该学科的核心,数学与计算机技术则是基本工具。“它是用数理和信息科学的观点、理论和方法去研究生命现象、组织和分析呈现指数增长的生物学数据的一门学科,将数学、计算机与信息科学技术运用到生命科学尤其是分子生物学研究中。”
王希胤说,目前,大数据分析是基因组信息学发展的重点和前沿。伴随着基因组测序成本的迅速下降,基因组信息的提取在广度、深度、特异性方面正在不断发展。在广度上,群体水平的基因组测序已经大面积展开,很快就有数以百万人的基因组得到测序,有望揭示人类重大遗传疾病发生的秘密;主要经济作物如水稻、棉花的亲缘植物整个属的基因组都在进行测序,可望回答最重要的粮食作物一些重大农学问题。在深度上,很多二代测序分析常达到百倍深度,结合不同的测序方法,将可得到最可信的基因组数据;在特异性上,一种特异性组织或一种特异细胞的测序已经开展起来,如精子基因组的测序、卵子基因组的测序、癌细胞基因组的测序等等,为增进人类健康提供强大的新技术支持。
随着大数据时代的来临,基因组信息学这门以大数据的提取、存贮和分析为基本特征的学科率先进入大数据分析时代,这就为研究不断提出新问题新挑战,同时也带来新的机遇。可以预见的是,随着基因组信息学的进一步发展,尤其是产业化突破,将直接改变人类生活的面貌。王希胤说,不仅能为增进人类健康做出贡献,而且能为战胜遗传疾病对人类的影响提供新的手段。现在,以基因组信息学为核心技术的基因产前筛查工作,正在开展起来,新兴的生物信息公司和医疗机构合作,通过对胎儿基因组的分析,判断可能的遗传疾病,为优生优育做出直接贡献。基因组信息学还在婚恋选择、法医学实践、寻亲访祖、分子育种、重要性状基因鉴定、基因组分析软件开发和服务等方面,获得产业化发展。
“在做基因信息学研究时,我最关心的还是生物学问题,关心与人类健康相关的问题,有经济意义的问题。”王希胤一直倡导,以问题为核心做科研。找到问题,然后在自己的知识背景里寻找利用不同学科的知识去解决问题。“计算机编程、算法、数学模型的相关知识必不可少”,他反复提到,兴趣是根本,而且需要不断学习,他认为科研就是一个终身学习的过程。如今,担任生命科学学院院长的他笑言,自己在学科建设、管理中也在不断学习。
以前只做科研,现在还承担事务性工作,王希胤的工作非常忙碌。为了学院建设,很多事情都亲力亲为,为学科建设、科研平台建设等事关学院发展的相关材料都会亲自撰写,然后交由年轻老师一同修改,“这个过程也锻炼了我”。“目前,我们学院建了两个硕士点,一个是医学生物信息学,一个是生物分子组学。后者是国际上第一个明确进行综合性组学研究的硕士点。”“我们还筹建了生物信息学的本科专业,明年开始招生。”这些都是让他为之自豪的事情。这些年,学校对生命科学学院的定位是“试验田”“特区”“科研增长点”,学校对他们寄予了厚望,王希胤坦言身上的压力不小,每天通常是十八九个小时都在工作。他给学院定下发展的目标:通过学科建设、科学研究、人才培养、产业化服务,建成省内、国内知名的生命科学学院。
“趁年轻多做些事情”,王希胤正带领这支平均年龄在40岁左右的年轻团队一起前进,享受发现的乐趣,实现作为一名不断学习、不断探索的科研工作者的价值。
分享到: