科学研究

科研进展

从零开始:北京脑中心学者颠覆传统基因演化观点

    |    分享:
2019-03-14

微信图片_20190314103735.png

生命如何起源?生命又将演化成什么样子?达尔文的物种起源对此做了经典的长篇论述。抛开各种细节,达尔文演化的核心理论可以高度概括为:自然选择发现并保留有益突变。


随着现代分子生物学的发展,我们认知到基因组承载了生物的遗传信息。基因组的信息承载元件主要分为两类:基因和调控元件。如果说基因是搭建生命的砖块,调控就是砖块搭建的模式。生物创新来源于信息承载元件的适应性突变。生物创新很重要,乌龟长寿,鲸鱼很少得癌症,这些都是生物创新的结果。


长久以来,是基因还是调控元件驱动了生物创新一直存在争议:芝加哥学派长期支持基因驱动,而演化发育生物学派认为是调控驱动。芝加哥大学的Jerry Cyone教授与杜克大学的Gregory Wray教授在一次会议上进行了亲切而幽默的学术交流,各自口号是“I’m no CIS-sy!(调控流,缺乏男子气概!)”和“Exon,schmexon!(基因流,不入流!)”。


近年来,演化发育学派得到了越来越多的支持。一方面,大量实验数据支持调控在发育过程中的重要性,并揭示了许多新的调控元件和调控模式,例如各种非编码RNA调控和表观遗传修饰;另一方面,传统上认为复制基因(代表人物Susumu Ohno)和基因重组(代表人物Francis Jacob)这两种方式被认为是新基因的主要来源。两者都可以看作是调控的特殊方式。但基因驱动的关键核心角色——de novo基因(de novo gene,意为“从无到有产生的新基因”),仅有零星被鉴定到。而de novo基因的鉴定一直存在误区,快速演化的老基因与de novo基因混淆在一起(统称为孤儿基因),使得de novo基因的研究经常处于高度争议中。


芝加哥大学龙漫远教授是新基因起源与演化领域的顶尖学者,长期致力于新基因的系统性鉴定和研究。实验室在参与国际水稻基因组研究中,偶然发现水稻的孤儿基因数量与复制基因数量相当。“太好了!动物中孤儿基因只占10%,这是一个鉴定de novo基因的绝佳机会!”本研究第一作者,芝加哥大学博士后,现任北京脑科学与类脑研究中心生物信息与计算中心主任的张力兴奋地回忆,“尤其多数水稻近缘物种间的分歧时间只有3-4个百万年,我们将有很大概率追溯从非编码序列到de novo基因产生的每一步过程。”


2.jpg

左是原始情况,右是演化后情况。A是序列同源性丢失,B是基因丢失,C是横向转移,D是趋同演化,也是de novo的一种。E是de novo。但是D和E在现实中区分不开,所以技术上找的是E。


即使在最严格的标准下,粳稻中也有175个de novo基因。这个发现颠覆了传统上认为de novo基因数量稀少的观点。这是因为,一直以来de novo基因的研究存在不小的难题。要证明一个基因是de novo基因,需要来自几个密切相关物种的高质量参考基因组,这些基因组显示祖先的、非编码的序列以及随后从它们演化而来的新基因。没有这条清晰可见的演化路线,就没有办法证明它是真正的de novo基因。而先前报道的假定de novo基因可能只是一个“孤儿基因”——在某个时候从不相关的生物体中分离或转移,然后其祖先的所有痕迹都消失了。


一个直接的挑战立即跳出来,如何证明这些de novo基因是有功能的?首先,它们具有完整的基因结构,在水稻近缘物种不同组织被转录。更为令人兴奋的是,在从非编码序列到完整蛋白序列的关键转变过程中检测到明显的正选择信号,这意味着de novo基因的确是有功能的。


但是,能不能提供更直接的证据例如翻译信号来支持de novo基因有功能呢?de novo基因表达量低并且富集在花粉中,公共蛋白组数据库中仅能找到个位数的证据支持。龙教授跟华大基因刘思琦教授偶然间讨论到,MRM(multiple reaction monitering)质谱可以解决这个难题。但是样品从哪里来呢?华中农业大学欧阳亦聃教授团队在海南种植了自己的水稻,进行了高质量的样品收集工作。在各团队的通力协作下,最终有超过50%的de novo基因被检测到翻译信号。“我们通过人工合成多肽,严格证明了蛋白组证据的可靠性!”本研究并列一作、华大基因的任艳博士非常有信心。


本研究最终发表在Nature Ecology and Evolution,并得到评审的高度评价,“这项研究解决了领域内长期存在的若干争议,显著推动了领域的发展”。


这是迄今为止最大最可靠的de novo基因数据集,将是基因驱动生物创新的重要入口。未来围绕这些de novo基因的研究将让我们有机会建立de novo基因起源与演化的系统性理论框架,为蛋白质演化和促进生物多样性提供一种全新的、未被探索的方式。不仅如此,这个发现直接冲击了现有的演化理论框架。为什么植物中的de novo基因如此之多,动物中却很稀少?进一步的研究将在系统层面推动基因演化理论的发展。


参考资料:

1、http://science.sciencemag.org/content/321/5890/760/tab-pdf

2、https://phys.org/news/2019-03-genes-evolve-protein-diversity.html

3、https://www.nature.com/articles/s41559-019-0822-5?from=singlemessage&isappinstalled=0