编码项目:耶鲁小组在人类基因组的混乱中找到了秩序
9月5日公布的庞大的DNA元素百科全书(ENCODE)显示,人类基因组比十年前预想的要丰富和复杂得多。在该杂志发表的一篇关键支持论文中自然耶鲁大学的马克·格斯坦(Mark Gerstein)是阿尔伯特·l·威廉姆斯(Albert L. Williams)生物医学信息学教授。
科学家们表明它不仅仅是基因,而是制造的网络人类基因组动态的。
“我们现在有一个让我们人类的零件清单,”Gerstein说。“我们在做什么是弄清楚如何运作的接线图。”
格斯坦发现的是一个监管网络它具有类似于社交网络或《财富》500强公司的组织结构图的属性。利用复杂的数学模型,他的团队追踪了50万瀑布分子相互作用由119个转录因子触发,这些特殊的基因可以同时激活或沉默数千个基因。该模型显示,这些转录因子以一种分级的方式连接在一起,一些因子像高层管理人员一样运作,一些因子像中层管理人员或车间领班。它们共同控制着人类基因组中的大约2万个基因。
必要,这层次结构在“中间经理”的水平上创建信息流瓶颈,Gerstein的团队展示了一起工作,以更有效地调节目标基因缓解瓶颈。格斯坦说,这意味着人类基因组的组织要比自上而下的军事指挥系统民主得多。
然而,“主管”转录因子是否倾向于在驾驶等关键功能上具有最大的影响力基因表达,也与不同分子网络中的其他基因有更好的联系。为了证明它们对生存的重要性,这些“管理者”在人群中往往更加保守。
Gerstein指出,人类基因组的大小和灵活性使其与到目前为止所研究的许多其他生物不同。模型生物如蠕虫或苍蝇具有更简单的图 - 接近基因的交换机样启动子是其所有调节的原因。但是,编码项目显着显示有数百万个更远的元素,称为增强剂,可以影响远处的人类基因动作。Gerstein的团队发现,增强剂监管的网络往往与附近的启动子规定的网络不同。
格斯坦说:“这个接线图给我们提供了一个框架,来解释许多个人基因组的变异,这些变异并不直接影响基因。”
耶鲁大学的主要贡献者包括严昆桥、程超、穆新孟、Ekta Khurana、Joel Rozowsky、Roger Alexander和Sherman Weissman。
这项工作是由国家人类基因组研究所资助的。
在基因组中,性别确实很重要
耶鲁大学研究人类基因组的研究人员说,他们现在可以知道我们每个人的“妈妈”和“爸爸”的基因活跃程度。
这些性别特异性的标记可能并不能决定哪位父母可以为其后代的成功或缺点负上责任——或者负上责任;然而,它们可以帮助解释人类群体的差异。
“我们现在可以跟踪妈妈和爸爸的相对遗传贡献,”格斯坦说。
所有人类都出生在母亲和父亲中的一个基因组 - 一个副本。然而,有时只有其中一个副本或等位基因,最终成为特定基因的生物学活性。基于对编码项目产生的大量数据的分析,耶鲁研究人员观察到这发生的10%至20%。研究人员没有分析这些母体和父亲特定基因和监管网络的功能。但是,他们确实注意到这些“性别特定”网络往往比其他网络更快地发展。
“也许,它们解释了我们在个体间看到的差异,”格斯坦说。
化石DNA在当代人类基因组中复活
在探索人类基因组的过程中,发现了一些奇怪的现象,其中包括假基因——化石DNA的延伸,活跃的生物历史的进化残留物。耶鲁大学的研究人员利用复杂的数据挖掘和统计模型发现,这些基因中有许多可能并没有完全死亡,正如他们在《科学》杂志上所报告的那样基因组生物学。
这些古老的基因不再为执行生命功能的蛋白质编码。然而,耶鲁大学的研究小组显示,其中许多rna被复活后产生非编码rna,科学家们现在知道,非编码rna对整个基因组的蛋白质编码基因的激活和沉默至关重要。
“这是自然不会浪费资源的又一个例子,我们在我们基因组的30亿个字母中反复看到这样的故事,”该论文的资深作者格斯坦说。
假基因的存在说明了人类进化可能是如何进行的。这些假基因是从有功能的祖先那里继承来的,但通过各种遗传机制已经过时了。格斯坦的团队发现,这是一个正在进行的过程,一些假基因可能在人类历史上“死亡”的时间相对较晚。然而,与此同时,一些假基因可能已经被恢复,并具有产生微小rna的能力,其中一些可能以有利的方式具有调节活性。因此,科学家们指出,它们仍然保存在基因组中。
进一步探索
用户评论