团队将人类基因组的大小降低至19,000个基因
如何代谢营养素以及神经元在大脑中的沟通方式是由构成人类基因组的30亿字母编码的一些消息。本大量信息中存在的基因的检测和表征是自身人类基因组项目十多年前的第一次系统尝试以来一直是正在进行的辩论的源泉。
由西班牙国家癌症研究中心(CNIO)基础研究副主任Alfonso Valencia领导的一项研究,以及结构计算生物学集团的主管部门,研究员迈克尔·蓬勃发展者,更新人类基因的数量 - 组合物可以产生蛋白质 - 19,000;比最近注释中的基因减少1,700个,远低于100,000个基因的初始估计。在期刊上发表的工作人类分子遗传学据总结,几乎所有这些基因都有5000万年前的灵长类动物在出现之前的祖先。
“萎缩人类基因组“这就是valencia如何在本作约19,000名人类中终止于人类基因组中的蛋白质编码基因的数量的连续校正。”产生的基因组的编码部分“蛋白质是不断搬家的,“他补充说:”几年前没有人可以想象,这样一个少数基因可以使东西如此复杂。“
科学家始于分析蛋白质组学实验;蛋白质组学是检测蛋白质分子最强大的工具。为了确定人类蛋白质的地图,研究人员从七种大规模质谱研究中综合数据,来自50多个人组织,“为了验证哪种基因真正确实产生蛋白质”的瓦伦西亚。
少于十个新的基因分开老鼠和男人
结果达到了超过12,000多种蛋白质,研究人员将这些蛋白质映射到基因组的相应区域。他们分析了数千个在人类基因组中注释的基因,但这并未出现在蛋白质组学分析中并结束:“应该产生蛋白质的1,700个基因几乎肯定不会出于各种原因,因为它们没有展示任何蛋白质编码特征,或因为守恒的阅读框架不支持蛋白质编码能力,“Tress说。
源自该研究的一个假设是超过90%的人类基因产生源于十亿多年前的动物王国的美唑烷或多细胞生物的蛋白质;这些基因的数字超过99%,这些基因占据了5000万年前的灵长类动物的出现。
“我们的数据表明,基因和蛋白质水平的人和灵长类动物之间的差异非常小,”研究人员说。瓦伦西亚实验室的作者和研究员David Juan说,“自从灵长类动物分裂以来,从小鼠中分离了人类的新基因的数量甚至可能少于十。”这种对比具有500多种的人类基因,起源以来的起源是可以在当前注释中找到的。研究人员得出结论:“灵长类动物之间的生理和发育差异可能是由基因调控引起的,而不是蛋白质的基本功能的差异。”
减少做更多
人体复杂性的来源更像如何使用基因而不是基因数量,在蛋白质中发生的数千个化学变化或通过基因组的非编码区域控制这些蛋白质的产生包括整个基因组的90%,并且已在国际编码项目的最新调查结果中描述,这是瓦伦西亚团队参与的项目。
这项工作带来了数量人类基因接近其他物种,如线虫蠕虫Caenorhabditis elegiss,蠕虫距离距1mm长,但显然比人类更不复杂。但瓦伦西亚更喜欢比较:“人类基因组是最好的注释,但我们仍然相信1,700基因可能必须重新注释。我们的工作表明,我们必须重做所有基因组的计算,不仅是人类的基因组。“
研究结果是Gencode的一部分,该部分是集成在编码项目中,由来自世界各地的研究小组形成,包括瓦伦西亚团队,其任务是提供人类基因组中所有基因的元素的注释。
“我们正在通过Gencode讨论我们的数据,以将其纳入新的注释。当这种情况发生时,它将重新定义人类基因组的整个映射,以及瓦伦西亚癌症基因组分析的宏项目中的使用方式。
进一步探索
用户评论