人类生物学的研究人员将以大数据
西蒙斯的研究人员领导的多年研究中心数据分析)版(一个升级档和主要大学和医学院了实质性的新领域,建立基因如何一起工作在144个不同的人体组织和细胞类型在执行这些组织的功能。
摘要网上公布自然遗传学4月27日,也展示了计算机科学和统计学方法可能合并汇总和分析非常大中型惊人diverse-genomic“大数据”的集合。
副主任由Olga Troyanskaya基因组学,版在一个升级档团队收集和集成数据从38000全基因组实验(估计有14000的出版物)。不仅这些数据集必须包含信息细胞的RNA和蛋白质功能,但也从个人信息诊断出患有各种各样的疾病。
通过综合计算分析,研究者首先孤立中包含的功能基因联系这些丰富的数据集不同的组织类型。然后,结合组织功能信号与相关疾病的dna全基因组关联研究(GWAS),研究人员能够识别统计之间的关联基因和疾病,否则是无法觉察的。
由此产生的技术,称为“network-guided协会研究,”或NetWAS,因此集成定量遗传学功能基因组学增加GWAS的力量和识别潜在的复杂的人类疾病的基因。因为技术是完全数据驱动,NetWAS避免偏见better-studied基因和途径,允许发现新奇的联想。
SCDA主管莱斯利·格林加德说,“奥尔加和她的合作者已经证明了非凡的结果可以通过合并深生物见解与最先进的计算方法,并将它们应用于大规模、嘈杂和异构数据集。”
他们的努力的结果是144功能基因相互作用网络等器官肾脏,肝脏和整个大脑。本文继续描述功能基因中断疾病,如高血压、糖尿病和肥胖。
重要的是,尽管这些功能基因相互作用网络已经在动物模型建立,这一壮举尚未完成不可能完成的,没有“大数据”——在人体组织。许多人类细胞类型重要疾病不能由传统的直接研究实验,所以能够使用这些丰富的数据集是一个关键的解决方案。
“人类生物学的一个关键挑战是基因电路在人类组织和细胞类型很难研究实验,“Troyanskaya说,他也是计算机系的教授和普林斯顿大学Lewis-Sigler整合基因组学研究所。“例如,足细胞在肾脏,肾脏的过滤功能不能被孤立的研究实验室,也不能由公司确定的基因的功能实验。但我们需要了解蛋白质相互作用在这些细胞如果我们想要理解和治疗慢性肾脏疾病。我们的方法开采这些大数据集合构建地图的足细胞的基因电路功能的细胞,和许多其他disease-relevant组织和细胞类型。"
这些发现具有重要意义对我们正常基因功能的理解,而且对吸毒和发展:因果或目标基因治疗可能是更好的识别,和先前未被发现的药物相互作用和中断可能预期。“生物医ob欧宝直播nba学研究人员可以使用这些网络和通路,他们发现理解药物作用和副作用的上下文中具体disease-relevant组织,并重新药物,”Troyanskaya说。“这些网络还可以帮助了解各种工作和协助开发新疗法治疗。”
研究人员还创建了一个在线资源,以便其他科学家可能使用NetWAS和访问组织网络。公司团队创建一个交互式服务器,综合分析网络组织,或者巨人。巨大的允许用户探索网络,比较多基因电路不同的组织,从基因研究和分析数据找到引起疾病的基因。
亚伦k . Wong和版数据科学家一个升级档前普林斯顿大学计算机科学系的研究生,率先创建巨人。“我们的目标是开发一个资源易得的生物医学研究人员,”他说。ob欧宝直播nba“与巨人,例如,研究帕金森病可以搜索黑质网络,代表了大脑区域受到帕金森症的影响,确定新的基因和通路参与疾病。”Wong is one of three co-first authors of the paper.
论文的其他两个co-first作者Arjun Krishnan, Lewis-Sigler研究所博士后研究员;凯西·格林,达特茅斯学院遗传学助理教授,博士后Troyanskaya集团从2009年到2012年。其他关键的合作者在本研究Emanuela Ricciotti,阁楼a .菲茨杰拉德Tilo粗俗的药理学系主任和转化医学研究所,佩雷尔曼医学院的疗法,宾夕法尼亚大学;丹尼尔。这样的布莱根妇女医院和哈佛医学院波士顿;普林斯顿大学和卡拉Dolinski Lewis-Sigler研究所。
“这是一个激动人心的时刻在生物医学研究中,我相信我们仍然处于发展ob欧宝直播nba的初期阶段考虑生物网络及其控制的新方法,”格林加德说。