斯坦福大学/帕卡德大学的研究人员在废弃的数据中发现了隐藏的疾病基因
斯坦福大学医学院和露西尔·帕卡德儿童医院的研究人员在以前的实验中发现了以前隐藏的肥胖相关基因。这一发现表明,关于许多医学疾病的有用信息可能正在被废弃的数据堆积成山。
帕卡德儿童医院儿科医生、医院儿科生物信息学中心主任Atul Butte博士说:“我们已经设计了一种相当简单的方法,可以将大量现有的原始数据转换为进一步遗传研究的候选疾病基因。”“当我们把这些信息放在一起时,我们不仅能够精确地确定那些已经被确定的,而且我们还提出了一些非常有趣的新预测。”
研究人员通过比较其他研究人员进行的49个独立实验的结果,发现了十多个与肥胖相关的新基因的存在——这些实验本身都没有得出类似的结果。
Butte同时也是医学院的医学和儿科学助理教授,他计划很快调查新基因的生物学作用。ob体育开户网址这项研究发表在10月5日《生物信息学》杂志的提前访问部分。
找出肥胖、糖尿病和自闭症等复杂疾病的新基因元凶是很棘手的。与囊性纤维化不同,囊性纤维化是由一个基因的突变引起的,这些疾病通常是基因和环境因素相互作用的“完美风暴”的结果。这种复杂性使得研究人员只有有限的时间来追求最有希望的结果,而把其他候选结果甩在后面。
管理未使用的数据可能极具挑战性。例如,微阵列或基因芯片实验会产生数以万计的信息。由于大多数科学期刊要求作者将他们的所有数据提交给公开的国际数据库,Butte估计这类数据的数量每年会增加一倍或两倍。
Butte和他的同事,博士后学生Sangeeta English博士,重新分析了49个实验的公开数据,这些实验是用不同的方法在人类、大鼠和蠕虫等各种动物身上进行的。他们撒下了一张大网:这些研究唯一的共同点是,它们都是为了找出对脂肪储存或体型重要的基因或蛋白质。
“我们不做任何假设,”巴特说。“我们相信个别研究人员会为他们的实验提出深思熟虑的模型。我们可能在精确度上失去的东西——例如,由于忽略了物种特有的差异——我们获得了泛化的能力。那些我们认为重要的基因很可能具有根本性的重要性。”
例如,一项实验关注的是一种极其罕见的儿童疾病——早衰症。患有这种疾病的儿童看起来会迅速衰老,通常在十几岁的时候就会死亡。他们也会失去脂肪细胞。“现在,我们不知道这是否与肥胖有关,”巴特说。“但如果它真的与脂肪代谢有关,它可能会对我们的知识有所贡献。”
Butte和English混合搭配成对和小小组的实验,以确定可靠的表演者。他们的前提是,一个基因在一个实验中只是弱阳性,可能很容易被立即排除。然而,如果同一个基因在两个或两个以上的实验中呈弱阳性,那么反对它的理由就会更加强烈——尤其是如果这些实验使用了非常不同的方法来得出结果。
研究人员的技术还可以通过让背景“噪音”,或在每次实验中发现的无意义的变异,相互抵消,让真正的阳性基因脱颖而出,从而挑选出之前的非阳性基因进行进一步研究。这种效果很像在飞机上戴上一副降噪耳机,以便听到你最喜欢的交响乐。
研究人员确定了近300个与肥胖相关的基因中的66%,他们知道自己的研究方向是正确的。相比之下,没有一个单独的实验能识别出超过30%的同一组人,平均实验只能识别出2%。
进一步的分析确定了16个基因在6个或更多的实验中呈阳性,3个基因在8个实验中呈阳性。在这三个基因中,有一个是已知的肥胖基因。另外两种还不知道与肥胖有关。巴特说:“现在我们可以把这两个候选基因直接交给遗传学家和实验室,开始弄清楚它们的功能。”
比较方法应该适用于许多其他疾病。“数据就在那里,”Butte说,他开创了对大量生物医学信息进行分类和索引的方法,为进一步研究做准备。“我们需要翻译它,让它对其他研究人员和疾病有用。”
资料来源:斯坦福大学医学中心