新的统计方法缓解了数据重现危机

统计数据
资料来源:CC0公共域名

在科学研究中,重复性危机正在持续,许多研究可能很难或不可能复制,从而验证,特别是当研究涉及非常大的样本量时。例如,为了评估高通量基因研究结果的有效性,科学家必须能够复制该研究并获得相同的结果。现在,宾夕法尼亚州立大学和明尼苏达大学的研究人员开发了一种统计工具,可以准确估计一项研究的可重复性,从而消除了重复工作的需要,并有效地缓解了可重复性危机。

该团队使用其新方法,他们在今天的论文中描述自然通讯,以证实2019年一项关于这有助于吸烟和酗酒成瘾,但也可以应用于其他全基因组关联研究,或调查疾病的遗传基础的研究。

公共卫生科学和生物化学副教授刘大江表示:“虽然我们将该方法应用于研究吸烟和酗酒成瘾相关的结果,但它可能有利于其他类似的大规模联合研究,包括目前关于宿主基因对COVID-19症状的贡献的研究。,宾夕法尼亚州。

Liu说,要在全基因组关联研究中发现模式,从大量个体中获取数据是很重要的。科学家们通常通过结合许多现有的类似设计的研究来获取这些数据,刘和他的同事在2019年的烟酒成瘾研究中就是这样做的,该研究最终涉及120万人。

“我们非常努力地收集了我们所能收集到的所有患者样本,”刘说。他指出,这些数据来自生物样本库、流行病学研究和23andMe等直接面向消费者的基因检测公司。然而,他补充说,由于该团队在分析中使用了所有可用的研究,没有剩下的可用来进行对比验证。他说:“我们的统计方法允许研究人员在不需要复制数据集的情况下评估遗传关联信号的可复制性。”“它有助于最大限度地发挥基因研究的力量,因为不需要保留样本用于复制;相反,所有的样本都可以用于发现。”

他们称之为MAMBA的团队方法(基于元分析模型的可重量性评估),评估DNA的非典型比特(称为单核苷酸多态性(SNP)和疾病性状,如成瘾的疾病特征之间的关联的强度和一致性。具体而言,MAMBA计算概率,如果可以用不同的个体重复实验,则SNP和这些个体的特征之间的关系将与第一个实验中的相同或相似。

Qunhua Li统计统计教授Penn State,解释说,如果SNP与正在评估的特征显着相关,并且如果其估计的效果大小在多项研究中一致,则MAMBA为每个SNP分配更高的可重量性(PPR)的概率(PPR)。

“例如,”李说,“如果沉迷于吸烟的大多数参与者都有一定的SNP,那么来自非上瘾者的SNP,如果这个SNP在多个较小的研究中出现了人们,那么曼巴将给它一个较高的PPR,这表明SNP在瘾中可能是重要的。“

研究人员通过将其应用于刘2019年的吸烟和饮酒成瘾研究来证明了它们的方法。在556个常见和低频SNP关联信号中,该团队鉴定了529个,PPR大于99%。在延长分析左右4,300左右的SNP,研究人员鉴定了2,807个SNP,PPR大于99%。

“有趣的是,我们发现已知对脂质代谢负责的某些基因也会影响吸烟成瘾,”公共卫生科学助理教授Bibo Jiang表示,注意到这种现象被称为Pleiotropy - 当基因影响时两个看似无关的特征。“如果我们想设计针对这些基因的药物,以帮助人们戒烟,我们应该注意任何与之相关的潜在条件比如高胆固醇。”

刘某指出,该方法可以应用于专注于各种各样的特质。“我想在未来十年左右,生物学的基本焦点将是解释和理解那些基因组关联研究发现,以及我们是否可以将其中一些人转化为促进个性化医学的药物,”他说。“我们很高兴能够为研究界提供这种统计方法。”


进一步探索

新的研究表明,危险吸引吸烟和电子烟和电子烟

更多信息: 自然通讯(2021)。DOI: 10.1038 / s41467 - 021 - 21226 - z
期刊信息: 自然通讯

引用:新的统计方法缓解数据重现危机(2021年3月30日),2021年4月24日从//www.puressens.com/news/2021-03-statistical-method-eases-crisis.html检索
此文件受版权保护。除作私人学习或研究之公平交易外,未经书面许可,任何部分不得转载。本内容仅供参考之用。
46股票

反馈到编辑

用户评论