在一些基因研究中,疾病相关基因通常被遗漏
全外显子组DNA测序技术通过只测序蛋白质编码区域而不是整个基因组来节省时间和金钱,但根据宾夕法尼亚州立大学研究人员的说法,这种技术通常会遗漏一些与疾病相关的基因变异,他们已经开发出了识别这种遗漏的新方法。
全外显子组测序已在许多研究中用于识别基因与疾病相关,并通过临床实验室诊断患者遗传障碍。然而,新的研究表明,这些研究可能常规误导疾病导致基因的突变 - 与白血病,牛皮癣,心力衰竭等相关 - 在基因组的区域中发生的那些通过节省成本较少阅读技术。描述该研究的论文在线出现了4月13日科学报告。
“尽管已知DNA的覆盖率——测序过程中一个给定片段被读取的平均次数——可能是不均匀的whole-exome测序宾夕法尼亚州立大学生物化学和分子生物学及人类学助理教授Santhosh girrajan说,他也是这篇论文的作者之一。“足够的覆盖——通常每条dna多达70次或更多的读取——增加了我们对序列准确的信心,没有它,几乎不可能对基因突变和疾病之间的关系做出自信的预测。”在我们的研究中,我们发现有832个基因在三个不同的测序平台上系统覆盖率低,这意味着这些基因将在疾病研究中被遗漏。”
研究人员开发了两种不同的方法来识别全外显子组序列数据中的低覆盖率区域。第一种方法从多个样本中识别出与基因组中其他区域相比覆盖率不一致的区域。第二种方法计算同一研究中不同样本间低覆盖率区域的数量。他们已经将这两种方法打包成开源软件供其他研究人员使用。
“即使全外显子组测序研究的平均覆盖率很高,一些区域的系统覆盖率似乎也很低,”研究进行时就读于宾夕法尼亚州立大学的研究生、论文第一作者王庆宇(音)说。
由于某些基因组特征,全外显子组测序技术的精度有限,可能导致低覆盖区域。DNA的高度重复延伸——基因组中As、Ts、Cs和Gs相同的简单序列可以重复多次的区域——会妨碍测序器正确读取DNA。事实上,这项研究表明,至少60%的低覆盖率基因出现在DNA重复序列附近。例如,MAST4基因含有一个重复序列元件,与非重复序列相比,其覆盖率降低了3倍。即使其他基因有足够的覆盖范围,这地区在这些研究中,MAST4基因的检测范围远远低于检测基因变异的建议范围。
“这个问题的一个解决方案是让研究人员使用全基因组测序它检查所有的DNA碱基对,而不仅仅是包含基因的区域。”“我们的研究发现,与全外显子组数据相比,全基因组数据的低覆盖率基因明显较少报道更均匀地分布在基因组的所有部分。然而,全外显子组测序的成本仍然明显低于全基因组测序。在全基因组测序的成本不再是障碍之前,人类遗传学研究人员应该意识到全外显子组测序技术的这些局限性。”
进一步探索
用户评论