利用大数据更好地了解癌症突变

突变
资料来源:CC0 Public Domain

人工智能和机器学习是癌症研究人员用来帮助检测和治疗癌症的最新工具。

科罗拉多大学癌症研究中心成员莱恩·莱尔博士是在这一癌症研究新前沿领域工作的科学家之一,他最近发表了一项研究,详细介绍了他的研究发现癌症在细胞。

“确定导致成为恶性肿瘤可以帮助医生选择专门针对肿瘤的治疗方法,”科罗拉多大学博尔德分校计算机科学助理教授Layer说。“例如,大约25%的乳腺癌是HER2阳性,这意味着这种类型的肿瘤细胞发生突变,导致它们产生更多的HER2蛋白质,帮助它们生长。专门针对HER2的治疗已经显著增加这种类型的乳腺癌。”

Layer说,科学家可以通过评估细胞DNA来识别突变,但挑战在于人类基因组非常庞大,而突变是进化的正常组成部分。

长度足以填满120万页的书,任何两个人都可能有大约300万个基因差异。”“在肿瘤中找到一个致癌突变就像在一堆针中找到一根针。”

扫描数据

确定患者所患癌症突变类型的理想方法是比较来自同一患者的两个样本,一个来自肿瘤,另一个来自健康组织。然而,这样的测试既复杂又昂贵,所以Layer想出了另一个主意——利用大量的公共DNA数据库来寻找常见的良性细胞突变,这样研究人员就可以识别出有可能癌变的罕见突变。

“布罗德研究所有一个名为基因组聚合数据库(Genome Aggregation Database,简称gnomAD)的项目,他们把布罗德研究所正在进行的一系列不同的研究汇集在一起,形成了一个任何人都从未想过的最大的基因数据库,”Layer说。“一开始是65,000只,现在大约有50万只。当时我在犹他大学(University of Utah)做未确诊罕见病诊所的研究,这个数据库的有用性简直令人难以置信。”

即使他能够对患有癌症的孩子和她的父母进行测序,Layer说,通常有太多的基因突变,很难确定是哪一个导致了这种疾病。使用gnomAD,他可以观察某种变异在更大人群中发生的频率,从而大大减少治疗靶点的数量。

验证变异

受到这一经历的启发,Layer开始寻找其他使用大数据来识别潜在癌症突变的方法。知道检测复杂的DNA突变称为结构变异(SV)经常会导致在美国,他和同事们开发了一种侧重于验证而不是检测的流程。这种方法从数千个DNA样本的原始数据中搜索支持特定结构变异的任何证据。

“我们扫描了之前癌症研究中确定的SVs,发现数千个以前与癌症相关的SVs也出现在正常健康的样本中,”Layer说。“这表明,这些变异更有可能是良性的遗传序列,而不是致病序列。”

该团队还发现,其方法的表现与需要肿瘤和健康样本的传统策略一样好,为降低成本和增加高质量癌症突变分析的可获得性打开了大门。

他说:“有了癌症现有的所有数据,我们能够证明这种方法真的很强大,不一定能识别癌症的驱动突变,但与身体其他部位相比,肿瘤的独特变异是什么。”“通过这种方式,肿瘤治疗可以变得超级个性化。我们可以说,‘如果你有这种突变,就用这种药;如果你没有这种突变,就不要用这种药。’”

分享研究成果

Layer的实验室现在部署了一个网站医生可以输入在患者肿瘤中发现的结构变异的信息,以了解它们有多常见——以及潜在的危险。他还希望建立一个更大的以癌症为重点的数据集,以帮助更好地了解肿瘤是如何以及在哪里形成的。

他说:“到目前为止,我们的工作一直是采用一种结构变异,看看它在健康人群中的频率。”“但如果我们建立索引,让你可以搜索我们的人口呢?”假设你取了一个肺肿瘤样本然后你发现-现在你可以搜索这些和乳房以及所有其他癌症,它可能会帮助你识别,‘肿瘤的起源是什么?“它转移了吗?还是起源于肺?”我们可以搜索数据库来寻找其他匹配的肿瘤为治疗方法。”

这项研究发表在自然方法


进一步探索

基因突变可以是良性的,也可以是恶性的。区分它们的新方法可能会带来更好的治疗

更多信息:Murad Chowdhury等人,使用STIX搜索了数千个基因组,对体细胞和新的结构变异进行分类,自然方法(2022)。DOI: 10.1038 / s41592 - 022 - 01423 - 4
期刊信息: 自然方法

引用:使用大数据更好地了解癌性突变(2022,7月5日)检索自2022年7月17日//www.puressens.com/news/2022-07-big-cancerous-mutations.html
这份文件受版权保护。除为私人学习或研究目的而进行的公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。
81股票

对编辑的反馈