新的人工智能工具发现膀胱癌和吸烟的突变特征

新的人工智能工具发现膀胱癌和吸烟的突变特征
图形抽象。信贷:细胞基因组学(2022)。DOI: 10.1016 / j.xgen.2022.100179

加州大学圣地亚哥分校的研究人员首次发现了一种将膀胱癌与吸烟联系起来的DNA突变模式。这一发现之所以成为可能,要归功于该团队开发的一种强大的新机器学习工具,该工具用于发现致癌物和其他dna改变过程引起的突变模式。

该研究于9月23日发表细胞基因组学,可以帮助研究人员确定,例如暴露在烟草烟雾和紫外线辐射下,会导致某些病人患癌症。

每一种环境暴露都会以一种独特的方式改变DNA,产生一种特定的突变模式,称为突变特征。如果在病人的DNA中发现了一个特征在美国,癌症可以追溯到产生这种特征的暴露。了解存在哪些突变特征也可以为患者的特定癌症提供更定制的治疗方法。

在这项研究中,研究人员在动物的DNA中发现了突变特征这与吸烟有关。这一发现意义重大,因为吸烟导致的突变特征已经在肺癌中被检测到,但尚未在膀胱癌中被检测到。

“有强有力的流行病学证据表明膀胱癌与吸烟有关。我们甚至在直接暴露于烟草致癌物质的其他组织(如口腔、食道和肺部)中看到了特定的突变特征,”该研究的资深作者、生物工程和细胞生物学教授Ludmil Alexandrov说加州大学圣地亚哥分校。“我们在膀胱中没有发现这种特征,这很奇怪。”

亚历山德罗夫和他的同事们现在证明,在膀胱癌中有一个由吸烟引起的突变特征,它与在.此外,他们还发现,这种特征也存在于未患膀胱癌的吸烟者的正常膀胱组织中。在非吸烟者的膀胱组织中没有发现这种特征。

“这个特征告诉我们,你DNA中的某些突变是由于暴露在该研究的共同第一作者、亚历山德罗夫实验室的博士后研究员马科斯·迪亚斯-盖伊说。“这并不一定意味着你得了癌症。但你抽得越多,细胞中积累的突变就越多,患癌症的风险就越高。”

下一代机器学习使之成为可能

研究人员利用亚历山德罗夫实验室开发的下一代机器学习工具发现了烟草特征。该团队表示,这是最先进的自动化生物信息学工具,可直接从大量基因数据中提取突变特征。

亚历山德罗夫说:“这是一种强大的机器学习方法,可以识别突变模式,并将它们从基因组数据中分离出来。”“它获取这些模式并破译它们,这样我们就可以看到突变特征是什么,并将它们与它们的含义相匹配。”

他将机器学习方法比作在鸡尾酒会上挑选个人对话。

“你周围有很多群人在说话,你只对听某些人说话感兴趣,”他说。“我们的工具基本上可以帮助你做到这一点,但是是癌症基因数据。世界上有很多人暴露在不同的环境诱变剂中,其中一些暴露在他们的基因组上留下了印记。这个工具通过所有数据来找出导致突变的过程。”

该工具被用于分析23827例人类癌症测序。它发现了四种突变特征,包括与膀胱癌相关的一种-其他任何工具都没有检测到。在胃癌、结肠癌和肝癌中发现的其他三种特征,仍然值得进一步研究,以了解是什么过程导致了它们。

为了展示他们的工具有多强大,研究人员将其与13种现有的生物信息学工具进行了测试。研究人员评估了这些工具从8万多个合成癌症样本中提取突变特征的能力。亚历山德罗夫团队开发的工具的性能超过了其他所有工具。它能多检测出20%到50%的真阳性签名,而假阳性签名则少5倍。它甚至在分析噪声数据时表现良好,而其他工具则失败了。

Diaz-Gay说:“在生物信息学中,这是第一次在如此大规模的突变特征提取方面进行如此全面的基准测试。”“这是一项艰巨的任务,要在许多数据集上比较许多工具。”

创建一个更加用户友好和个性化的工具

该团队的最终目标是创建一个基于网络的工具,让更多的研究人员可以使用,从而对更多的患者进行分析。

“现在,这个工具需要生物信息学专业知识来运行,”亚历山德罗夫说。“我们想要的是在网上创建一个用户友好的版本,研究人员只需输入患者的突变,它就会立即给你一组基因突变以及是什么过程造成的。”

“我们未来的想法是利用这个工具在个体层面上分析患者,”Diaz-Gay说。

更多信息:S.M. Ashiqul Islam等人,用SigProfilerExtractor从头提取发现新的突变特征,细胞基因组学(2022)。DOI: 10.1016 / j.xgen.2022.100179

引用:用新的AI工具(2022,9月26日)发现的膀胱癌和吸烟相关的突变特征(2023年1月15日从//www.puressens.com/news/2022-09-mutational-signature-linking-bladder-cancer.html检索)
这份文件受版权保护。除为私人学习或研究目的而进行的公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。

进一步探索

与癌细胞系中最普遍的突变特征有关的酶

50股票

对编辑的反馈