新工具能够快速分析冠状病毒序列和变体跟踪

在这种映射结果的例子中,使用nextstrain显示,表示假设爆发的序列是黄色的,先前采样的序列是蓝色的,并且分支由核苷酸突变标记。信用:uc圣克鲁斯基因组学院

Covid-19 Pandemic在前所未有的规模上刺激了病毒的基因组监测,因为世界各地的科学家使用基因组测序来跟踪SARS-COV-2病毒的新变种的传播。病毒基因组序列的快速积累呈现了追踪全球和局部传输动态的新机会,但分析了如此多的基因组数据是具有挑战性的。

“现在有超过100万SARS-COV-2的序列。在UC Santa Cruz的生物分子工程助理教授Russ Corbett-Detig说,没有人预计该数字。“

冠状病毒基因组序列的纯粹数量及其快速积累使得难以将新序列放在““展示它们是如何相关的。但是Corbett-Detig在UC Santa Cruz基因组学研究所的组开发了一种以前所未有的速度为此开发了这种方法。称为Ultrafast样品放置在现有的树上(esher),这种强大的工具描述于5月10日发布的纸张自然遗传学

UShER通过将用户新测序的病毒基因组与所有已知的SARS-CoV-2病毒基因组添加到现有的系统发生树中,来识别它们之间的关系。系统发生树是一个类似于家谱的分支图,显示病毒在积累突变时如何在不同的谱系中进化。

“我们能够维持一个超过120万冠状病毒序列的综合系统发育树,并实时使用新序列更新。没有其他工具可以以可比的效率处理这种大小的树木,”博士后的博士后基因组学院的学者。“这有助于我们跟踪循环中的所有变体,包括新兴的新变种。”

这种序列分析可用于发现病毒的新菌株,因为它们出现并跟踪其演化和传输动态。它还可以用于识别冠状病毒感染的个体病例之间的链接,并追踪透射链,一种称为基因组接触跟踪的方法。

该论文的通讯作者科比特-德蒂格(Corbett-Detig)说,“挑战在于尽快得到结果,以便做出有意义的预测,公共卫生机构可以利用这些预测来试图控制疫情爆发。”“我们的方法比其他任何方法都快一个数量级,在十分之一秒内完成新样本。”

通过UCSC SARS-COV-2基因组浏览器提供了亚瑟和相关的数据可视化工具,该工具还可通过UCSC SARS-COV-2基因组浏览器提供广泛的数据以及来自病毒的持续科学研究的结果,包括特别关注的新变种。

“我们的浏览器是在病毒中出现的突变的最全面的信息资源,以及他们对我们的战斗意味着什么,”Coauthor David Haussler,生物分子工程教授和基因组学院主任。“感谢Russ的团队,它包括世界上最综合的病毒谱系的系统发育树,并且该树每周都会继续增长,尽快随着新数据而快速增长。”

像所有病毒一样,SARS-COV-2获得突变,因为它复制和传播。这些随机变化中的大多数对病毒的行为没有影响,但研究人员仍然可以使用它们来识别病毒的不同变体或菌株,看看它们是如何相关的,并确定两个样本是否是相同传输链的一部分。

科学家们已经确定了几个重要的突变,似乎使病毒更加传染。具有这些突变的SARS-COV-2的变体比其他变体更快地蔓延。Coauthor Angie Hinrichs,UCSC基因组浏览器工程师使用emerhemer,以确定这些变体中的一个,称为b.1.1.7,通过几个独立的介绍进入美国。它现在是美国的主要菌条。

塔拉科亚说,他已经开始使用迎来迎来在印度出现的新变种,似乎在那里迅速传播。被称为B.1.617,这种病毒的血统对科学家有两个潜在疑虑的突变。“我们还不知道它是多么有关,但重要的是跟踪它,”他说。

Corbett-Detig说,病毒基因组学可以揭示未通过传统接触跟踪发现的传动链。这种方法可以帮助识别超级概念事件,其中一个人向许多人传播病毒,并且还可以表明来自相同位置的两种情况实际上是不相关的感染,而不是相同传输链的一部分,因为病毒序列差异过多。

他说:“这是一种很有价值的向前发展的方法,所以我们正在构建工具,使人们能够实时地做这件事。”“如果你想知道谁把病毒传染给了谁,或者新的样本可能来自世界上的什么地方,你需要从你的社区提取样本,并将它们植入已知的样本中在所有其他SARS-COV-2基因组序列中,传统的系统发育方法不能在合理的时间内完成这一点。“

那是因为传统方法每次添加新序列时都必须重新计算整个树,因为当有数百个序列时,这会太耗太耗了。伊斯赫几乎立即将样品放在现有的全球系统发作上,它提供了添加的样本的本地子树及其最近的邻居,使得它们的关系可以详细地进行可视化和检查。

研究人员显示,UShER在97%的病例中找到了正确的位置。在另外3%的地方,不正确的放置位置非常接近真实的位置,仍然有助于追踪接触者。UShER也可用于快速识别和去除可能包含测序误差的低质量序列。在Nettregtrain平台上可以在邻近的互动性可视化的平台上进行可视化和探索亚瑟的结果以及如何正在蔓延。

更多信息:在现有树上超快速放置样本(UShER)可以实现SARS-CoV-2大流行的实时系统发育,自然遗传学(2021)。DOI:10.1038 / S41588-021-00862-7

信息信息:自然遗传学