生物信息学:前沿,幕后

生物信息学:前沿,幕后
信贷:Freepik

生物信息学本质上是一种跨学科的努力,它将沃森和克里克等先驱所预示的分子生物学革命与计算机科学的进步相结合,这些进步使我们能够掌握以前难以想象的能力。我和A*STAR生物信息研究所(BII)的同事们与学术、临床和行业合作伙伴合作,研究从序列分析到图像处理的所有内容,这反映了生物信息学的协作性质。

然而,在目前的COVID-19大流行期间,生物信息学的协同作用表现得最为明显。在大流行的头六个月里,已有1500多万人感染,50多万人不幸丧生。在不确定性和动荡中,生物信息学家一直站在支持开发迫切需要的诊断方法和药物再利用的前沿,以及在幕后仔细监测药物的使用情况基因组的潜在危险突变和追踪研究并帮助遏制传播。

从序列到测试套件

2019年12月下旬,我们首次听说武汉有一种不寻常的病毒性肺炎在传播。在传染病领域,这通常不是引起关注的原因;专家们总是在寻找“下一个大地震”,但大多数时候,结果什么都不是。然而,这一次确实进一步发展,到1月的第二周,中国当局通知世界,它是由冠状病毒引起的,与引起严重急性呼吸系统综合征(SARS)和中东呼吸系统综合征(MERS)的病毒是同一家族。我们立即坐了起来,注意到这一点,很快就被全球共享所有流感数据倡议(GISAID)的同事召集起来采取行动。

最初设计用于快速传播信息在美国,受影响国家呼吁GISAID提供其以独特的共享机制而闻名的平台,以便各国能够以前所未有的速度共享其病毒序列。这一切都始于三个中国实验室的五个基因组。

在后来被称为SARS-CoV-2的序列被公开的第一刻,我们并没有意识到我们正在处理的事情比我们以前所面临的更大。相反,随着病例攀升到数百例,然后是数千例,从武汉市蔓延到中国其他城市,人们逐渐意识到这一点。

从平均每天三到四个新序列,提交的数量迅速上升到每天数百个,我们很快就必须建立一个更强大的数据库来存储每个序列的所有30千碱基对,以及重要的元数据,如病毒是在哪里被分离出来的,样本是什么时候采集的。GISAID可以依靠世界各地的程序员和科学家昼夜不停地工作数周或数月。为了应对大量涌入的基因组,我们也不得不调整我们的程序来处理传入的基因组,并迅速开发来筛选错误和质量,所以我在A*STAR的新加坡BII和基因组研究所(GIS)的同事开发了软件工具,允许我们自动标记基因组,以解决非法字符等问题,并根据覆盖质量将它们分类。法国巴斯德研究所的同事改进了元数据的检查,巴西和阿根廷的同事也加入了我们多达50人的团队,在这项巨大的管理工作中能够在一天中的每一个小时响应,覆盖所有时区。截至2020年7月,GISAID数据库拥有6万多个序列,而且这一数字还在与日俱增。

虽然跟踪SARS-CoV-2序列的差异可以让我们对病毒可能来自哪里以及它如何随着时间的推移而演变有重要的了解,但每个人在为病毒做准备时必须采取的第一个行动是开发准确和可靠的诊断试剂盒。我在实验药物开发中心(EDDC)的A*STAR同事井上正武(Masafumi Inoue)博士和陈托生医院(Tan Tock Seng Hospital)的巴卡姆(Timothy Barkham)博士立即开始工作。在诊断开发(DxD)中心首席执行官Sidney Yee博士和整个A*STAR生态系统的帮助下,我们能够在2月的第一周推出Fortitude定量逆转录聚合酶链反应(qRT-PCR)诊断试剂盒。

为了开发“坚韧”,我们不仅需要访问一个基因组,还需要参考多个基因组——从这次爆发的病毒到以前的病毒——以确定一个不仅是新病毒所特有的,而且相对稳定的区域,以便它在所有当前爆发的毒株中普遍存在。这就是生物信息学产生深远影响的地方:它不仅使我们能够快速地对基因组中的数千个碱基进行比较,而且还继续帮助我们理解不断流动的序列,以便我们能够确保诊断试剂盒即使在病毒突变时也能继续工作。

除了诊断之外,一旦你有了基因组测序,你还可以用它来预测药物靶点,并开始在硅片上筛选现有药物,大大加快了寻找急需的治疗方法的速度。

突变的意义

除了解决对诊断和药物的迫切需求以及在前线推动疫苗开发外,生物信息学还在帮助我们了解病毒如何变异方面发挥着至关重要的作用。首先,我想强调的是,突变是正常的,尤其是像SARS-CoV-2这样的RNA病毒,它们在复制时自然会出错,复制出不完美的自己。但仅仅因为病毒正在变异并不一定意味着它更危险。

其次,大多数突变都很小,要么对病毒有害,要么根本没有影响。打个比方,如果整个就像一辆汽车一样,病毒的变异形式是同一辆车,颜色相同,只有一个微小的差异,比如车牌上的一个字母的差异。就像车牌的这种变化不会影响汽车的性能或使其更省油一样,这些突变并不意味着病毒的毒性变得更强或更弱。

然而,这个“换过的车牌”可以告诉我们汽车的产地和注册时间。类似地,突变可以让我们了解不同的病毒“汽车”之间是如何相互关联的,这是一条我们可以用于接触者追踪的信息。

在非常罕见的情况下,可能有突变确实改变了病毒的性能和适应性,这通常需要多个步骤。例如,SARS-CoV-2进化过程中的一组突变被认为赋予了它从蝙蝠或穿山甲等动物跳到人类宿主身上的能力。

通过GISAID等平台与现代生物信息学工具相结合,实现实时基因组监测,我们可以在这些罕见变化发生时快速检测到它们,并判断它们是否影响诊断、治疗或增加毒性。例如,在欧洲引发疫情的病毒已经进化到与原始菌株略有不同,因此中国同事最初根据第一次疫情基因组开发的RT-PCR试剂盒无法很好地检测到它。我们一看到这种变化,就通知了我们的同事,有了这些信息,他们能够迅速改变他们的方案,随后也能够完全检测到新的欧洲菌株。

随着抗击SARS-CoV-2的战斗在全球范围内继续展开,世界各地的生物信息学家正在与这种不断进化的病毒赛跑。通过跟踪它的基因组进化,我们希望能赶上它,有时甚至领先一步。


进一步探索

快速获得用于快速诊断COVID-19的“坚韧工具包”

引用:生物信息学:在前沿,幕后(2020年,9月4日)检索到2022年6月7日从//www.puressens.com/news/2020-09-bioinformatics-forefront-scenes.html
这份文件受版权保护。除为私人学习或研究目的而进行的公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。
2股票

对编辑的反馈