发现COVID-19病毒序列的秘密
自2020年初以来,世界各地的实验室一直在对COVID-19患者的阳性检测材料进行测序,然后将序列大部分存入三个收集点:GenBank、COG-UK和GISAID。快速探索如此庞大的数据对于理解病毒基因组是如何变化的非常重要。为了能快速浏览这些数据,斯特凡诺•切里教授领导的米兰理工大学研究小组开发了ViruSurf,这是一个基于存储在米兰理工大学的中央数据库运行的搜索引擎。该数据库定期从三个来源重新加载,截至目前包含了导致COVID-19的病毒SARS- cov -2的200,516个序列,以及33256个也与影响人类的流行病有关的其他病毒物种的序列,如SARS、中东呼吸综合征(MERS)、埃博拉病毒和登革热。
每种序列都是从四个观点描述的:病毒的生物学特征和宿主,测序技术,项目产生了原始数据的项目,整个核苷酸的突变和基因特异性氨基酸的突变。VirusuRF提供的优势是使用云计算使用算法用于均匀地计算病毒突变。该数据库经过优化,以便快速回复搜索引擎冲浪者。
在virousurf的未来发展中,由EIT Digital由六个月长的项目资助的最重要的是用于摄取新的病毒序列的生物信息服务,突出了与增强或减少严重程度相关的病毒突变的存在被发现的毒力。用于诊所,特别是令人痛苦的急性发育不良蔓延,它将支持向患者健康记录添加关键信息;在动物养殖或食物链的背景下,其他用途是可能的。该系统很快就会允许追踪陷阱 -氨基酸序列用于疫苗设计——例如,将抗原表位与可能出现在世界上特定国家并影响疫苗的病毒突变联系起来。
“在欧洲研究理事会资助的GeCo项目中,我们已经开发了一个用于描述地球的数据集的搜索引擎人类基因组,称为Genosurf;在大流行的开始时,没有病毒序列的系统。为了更好地了解其要求,我们采访了来自世界各地的二十个专家病毒学家。结果是用户友好的系统:任何研究人员都可以连接到它并执行查询,例如,当病毒突变开始以及如何在世界上传播时,“项目领导者Stefano Ceri说。文章已发布在高相关期刊上,核酸的研究该数据库每年都会收集最重要的生物数据库的描述。这篇文章的作者还有Pietro Pinoli,算法设计师,Arif Canakoglu,软件架构师,Anna Bernasconi,数据设计师,Tommaso Alfonsi,数据加载管道设计师,以及来自L3S(汉诺威)的Damianos P. Melidis,一些算法的作者。
用户评论