研究人员在个人遗传信息的安全方面暴露了新的漏洞
怀特海德研究所的一个研究团队仅使用一台电脑、一个互联网连接和可公开访问的在线资源,就能够识别出近50个提交了个人遗传材料的人作为基因组研究的参与者。
关于在“漏洞研究”中进行运动的意图 - 信息安全领域的常见做法 - 团队采取了一个多步方法来证明,在某些情况下,可以确定基因组研究参与者的全名和身份,甚至可以确定当他们的时候遗传信息以去标识的形式保存在数据库中。
“这是一个重要的结果,指出了基因组学研究中潜在的隐私侵犯,”领导该研究团队的Whitehead研究员亚尼夫·埃利希(Yaniv Erlich)说。本周的《华尔街日报》发表了对该小组工作的描述科学杂志。
埃利希和同事们从分析独特开始遗传标记Y染色体上的短串联重复序列(Y- strs),这些人的遗传物质由人类多态性研究中心(CEPH)收集,他们的基因组被测序并作为1000个基因组计划的一部分公开。因为Y染色体和家族姓氏一样是由父亲遗传给儿子的,所以姓氏和DNA之间有很强的相关性Y染色体。
认识到这种相关性后,家谱学家和家谱公司建立了可公开访问的数据库,按姓氏存储Y-STR数据。在一个被称为“姓氏推断”的过程中,埃利希团队通过向这些数据库提交他们的y - str,得以发现这些男性的姓氏。研究小组掌握了姓氏后,询问了其他信息来源,包括互联网记录搜索引擎、讣闻、家谱网站和来自新泽西州科瑞尔研究所的国家普通医学研究所(NIGMS)人类遗传细胞库的公共人口统计数据。来识别美国近50名CEPH参与者。
先前的研究设想了通过匹配一个人的DNA来进行基因识别的可能性,假设这个人的DNA在两个不同的数据库中进行了编目。然而,这项研究利用的是与父母关系遥远的个体之间的数据。因此,研究小组指出,发布一个人的基因数据可以揭示深层的家族关系,并有助于确定一个可能与发布基因数据的人并不认识的远亲。
“我们证明,例如,如果你的戴夫叔叔将他的DNA提交到基因系谱数据库,你就可以被识别出来,”埃利希实验室的成员、该研究的第一作者梅丽莎·金雷克(Melissa Gymrek)说科学纸。“事实上,即使是你从未见过的四堂兄帕特里克,只要他的DNA在数据库中,只要他与你有父系关系,也能认出你。”
意识到他的工作的敏感性,Erlich强调他没有意图揭示所确定的人的名字,也不希望看到公共分享遗传信息限制。
“我们的目标是更好地照亮遗传数据的可识别性的现状,”他说。“更多知识授权参与者在考虑分享自己的数据时,参与者衡量风险和福利,并在考虑其分享自己的数据时进行更明智的决定。我们还希望这项研究最终会导致更好的安全算法,更好的政策指导,以及更好的立法,帮助减轻一些帮助所描述的风险。“
为此,Erlich在出版之前与国家人类基因组研究所(NHGRI)和NIGMS的官员分享了他的调查结果。作为响应,NIGMS和NHGRI从INGMS单元存储库的可公开可访问部分移动某些人口统计信息,以帮助降低未来违规的风险。在同一问题科学在埃利希研究发表的地方,NIGMS和NHGRI的主任朱迪思·h·格林伯格和埃里克·d·格林,他的同事们对这项最新研究提出了一个观点,他们主张采用一种方法来平衡研究参与者的隐私权和共享生物医学研究数据所带来的社会利益。ob欧宝直播nba
“yaniv的工作是及时提醒,在这个时代,迅速生成大量基因组数据,并在科学进步的利益中共享,隐私违规可能越来越大,”Whitehead Institute Directitute David Page表示。““我很高兴,感谢Yaniv的序曲,我们在Whitehead Institute有机会在Nhgri和其他地方加入政策制定者,这将是关于保障数据的重要性,分享数据的重要性,分享数据的重要性失败在努力中的影响。“
进一步探索
用户评论