人工智能系统可能加速癌症的发现
得益于一种新的人工智能系统,科学家们可以更容易地搜索海量已发表的癌症研究。
这个系统叫做狮子的小黑裙由计算机科学家和癌症共同开发研究人员剑桥大学的一个实验室,旨在帮助科学家寻找癌症相关的发现。这是第一部以文献为基础的作品发现旨在支持癌症研究的系统。研究结果发表在该杂志上生物信息学.
全球癌症研究在全球范围内吸引了大量的资金科学文献现在是如此之大,以至于研究人员都在努力跟上它:产生关键假设的证据现在往往在发表很久之后才被发现。
癌症是一种尚未被完全了解的复杂疾病,是全球第二大死亡原因。癌症的发展涉及许多化学和生物化学分子、反应和途径的变化,癌症研究正在广泛的科学领域进行,这些领域在描述类似概念的方式上具有可变性。
剑桥大学语言技术实验室联合主任Anna Korhonen教授说:“作为一名癌症研究人员,即使你知道自己在寻找什么,每天也会有成千上万的论文出现。”Anna Korhonen教授与英国剑桥癌症研究所的Masashi成田博士和瑞典卡罗林斯卡研究所的Ulla Stenius教授合作开发了LION LBD。“LION LBD使用人工智能来帮助科学家跟上他们领域中已发表的最新发现,但也可以通过在看似不相关的来源之间建立联系,结合文献中已知的内容,帮助他们做出新的发现。”
LION中的“LBD”代表基于文献的发现(Literature-Based Discovery)概念它于20世纪80年代发展起来,旨在通过梳理来自不相关来源的信息来获得新发现。原始版本的LBD背后的关键思想是,在文献中从未明确联系的概念可能通过中间概念间接联系起来。
LION LBD系统的设计允许实时搜索,以发现数千万份出版物数据库中实体之间的间接关联,同时保留用户在其原始上下文中探索每个提及的能力。
Korhonen说:“例如,你可能知道一种癌症药物会影响某种途径的行为,但使用LION LBD,你可能会发现一种针对完全不同的疾病开发的药物会影响相同的途径。”
LION LBD是第一个专门为需求开发的系统癌症研究.它特别关注癌症的分子生物学,并使用最先进的机器学习和自然语言处理技术,以检测文本中对癌症特征的引用。对该系统的评估表明,它能够识别未发现的联系,并在潜在联系中对相关概念进行高度排序。
本系统采用开放数据它是一种基于web的交互式接口或可编程API。
研究人员目前正致力于扩展LION-LBD的范围,以包括更多的概念和关系。他们还与癌症研究人员为最终用户提供帮助和改进技术。
进一步探索