DDI数据和算法的性能。第1行:所有三个人工智能的性能模型和合奏的多数票的皮肤科医生整个DDI数据集(A),置I ii (B),浮置板轨道第5和(C),第二行:表现在DDI常见疾病数据集和所有算法的性能对整个DDI的皮肤科医生常见疾病数据集(D),置I ii (E)和第5和6置(F)。第3行:从整个DDI示例图像数据集所有肤色(G),置I ii (H)和第5和6置(我)。图片来源:DDI数据集,斯坦福大学医学院的。信贷:科学的进步(2022)。DOI: 10.1126 / sciadv.abq6147

皮肤有一个长期的挑战:教科书、数据库、期刊和讲座主要是深色皮肤失去的图像特征。

他们缺乏会导致差距在临床专业知识和诊断,疾病的症状不一定出现在所有相同音调。医生训练识别疾病的迹象在浅色可以忽略他们在深肤色的人,和算法训练的米色的照片可能会错过疾病的迹象在评估患者的图片棕色皮肤。

“算法只是一样好,他们的数据是基础,”James邹说博士,斯坦福大学医学助理教授科学和生物医学数据机器学习专家。“一个巨大的,开放的编目皮肤图像的颜色可以帮助医生评估这些算法函数是否准确对所有皮肤的颜色。”

他和其他人在斯坦福大学多年来一直制作这样的一个数据库。

使用数据库的初步版本,邹;罗克珊娜Daneshjou,医学博士,博士,斯坦福医学执业皮肤科医生;研究生卡纳斯Vodrahalli;和其他人进行了一项研究,发表在8月12日科学的进步评估算法用于皮肤病。

集团挖掘潜在的偏见把先前描述的算法和测试精度在不同的皮肤图像。结果在某种程度上可以:算法训练同质,浅肤色的图像准确地检测到皮肤的皮肤疾病。但不是暗色调。

好消息吗?皮肤科邹和临床副教授Daneshjou阿尔伯特·邱,医学博士,与邹共享研究的文章的第二作者,设计了与右偏置算法的错误的一种方法。

“人在创造算法需要意识到这个问题,并确保他们测试他们在各种不同肤色,“Daneshjou说,这项研究的第一作者。“只是强调的重要性多样化团队医生和机器学习专家涉及。”

一个数据库的不同的肤色

新的临床相关算法的数量已经急剧上升在过去的几年里,由于更多的数据可用性。但不相同的事。大多数数据库可用性和多样性的皮肤图像仍主要米色。

“红斑或发红,例如,是一种功能的疾病,出现不同的深色和浅色皮肤上,“Daneshjou说。“这就是为什么重要的是医生和算法的差异知道他们正在寻找。”

新的、更多样的数据库,由Daneshjou和其他人在斯坦福人工智能在医学和成像中心包括一个广泛的医学图像库的病人不确定。

当他们测试的准确性发表的各种算法在数据库上,他们看到更穷的算法性能的图像黑色和棕色皮肤。“但是当我们把我们的多元数据的一个子集,整合算法,我们可以关闭性能的差距,“Daneshjou说。

Daneshjou和邹不同数据库提供给科学家们想要使用他们的数据来调整他们的算法或测试的偏见。邹说,数据库可能有利于公众。

“通常,人们会点东西摩尔也想在互联网上查找之前的情况下,”他说。“这可能是一种宝贵的资源的患者可能不可以找到图片的皮肤看起来像他们的。”

更多信息:罗克珊娜Daneshjou et al,差距在皮肤病学AI性能多样化,策划临床图像集,科学的进步(2022)。DOI: 10.1126 / sciadv.abq6147

期刊信息:科学的进步

所提供的斯坦福大学