MILK10k:基于多模态影像的皮肤癌诊断分层机器学习工具包开发与应用

【字体: 时间:2025年07月25日 来源:Journal of Investigative Dermatology 5.9

编辑推荐:

  研究人员针对皮肤癌AI诊断中数据集单一模态、缺乏非色素性病变和肤色多样性等问题,开发了包含10480张多中心多模态图像的MILK10k数据集,覆盖48种ISIC-DX匹配诊断类型,95.7%病例经病理验证。该研究不仅提供标准化基准测试集,还创新性提出基于ISIC-DX层级的评估指标,为皮肤癌AI诊断建立了更全面的研究平台。

  

在人工智能医疗影像快速发展的今天,皮肤癌诊断领域却面临着特殊的挑战。虽然国际皮肤影像协作组织(ISIC)已收集超过50万张公开图像,但现有数据集存在三个显著缺陷:多数仅包含单一成像模式(皮肤镜或临床特写);主要关注色素性病变而忽略非色素性皮肤癌;且缺乏对患者肤色多样性的系统记录。这些问题导致开发的AI模型存在潜在偏见,在真实临床场景中的泛化能力受限。更棘手的是,不同数据集采用的疾病分类标准不统一,使得跨研究比较变得困难。

针对这些关键问题,维也纳医科大学(Medical University of Vienna)皮肤病学系联合全球多家医疗机构的研究团队,开发了名为MILK10k的创新性多模态影像学习工具包。这项发表在《Journal of Investigative Dermatology》的研究,通过构建包含10,480张配对的临床特写与皮肤镜图像数据集,首次系统性地解决了上述瓶颈问题。研究团队从五个国际医疗中心回顾性收集5,240例经病理确诊的皮肤病变案例,其中特别纳入了不同肤色人群和48种ISIC-DX匹配诊断类型,包括传统数据集较少涵盖的非色素性病变。

研究采用的关键技术方法包括:1)多中心病例收集与标准化处理(含EXIF元数据清除和图像归一化);2)基于DINOv2模型的图像特征提取与重复病例识别;3)创新性皮肤色调自动提取算法(通过500个随机裁剪区域分析);4)MONET框架实现可解释性概念标注;5)建立包含948张图像的独立基准测试集。

【数据集描述】部分显示,MILK10k包含10480张配对图像,覆盖头颈(28.5%)、躯干(36.7%)等主要解剖部位。通过创新的皮肤色调聚类方法,将肤色分为6个梯度(L值52.1-83.0),其中60.6%病例属于中间色调(cluster 3)。值得注意的是,95.7%病例经活检或切除确认,为模型训练提供了可靠金标准。

【机器学习管道】结果显示,使用11类简化分类时平均召回率为0.426(95%CI:0.392-0.459),而48类ISIC-DX细分类的top-3准确率达67.7%。研究创新性提出层级距离度量(平均1.73步),有效解决了传统评估指标对分类层级不敏感的问题。

【独立基准数据集】部分介绍了精心设计的948图像测试集,采用分层抽样并模拟域偏移,通过ISIC在线挑战平台实现持续评估,其诊断标签将保密五年以确保评估客观性。

这项研究的突破性体现在三个方面:首先,MILK10k是首个系统整合临床特写与皮肤镜图像的大规模资源,解决了多模态学习的数据瓶颈;其次,通过ISIC-DX层级分类和创新的距离度量,建立了更符合临床决策逻辑的评估体系;最后,包含肤色注释和独立测试集的设计,为评估算法公平性和鲁棒性提供了新范式。正如作者在【使用说明】部分强调的,虽然数据集在儿童和深肤色人群中的代表性仍有限,但其层级分类框架和标准化处理流程,为未来整合更多样化数据提供了可扩展的基础架构。这项研究不仅推进了皮肤癌AI诊断的技术前沿,其创新性数据架构更为医学影像领域的多中心研究树立了新标杆。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号