基于3D全身摄影的皮肤癌可疑病变自动分诊:一项多中心机器学习挑战研究

《npj Digital Medicine》:Automated triage of cancer-suspicious skin lesions with 3D total-body photography

【字体: 时间:2025年11月22日 来源:npj Digital Medicine 15.1

编辑推荐:

  本研究针对皮肤癌早期检测中缺乏经济有效的无症状筛查、专科皮肤科资源地域不平等以及候诊时间长等挑战,利用3D全身摄影(3D-TBP)技术,开展了ISIC 2024机器学习挑战赛,开发了基于多模态数据(图像块、WB360外观元数据、基本人口统计学元数据和患者上下文信息)的自动分诊模型。结果表明,优胜模型在灵敏度为80%时,可将需要专家评估的皮损数量减少95%(NNT80% SE=51.57),证明了3D-TBP在皮肤癌分诊中的可行性,为优化皮肤监测工作流程和改善高危人群转诊提供了新途径。

  
皮肤癌,尤其是黑色素瘤,若能早期发现和治疗,可显著改善患者预后。然而,当前的皮肤癌早期检测面临诸多挑战:缺乏成本效益高的无症状筛查方法、皮肤科专科资源的地理分布不均、以及由于检查效率低下和人员短缺导致的漫长候诊时间。传统的机器学习(ML)模型通常在高质量的皮肤镜图像上进行训练,用于辅助临床医生诊断单个、手动选择的皮肤病变。然而,这类模型在分诊任务中的应用探索较少,部分原因是缺乏能够代表更广泛皮肤病变网络的数据集。
3D全身摄影(3D Total-Body Photography, 3D-TBP)是一项新兴技术,用于记录患者所有可见的皮肤病变以进行皮肤癌监测。Vectra WB360系统是一种3D-TBP成像系统,能够快速捕获患者整个可见皮肤表面的宏观质量分辨率3D图像,并生成单个皮损图像块。这为开发更全面的机器学习模型提供了独特的机会。
在此背景下,国际皮肤影像协作组织(International Skin Imaging Collaboration, ISIC)举办了“ISIC 2024——基于3D-TBP的皮肤癌检测”(ISIC'24)在线机器学习大赛。该研究旨在评估基于3D-TBP的自动皮损选择能否准确支持全身皮肤检查,识别解释基于ML的3D-TBP算法风险感知的特征,并评估不同输入特征对诊断性能的相对重要性。
为了开展这项研究,研究人员利用了一个多机构全球项目收集的超过90万个从3D全身照片中裁剪的皮损图像块数据集。ISIC'24竞赛使用了独立的训练集、实时验证集和官方评分集。训练集是先前描述并公开可用的SLICE-3D数据集,包含来自约1000名患者的约40万个皮损图像块。测试数据则来自相同的医疗中心(但患者与训练集不同)以及两个新增来源,共包含超过1200名患者的约50万个皮损图像块。竞赛的主要评分指标是灵敏度超过80%时的部分接收者操作特征曲线下面积(partial area under the receiver operating characteristic curve above 80% sensitivity, pAUC>80% TPR)。
ISIC'24竞赛吸引了2739支参赛团队,提交了4998份作品。在恶性病变患病率极低(约0.1%)的数据集中,优胜模型在区分皮肤癌方面取得了卓越性能,其pAUC>80% TPR为0.1726,全曲线下面积(AUC)为0.9668。在灵敏度为80%时,需要处理(Number Needed to Triage, NNT)约52个皮损才能发现一个真正的阳性病例(NNT80% SE = 51.57);在灵敏度为90%时,NNT90% SE为98.20。从患者层面看,当对每名患者分诊最值得关注的15个皮损时,ISIC'24模型能检测出高达79%的真实阳性患者(SEtop-15 = 0.7903)。模型在区分任何形式的皮肤癌(包括黑色素细胞性和非黑色素细胞性)与专门区分黑色素瘤方面表现相似。
研究人员进一步对优胜模型进行了广泛的消融研究,以评估不同输入特征类别(即图像块、WB360“外观”元数据、基本“人口统计学”元数据和患者上下文信息)对诊断性能的相对重要性。研究发现,患者上下文(即在一个患者的所有皮损背景下评估某个皮损)具有显著影响。当从完整模型中去除患者上下文特征时,皮肤癌区分能力显著降低(AUC = 0.956 vs. AUC = 0.967, p < 0.001),并且在80%灵敏度阈值下,需要多分诊22个非恶性皮损。图像块所包含的信息不如预先提取的WB360测量值丰富。仅使用WB360“外观”元数据的模型变体显著优于仅使用图像块的变体(AUC = 0.939 vs. AUC = 0.922, p = 0.016)。基本“人口统计学”元数据(如患者年龄、性别、皮损解剖位置和医院/机构标签)也是一个关键因素。包含这些数据显著改善了仅使用WB360“外观”元数据和患者上下文的模型变体的性能(AUC = 0.957 vs. AUC = 0.949, p = 0.003)。
对模型感知风险的分析显示,某些颜色测量值与模型估计的风险评分存在轻度至中度相关。分割皮损内的色调(Hue)显示出最强的关联(p = -0.55),类似于红色与棕色的光谱;色调更红(更低)的皮损图像块往往被赋予更高的风险。皮损大小的测量值,如短轴直径(p = 0.37)、皮损面积(p = 0.35)和边界周长(p = 0.35),与风险评分呈轻度正相关。然而,通常与高度临床关注相关的边界不规则性(p = 0.18)和不对称性(p = 0.07)与风险评分的相关性较差。
优胜模型的架构结合了图像处理和元数据处理。图像处理分支包含三个神经网络分类模型(两个EVA模型和一个EdgeNext模型)的集成。元数据处理分支利用了所有可用的元数据,包括基本“人口统计学”和WB360“外观”元数据,并定义了交互项和“患者上下文”特征。这些特征包括标准化项(例如,根据患者的平均值调整皮损直径)和患者表型摘要(例如,皮损总数),模仿了临床异常皮损检测方法,如“丑小鸭”征。神经网络输出和元数据特征被输入到三个梯度提升树(Gradient Boosting Tree, GBT)模型中,其输出被聚合以生成每个皮损的风险估计。
研究结果
ISIC'24数据集与参与情况概览
ISIC'24利用了不同的数据集进行训练、实时验证和官方评分。私人排行榜数据集包含来自935名患者的370,704个皮损;每位患者的皮损数量中位数为243个。恶性标签包括99个黑色素瘤、190个基底细胞癌(BCC)和53个鳞状细胞癌(SCC)。竞赛竞争激烈,排名前五的团队分数差异小于0.001。95.5%的官方提交在公共排行榜上的得分高于私人排行榜,表明存在一定程度的过拟合。
基于3D TBP的ML模型进行皮肤癌检测的可行性
ISIC'24模型在皮肤癌检测方面表现出色。优胜模型在私人排行榜上得分pAUC>80% TPR = 0.1726,AUC = 0.9668。在患者层面,当分诊每名患者最值得关注的15个皮损时,模型能检测出79.03%的真实阳性患者(SEtop-15 = 0.7903)。模型在区分黑色素瘤方面同样表现优异(最佳提交pAUC>80% TPR = 0.1757, AUC = 0.9704)。与之前发表的Marchetti等人方法相比,ISIC'24模型性能显著提升(AUC = 0.967 vs. 0.704)。
3D TBP输入特征类别对诊断性能的相对重要性
消融研究表明,患者上下文信息对模型性能有显著影响,排除该特征会导致AUC显著下降。WB360“外观”元数据比单纯的图像块包含更多信息。基本“人口统计学”元数据也能显著提升模型性能。多模态数据(结合所有四类特征)的模型变体表现最佳。
皮损特征与感知风险的关联
分析显示,皮损内的色调(偏向红色)、周围皮肤发红、皮损与周围皮肤较低的蓝黄色(b*)对比度、皮损内较高的颜色方差和不对称性与较高的模型风险估计相关。皮损大小指标(如短轴直径、面积)与风险评分呈正相关,而边界不规则性和不对称性与风险评分相关性较弱。
研究结论与讨论
本研究通过大规模的ISIC'24竞赛证明,基于3D-TBP和机器学习的方法能够有效实现皮肤癌可疑病变的自动分诊。在患病率极低(0.09%)的环境中,优胜算法能在检测80%或90%真实阳性的同时,将需要专家评估的皮损数量分别减少95%或91%。这为在专科诊所简化工作流程或改善高危个体转诊提供了概念验证。
研究结果强调了多模态数据和患者上下文信息在提升模型性能方面的重要性。患者上下文特征的整合,模仿了临床识别“丑小鸭”征等异常皮损的逻辑,显著改善了分诊效率。同时,WB360系统提取的定量外观元数据比单纯依赖图像块视觉信息的模型表现更好,表明预计算的、可解释的特征在当前阶段仍具价值。
然而,将ISIC'24模型应用于实际临床分诊仍面临障碍,包括3D-TBP成像技术的可及性和成本、对特定系统(Vectra WB360) proprietary 元数据的依赖、以及模型处理效率等问题。此外,模型的泛化性需要在更多样化的人群中进行进一步验证,并需考虑引入新技术可能带来的过度诊断等潜在风险。
总之,这项研究显著推进了基于3D-TBP的自动皮肤病变分诊领域,证明了其在提高皮肤癌早期检测效率方面的巨大潜力。未来的工作应侧重于提高模型的可解释性、泛化能力,并进行严格的临床效用和成本效益评估,以推动其向现实世界应用的转化。该研究发表于《npj Digital Medicine》期刊。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号