
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度学习的无限制口腔黏膜病变多分类诊断系统开发与验证
【字体: 大 中 小 】 时间:2025年07月20日 来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
研究人员针对口腔癌(OC)早期诊断率低、生存率差的临床难题,创新性地采用深度学习(DL)技术对无拍摄限制的口腔黏膜病变临床图像进行四分类(健康/良性/潜在恶性(OPMD)/恶性),构建的ConvNeXt v2 Tiny模型在384×384像素输入下取得85.53%准确率与97.40% ROC AUC,为临床提供高效辅助诊断工具。
口腔癌是全球第16位高发恶性肿瘤,五年生存率长期停滞在50%左右,这与60%病例确诊时已属晚期密切相关。更棘手的是,口腔潜在恶性疾病(OPMD)如口腔扁平苔藓、白斑等具有1-5%的癌变风险,但临床鉴别诊断存在两大痛点:一是口腔病变种类多达40余种且临床表现相似,二是基层医生缺乏诊断经验导致转诊延误。传统活检作为金标准虽可靠,却存在侵入性强、成本高等局限性。
为突破这些瓶颈,西班牙圣卡洛斯医院等机构的研究团队在《Biomedical Signal Processing and Control》发表创新研究。他们收集1013名白人患者的3246张无拍摄限制的口腔临床图像,涵盖口腔各解剖部位及40种病变类型,采用12种深度学习架构进行四分类比较。关键技术包括:基于ImageNet预训练的迁移学习策略;分层随机划分训练集(70%)/验证集(20%)/测试集(10%);在线数据增强(旋转/翻转/高斯模糊等);采用Nadam优化器与ReduceLROnPlateau动态学习率调整;重点评估了新型混合架构ConvNeXt v2的性能。
【模型比较实验】在224×224像素输入下,ConvNeXt v2 Tiny以83.67%准确率超越传统CNN和ViT模型,其参数量(28M)仅为Base版的1/3。值得注意的是,当输入尺寸增至384×384像素时,该模型性能全面提升:准确率达85.53%,F1-score提升1.25个百分点至84.92%,ROC AUC高达97.40%,显著优于DenseNet 121等参照模型。
【误诊分析】混淆矩阵显示关键临床错误率:9.09%恶性病例被误判为良性,5.1%的OPMD被归类为健康组织。这些误差主要源于罕见病变样本不足,如口腔黑色素瘤仅16例样本。
【技术优势】ConvNeXt v2的创新性体现在:①引入全局响应归一化(GRN)增强特征对比度;②采用GELU激活函数优化梯度传播;③结合ViT的长程建模优势与CNN的局部特征提取能力。相比需要手动标注病灶区域(ROI)的既往研究,该模型直接处理全口腔图像,更符合临床实际需求。
这项研究实现了三大突破:首次在无拍摄协议约束下完成40种口腔病变的四分类;验证了ConvNeXt v2在医学图像分析的优越性;构建的移动端兼容模型(384×384像素)为基层医疗提供可行解决方案。未来通过扩充多族裔样本、整合患者吸烟史等元数据,可进一步提升模型泛化能力。该成果为改变口腔癌早期诊断困境提供了切实可行的AI辅助工具,对实现WHO提出的"全球癌症生存率差距减半"目标具有重要实践意义。
生物通微信公众号
知名企业招聘