
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于ResUNet架构的人工智能模型在全景X线片中实现气道与软组织精准分割的创新研究
【字体: 大 中 小 】 时间:2025年06月03日 来源:BMC Oral Health 2.6
编辑推荐:
针对全景X线片中气道与软组织易误诊为骨折或病变的临床难题,土耳其Sivas Cumhuriyet大学团队开发了基于ResUNet架构的AI模型,成功实现鼻/口/口咽气道及舌/软腭/悬雍垂的同步分割。模型测试准确率达0.979,IoU 0.777,为口腔诊断提供高效决策支持,显著降低误诊风险。
在口腔临床实践中,全景X线片因其低辐射剂量和广覆盖范围成为常规检查手段。然而,这些影像中呈现的鼻、口、口咽气道(呈现为低密度影)与舌、软腭、悬雍垂(呈现为高密度影)常因解剖结构叠加被误判为骨折线或骨质破坏性病变。更棘手的是,牙科医师在繁重的工作压力下,可能因经验不足将悬雍垂阴影误认为下颌支病变,或将口腔气道误诊为前牙根尖周病变。这种误诊可能导致不必要的治疗或延误真实病情的发现。
为解决这一临床痛点,Sivas Cumhuriyet大学口腔颌面放射科团队开展了一项开创性研究。研究人员开发了基于ResUNet架构的深度学习模型,首次实现全景X线片中多类解剖结构的同步精准分割。该模型通过融合UNet的编码器-解码器结构与ResNet-50的残差块优势,在保持医学图像细节的同时有效防止过拟合。论文发表于《BMC Oral Health》,为AI辅助口腔影像诊断开辟了新方向。
研究团队采用三项核心技术:1)使用CVAT工具对1004张全景X线片进行六类结构标注(含鼻/口/口咽气道及舌/软腭/悬雍垂);2)应用Albumentations库实施包括旋转(0°-10°)、像素丢弃等12种数据增强策略;3)构建含74层、2430万参数的ResUNet模型,采用Adam优化器和余弦衰减学习率调度(初始0.001)。所有影像均来自同一设备(Instrumentarium OP200D,66kVp/5.0mA/14s)。
【结果】
背景:研究证实气道与软组织误诊率高达临床病例的23%(既往文献),凸显技术开发的紧迫性。
方法:通过分层随机抽样将数据集划分为训练集(72%)、验证集(18%)和测试集(10%),确保各类结构均衡呈现。
图像分割与掩模创建:采用多边形标注工具精细勾勒解剖边界,编码后生成7通道二值矩阵(背景+6类结构)。
图像处理与数据增强:将图像统一调整为768×384像素,应用弹性变形、运动模糊等增强技术,使有限数据集扩展至等效5000+样本量。
人工智能模型:ResUNet在训练阶段即展现优异性能,平均交并比(Mean IoU)达0.864,损失值仅0.459。
模型训练:50个epoch后,敏感度和F1分数均突破0.9,验证集准确率稳定在97.9%以上。
统计方法:采用ICC评估标注者一致性(0.762-0.958),证实标注可靠性。
训练结果:模型对舌体分割表现最佳(IoU 0.945),悬雍垂识别相对较弱(IoU 0.523),反映小结构分割的共性挑战。
测试结果:在独立测试集上,模型整体准确率达0.979,但平均精度(mAP)存在波动(0.089-0.754),提示需针对悬雍垂优化特征提取策略。
【结论与意义】
该研究成功推翻原假设,证实ResUNet架构能高效分割全景X线片中的复杂叠加结构。特别值得注意的是:1)舌体检测灵敏度达0.983,为牙科AI中最高记录;2)鼻气道分割精度0.924,可有效避免误诊为上颌窦病变;3)尽管悬雍垂分割性能相对较低(AP 0.089),其仍显著高于随机识别水平。临床价值体现在三方面:首先,作为诊断辅助工具,可减少17%的误诊(基于测试集模拟);其次,教学应用中能帮助医学生快速掌握解剖标志;最后,该技术框架可扩展至其他医学影像分割任务。研究局限性包括单中心数据来源和未对比其他算法,未来将通过多中心合作进一步优化模型泛化能力。这项成果标志着口腔影像分析从单一结构识别迈入多目标智能解析的新阶段。
生物通微信公众号
知名企业招聘