编辑推荐:
为解决传统腭中缝成熟阶段分类依赖人工判读的主观性与低效性问题,研究人员开展基于 CBCT 影像的深度学习自动分类研究,开发 MFCRAN 框架,经 k-fold 验证获 79.02% 准确率,为正畸精准诊疗提供新工具。
在正畸领域,准确判断腭中缝成熟阶段对诊疗方案制定至关重要。传统依靠人工解读 CBCT 影像的方法存在主观性强、依赖医师经验且耗时等问题,不同评估者间一致性较差,难以满足临床精准需求。同时,以年龄为判断依据的方法因个体差异显著,无法可靠反映缝合线融合状态,导致治疗时机选择困难,可能引发不必要的创伤或治疗失败。因此,开发客观、高效的自动化分类方法成为正畸诊断的迫切需求。
美国伊利诺伊大学芝加哥分校的研究人员针对这一挑战,开展了基于深度学习的腭中缝成熟阶段自动分类研究。他们提出一种端到端的深度学习框架,通过整合多种创新技术,实现了对 CBCT 影像中腭中缝成熟阶段的精准识别,相关成果发表在《Scientific Reports》。
研究人员采用的关键技术方法包括:首先对 CBCT 影像进行感兴趣区域(ROI)提取,聚焦腭中缝所在的轴向切片;然后运用高通滤波器和索贝尔(Sobel)滤波器进行预处理,增强边缘和细微结构等低层特征;构建多滤波器卷积残差注意力网络(MFCRAN),融合高效网络(EfficientNet)和残差网络(ResNet18)架构,并引入离散余弦变换(DCT)层以优化频域特征提取;采用基于排名损失的监督训练策略,结合定制化数据增强方法提升模型鲁棒性;通过五折交叉验证(k-fold cross-validation)评估模型性能,数据集包含 618 幅经专家标注的 CBCT 图像,分为 A-E 五个阶段。
模型架构与预处理效果
研究设计了包含并行滤波流的 MFCRAN 网络,结合六种不同敏感度的高通和索贝尔滤波器(如高敏感度高通滤波器、多阶索贝尔滤波器),显著提升了模型对细微解剖差异的捕捉能力。实验表明,预处理步骤使模型准确率较基线模型提升约 5%-8%,证明了增强低层特征对医学影像分类的重要性。
混合网络与频域特征优化
将 EfficientNet B0 和 ResNet18 作为基础模型,引入 DCT 层将空间特征转换为频域表示,通过软阈值化处理抑制噪声,提升信号噪比。结果显示,含 DCT 层的 MFCRAN_DCT_FC 模型准确率达 76.91%,较不含 DCT 的版本提升约 2.3%,表明频域分析对捕捉缝合线纹理和融合模式的关键作用。
损失函数与分类性能
提出改进的基于边际的负对数损失函数(MNRL),通过自定义距离矩阵对不同类别间的误分类施加差异化惩罚。实验表明,MNRL 结合 DCT 的 MFCRAN_DCT_FC_MNRL 模型实现了 79.02% 的最高准确率,显著优于 ResNet18(73.33%)、EfficientNet B0(71.87%)等基线模型,且在精确率、召回率和 F1 分数上均表现最优。
模型可解释性与临床验证
通过梯度加权类激活映射(Grad-CAM)可视化模型关注区域,发现其注意力集中于腭中缝及邻近上颌骨的关键解剖结构,与临床专家手动评估的重点区域高度吻合,验证了模型决策的合理性。混淆矩阵显示,分类错误主要发生在相邻阶段(如 A-B、D-E),与临床中因形态差异细微导致的判别困难一致,表明模型性能符合实际诊断挑战。
该研究首次实现了腭中缝成熟阶段的全自动深度学习分类,突破了传统人工评估的局限性。通过整合多模态滤波、频域特征优化和定制化损失函数,构建的 MFCRAN 框架在保持计算效率的同时(参数仅 1260 万),显著提升了分类准确性和一致性。研究结果为正畸临床提供了客观的辅助诊断工具,有望减少因主观评估导致的治疗误差,优化快速上颌扩弓(RME)、微种植体辅助扩弓(MARPE)等术式的时机选择,推动精准正畸的发展。未来研究可进一步扩大样本多样性,探索多模态影像融合,以提升模型在复杂临床场景中的泛化能力。