
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于注意力机制与多任务学习的口腔CBCT扫描年龄性别可解释性深度学习模型
【字体: 大 中 小 】 时间:2025年05月25日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对法医和临床诊断中锥形束计算机断层扫描(CBCT)图像年龄估计和性别分类的准确性与可解释性难题,开发了集成卷积块注意力模块(CBAM)和梯度加权类激活映射(Grad-CAM)的多任务深度学习框架。通过提取CBCT全景切片,模型在2426例7-23岁样本中实现年龄估计平均绝对误差(MAE)1.08年、性别分类准确率95.3%,显著优于传统方法,为法医学提供兼具高效性与透明性的AI解决方案。
在法医鉴定和临床诊断领域,准确推断个体年龄和性别是身份识别的关键环节。传统基于锥形束计算机断层扫描(CBCT)的方法面临计算成本高、可解释性差的双重困境,尤其当涉及未成年人法律身份判定或性别相关疾病诊断时,现有技术的局限性更为凸显。随着深度学习在医学影像分析中的广泛应用,如何让算法决策过程符合法医学要求的透明标准,成为制约技术落地的核心挑战。
为解决这一难题,设拉子理工大学与设拉子医科大学的研究团队在《Scientific Reports》发表研究,创新性地将多任务学习(MTL)架构与注意力机制相结合,开发出可同时完成年龄回归和性别分类的深度学习系统。该研究通过提取CBCT扫描中的二维全景切片,在保留三维空间特征的前提下大幅降低计算复杂度,并引入卷积块注意力模块(CBAM)引导模型聚焦下颌骨、上颌窦等关键解剖标志,配合梯度加权类激活映射(Grad-CAM)生成可视化热力图,使算法决策依据与法医解剖学知识形成互证。
关键技术方法包括:1) 从2426例7-23岁患者的临床CBCT扫描中重建全景切片;2) 构建基于InceptionV3的多任务网络,共享特征提取层并分别输出年龄回归(均方误差损失)和性别分类(二元交叉熵损失)结果;3) 集成CBAM注意力机制强化关键区域特征学习;4) 采用Grad-CAM可视化模型关注区域;5) 通过五折交叉验证评估性能。
研究结果显示:
关键发现:InceptionV3+CBAM组合取得最优性能,年龄估计MAE低至1.08年(R2=0.93),显著优于ResNet50(MAE=1.56)等对照架构;性别分类准确率达95.3%(AUC=0.97),尤其在7-10岁组表现突出(准确率95.5%)。
性能对比:相比传统3D CBCT处理方法(如Pham等报道的MAE=5.15年),二维切片策略将误差降低82%;注意力机制使各年龄组MAE平均改善28%,证实解剖引导特征学习的有效性。
可解释性验证:如图6所示,Attention+Grad-CAM热图精准标记磨牙、前磨牙等具有发育学特征的区域,与法医人类学依据高度吻合。相比单纯Grad-CAM,联合注意力使关注区域缩小37%,定位更精确。
讨论部分指出,该研究的创新性体现在三方面:首次将MTL框架应用于CBCT衍生图像的双任务预测;开发适应法医学需求的混合损失函数平衡策略;建立可解释性技术链(CBAM+Grad-CAM)实现决策可视化。尽管存在样本年龄范围局限(仅涵盖7-23岁)和单中心数据的不足,但模型在未成年组的表现尤其突出,这对涉及青少年司法鉴定的场景具有特殊价值。
这项研究为法医影像学树立了新范式,证明通过合理的架构设计,深度学习既能保持CBCT的空间信息优势,又能满足司法场景对算法透明性的严苛要求。未来扩展方向包括纳入更广年龄跨度样本、探索Transformer架构在牙科影像的应用,以及开发支持非二元性别分类的包容性系统。
生物通微信公众号
知名企业招聘