
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于舌象特征与深度学习的智能中医体质辨识模型:一项前瞻性双中心研究
【字体: 大 中 小 】 时间:2025年06月13日 来源:Chinese Medicine 5.3
编辑推荐:
本研究针对传统中医体质辨识方法主观性强、效率低下的问题,创新性地结合舌象特征与深度学习技术,开发了融合传统特征与深度特征的MLP(多层感知机)模型。通过双中心1374例样本验证,模型测试集准确率达0.837,AUC达0.898,为中医体质辨识提供了客观量化工具,推动中医诊断现代化进程。研究采用ISE-UNet++舌象分割、ResNet-50深度特征提取等关键技术,通过LASSO和随机森林筛选出37个关键特征,Grad-CAM可视化验证了模型决策与中医理论的一致性。
在中医诊疗实践中,体质辨识一直是个体化治疗的核心环节。传统方法主要依赖医师经验判断或冗长的问卷评估,存在主观性强、效率低下等问题。据统计,中国人群中80%以上的体质类型集中在平和质、气虚质、阳虚质、湿热质和气郁质五种类型,但现有识别方法难以满足大规模健康管理的需求。舌诊作为中医"望闻问切"四诊中的重要组成部分,其形态、颜色等特征与体质类型存在显著关联,这为开发客观化识别工具提供了突破口。
北京中医药大学和中国中医科学院广安门医院的研究团队开展了一项前瞻性双中心研究,通过融合传统舌象特征与深度学习技术,成功构建了中医体质智能识别模型。该研究采集了1374名受试者的标准化舌象图像,创新性地采用ISE-UNet++网络进行舌体分割,结合ResNet-50提取深度特征,并运用LASSO回归和随机森林筛选出37个关键特征。最终构建的多层感知机(MLP)模型在测试集上达到0.837的准确率和0.898的AUC值,相关成果发表在《Chinese Medicine》期刊。
研究团队主要采用了以下关键技术:1)使用四诊仪(DS01-B)标准化采集舌象图像;2)改进的ISE-UNet++网络实现高精度舌体分割(MIoU达98.45%);3)ResNet-50提取2048维深度特征;4)LASSO和随机森林筛选11个传统特征和26个深度特征;5)SMOTE和加权损失函数解决类别不平衡问题;6)Grad-CAM技术可视化模型决策依据。
【舌象图像分割结果】
研究团队对比了UNet、UNet++和ISE-UNet++三种分割网络,改进后的ISE-UNet++通过引入InceptionDWConv2d模块和SE注意力机制,在MIoU、MPA和准确率指标上均显著提升。其中分割准确率达到99.17%,为后续特征提取奠定了坚实基础。

【特征筛选结果】
通过LASSO回归和随机森林的交叉验证,研究确定了11个关键传统特征(如舌裂纹、齿痕等)和26个深度特征。特征重要性分析显示,深度特征DL_2046和DL_628等对分类贡献最大,而传统特征中性别和年龄也具有显著影响。这种特征融合策略使模型既保留了中医诊断经验,又挖掘了人眼难以识别的细微模式。

【模型性能比较】
在八种机器学习算法中,基于特征融合的MLP模型表现最优,训练集准确率达0.893(AUC 0.948),测试集准确率0.837(AUC 0.898)。相比单一特征模型,融合模型对气虚质和阳虚质的识别灵敏度分别提升至0.761和0.680,特异性维持在0.93以上。五折交叉验证显示模型具有良好稳定性,平均AUC达0.886。

【模型可解释性分析】
通过Grad-CAM热图可视化,研究发现模型关注的舌象特征与中医理论高度吻合:气虚质侧重舌中部裂纹(对应脾胃虚弱),阳虚质关注舌边齿痕(反映脾肾阳虚),湿热质聚焦黄腻苔(提示湿热内蕴),气郁质注重舌尖红变(关联心火亢盛)。这种可解释性验证了模型决策的中医理论基础。

该研究首次实现了舌象特征与深度学习在中医体质辨识中的系统性融合,其创新价值主要体现在三个方面:方法学上,创建的ISE-UNet++分割网络和特征融合策略为中医图像处理提供了新范式;临床上,0.898的AUC值证明该模型已达到辅助诊断级精度;应用前景上,研究成果可直接转化为移动端舌诊系统,推动中医预防医学的普及。局限性在于样本主要来自北方人群,未来需扩大地域多样性验证。这项研究为中医现代化提供了关键技术支撑,其"舌象-体质-疾病"的关联挖掘思路也为后续研究开辟了新方向。
生物通微信公众号
知名企业招聘