基于深度学习的中医生望诊阳虚证舌象亚型识别(Deep learning for subtype recognition of Yang deficiency tongue images in traditional Chinese medicine)

《Digital Chinese Medicine》：Deep learning for subtype recognition of Yang deficiency tongue images in traditional Chinese medicine

【字体：大中小】 时间：2026年06月13日 来源：Digital Chinese Medicine CS1.8

编辑推荐：

　　目的(Objective)：针对特定阳虚证亚型缺乏细粒度临床识别手段，以及常规目标检测模型难以提取不规则、低对比度舌象表型的问题，研究人员旨在基于改进的You Only Look Once nano(YOLO11n)架构开发客观亚型识别框架，利用标准化视觉表型

目的(Objective)：针对特定阳虚证亚型缺乏细粒度临床识别手段，以及常规目标检测模型难以提取不规则、低对比度舌象表型的问题，研究人员旨在基于改进的You Only Look Once nano(YOLO11n)架构开发客观亚型识别框架，利用标准化视觉表型矩阵将中医(TCM)宏观描述转化为可量化临床靶标。方法(Methods)：此项横断面诊断研究连续纳入2024年9月1日至2025年6月1日皖南医学院第一附属医院(弋矶山医院)甲状腺乳腺外科疑似阳虚体质成人住院患者，采集临床舌图像。基于专家视觉表型标注矩阵建立五分类识别体系，包括脾湿壅盛证、轻度肾阳虚证、上热下寒证、阴阳两虚证及阴虚津亏证(阴性对照)。所提出的阳虚YOLO(Yang deficiency YOLO, YD-YOLO)模型以YOLO11n为基线，在骨干网络中融入C3k2-GhostBottleneck-Dynamic Convolution(GBDC)模块以自适应提取低对比度特征，在颈部嵌入多路径聚合坐标注意力(multipath aggregation coordinate attention, MACA)机制通过多尺度空间协调抑制背景干扰。采用梯度加权类激活映射(Gradient-weighted Class Activation Mapping, Grad-CAM)可视化特征归因并评估模型关注区域的生物学合理性。通过消融与对比实验，以平均精度均值(mean Average Precision, mAP)、精确率(Precision)、召回率(Recall)、F1值、推理速度(帧每秒,frames per second, FPS)、总体准确率(Overall Accuracy)、Cohen's kappa及受试者工作特征曲线下面积(area Under the receiver operating characteristic Curve, AUC)评估模型性能。结果(Results)：最终纳入1186例临床病例，YD-YOLO模型总体准确率为91.5%，Cohen's kappa为0.912，mAP@50为0.731[高于YOLO11n基线(0.681)]，各阳虚亚型AUC为0.91～0.97。其中轻度肾阳虚证mAP@50最高(0.900)，推理速度达89.00 FPS。Grad-CAM分析显示模型将激活区域定位于齿痕、根部苔斑等关键中医病理特征，同时抑制非诊断性口腔背景噪声。结论(Conclusion)：YD-YOLO模型证明了深度学习用于中医阳虚证亚型细粒度分类的可行性。通过融合视觉表型量化与模型可解释性，所提框架为辨证提供客观依据，支持标准化数字化中医诊断系统开发及临床决策支持。

《Digital Chinese Medicine》论文解读——基于改进YOLO11的中医阳虚证舌象亚型细粒度识别研究

一、研究背景与意义

传统中医舌诊是"四诊"的核心环节，阳虚证在临床体质辨识中占比达9.4%～16.7%，其不同亚型（如脾湿壅盛、轻度肾阳虚、上热下寒、阴阳两虚）对应截然不同的治则方药（理中汤、真武汤、桂枝龙骨牡蛎汤等）。然而目前临床对阳虚亚型的区分高度依赖医师主观经验，缺乏量化标准；现有人工智能辅助舌诊研究多仅做"有/无阳虚"的二分类，忽略细粒度亚型差异，且通用目标检测模型对舌象中低对比度的淡白舌红通道衰减、细微齿痕裂纹等不规则表型特征提取能力不足。为此，Zhang Tongbin、Xu Haoran、Wang Ziyi、Pan Chuanjun、Wang Zheng、Wang Lei开展本研究，建立基于视觉表型矩阵的阳虚舌象五分类标注体系，在YOLO11n基础上引入动态卷积与坐标注意力机制构建YD-YOLO模型，实现阳虚亚型的客观细粒度识别，总体准确率达91.5%，并通过Grad-CAM验证模型关注区域与中医临床诊断焦点一致，为中医数字化诊断及临床决策支持提供依据。

二、主要关键技术方法

研究人员收集皖南医学院第一附属医院2024年9月至2025年6月甲状腺乳腺外科疑似阳虚体质住院患者舌象，经纳入排除标准筛选后最终纳入1186例。依据国标GB/T 16751.2-1997及?《中医诊断学》建立专家视觉表型标注矩阵（Expert Visual Phenotype Annotation Matrix），将舌象按主要视觉特征聚类为五类：脾湿壅盛证（边缘齿痕+白厚腻苔）、轻度肾阳虚证（R通道衰减淡白舌+根区水滑苔）、上热下寒证（舌尖红点+根部白厚/滑苔）、阴阳两虚证（淡胖舌+少苔/剥苔/裂纹）及阴虚津亏证（红绛舌+镜面舌/深裂纹，阴性对照），由两名执业中医师按0～2分三级评分，取阈值τ=2分配单标签。以YOLO11n为基线，Backbone中C3k2模块替换为C3k2-GhostBottleneck-DynamicConv(C3k2-GBDC)以自适应提取低对比度形态变异特征，Neck中嵌入多路径聚合坐标注意力(multipath Aggregation Coordinate Attention, MACA)抑制口腔背景干扰。数据集按8:1:1划分训练/验证/测试集，输入分辨率640×640像素，采用随机平移与高斯模糊及颜色抖动数据增强，以mAP@50、mAP@50–95、Precision、Recall、F1、FPS、Overall Accuracy、Cohen's κ及AUC评估，Grad-CAM进行特征归因可视化。

三、研究结果

3.1. Dataset distribution and sample characteristics（数据集分布与样本特征）

初筛1221例剔除35例质量不合格或复合证型无法归类的图像后，最终1186例含脾湿壅盛320例、轻度肾阳虚315例、上热下寒280例、阴阳两虚135例、阴虚津亏136例。各组核心视觉表型（齿痕、厚腻苔、淡白、尖红、少苔裂纹）分布差异具统计学意义(P<0.001)，验证了五类间视觉判别依据的有效性。

3.2. Validation of the annotation protocol（标注方案验证）

随机抽取200例验证，累积视觉表型评分判别证候的ROC曲线下面积AUC=0.92，Youden指数确定最佳标签赋值阈值τ=2，两名标注者Cohen's κ=0.83(P<0.001)，评分分布在阳虚亚型与阴性对照间具明显分离度，证实标注框架可靠可重复。

3.3. Ablation analysis of MACA and C3k2-GBDC modules for performance enhancement（MACA与C3k2-GBDC模块的消融分析）

YOLO11n基线mAP@50=0.681；单独加MACA升至0.714，单独加C3k2-GBDC升至0.702；二者结合的YD-YOLO达最高mAP@50=0.731、mAP@50–95=0.647，参数量3.37 M、计算量8.5 GFLOPs、推理速度89.00 FPS。在相同基线下MACA优于SE(mAP@50=0.711)与CBAM(mAP@50=0.718)，且在少数类（阴虚津亏、脾湿壅盛）上提升更显著，表明对类别不平衡具更好鲁棒性。

3.4. Benchmarking against state-of-the-art detection models（与主流检测模型的对比基准实验）

轻量模型YOLO-Lite与MobileNetV3-YOLO mAP@50分别为0.615与0.642但精度偏低；Swin-Transformer mAP@50=0.755但计算开销大(245.2 GFLOPs, 24 FPS)。YD-YOLO(mAP@50=0.731, 8.5 GFLOPs, 89 FPS)在精度与部署需求间取得平衡，各亚型中以轻度肾阳虚mAP@50最高(0.900)，Precision与Recall分别达0.738与0.715，F1=0.720。

3.5. Classification performance and reliability of the YD-YOLO model（YD-YOLO分类性能与可靠性）

测试集上总体分类准确率91.5%，Cohen's κ=0.912，五亚型各自ROC-AUC介于0.91～0.97，表明模型判别力强且与专家共识一致性高。

3.6. Feature attribution and visual interpretability using Grad-CAM（基于Grad-CAM的特征归因与可视化解译）

基线YOLO11n激活弥散于全舌体；加入MACA后激活聚焦于边缘齿痕及厚腻苔区，C3k2-GBDC增强了对淡白舌根部低对比度水滑苔的响应；YD-YOLO同时定位上热下寒证的舌尖红点与淡白舌根，符合中医"心肾不交"病位判断，且较MobileNetV3-YOLO与Swin-Transformer更少受口腔背景干扰，证实模型决策基于生物学合理的中医病理特征。

四、讨论与结论

讨论指出本研究通过将国家标准宏观描述转化为量化视觉表型矩阵解决了阳虚亚型细粒度识别难题，MACA机制使mAP@50较基线提升3.3个百分点主要通过抑制9.1%背景干扰实现，C3k2-GBDC通过自适应卷积核增强R通道衰减等低对比度信号贡献额外1.7个百分点增益。Grad-CAM热图与中医师诊察重点区域一致，克服了深度学习"黑箱"问题，有助于临床信任与推广。局限性包括暂未纳入复合证型、标准光照条件下采集对跨设备泛化待验证、需多中心前瞻性队列进一步确证。研究人员开发了原型决策支持系统，可将检测框内病理特征映射至对应基础方剂及随症加减（如脾湿壅盛见明显齿痕推荐加黄芪、茯苓），供中医师审核调整而非替代人工辨证。

结论(Conclusion)：研究人员通过建立改进YOLO11架构与中医临床知识融合的细粒度识别框架，将国标GB/T 16751.2-1997宏观描述翻译为可量化视觉表型矩阵以减少辨证主观性。借助MACA机制与C3k2-GBDC模块，模型在五类证型上达到mAP@50=0.731及总体诊断准确率91.5%。交互式辅助系统将深度学习输出关联临床决策，提供可解释视觉证据与处方参考，为中医诊断客观化减少医师间差异、提高临床一致性提供了可行模型。

热点排行