编辑推荐:
目前舌象分割存在计算复杂度高、参数规模大及舌边缘分割不准确等问题。研究人员基于 DeepLabV3 + 开展轻量级舌象分割模型研究。结果显示,改进模型在多指标提升,计算和参数复杂度显著降低。为舌象分割提供新方法,具应用价值。
在传统中医领域,舌诊占据着极为重要的地位。中医通过观察舌头的颜色、形状、舌苔等特征,就能对人体的健康状况进行判断,仿佛舌头是一扇通往人体内部世界的窗户。然而,这一古老的诊断方式却面临着诸多挑战。传统的舌诊高度依赖医生的专业知识和丰富经验,不同医生的判断可能存在差异,就像不同人看同一幅画会有不同的理解一样。而且,外部环境因素,比如光线的强弱,也会影响观察结果,使得舌诊的准确性大打折扣。
随着科技的飞速发展,自动化、智能化的舌诊系统成为了人们追求的目标。在构建这样的系统时,舌象分割是关键的第一步,它要从复杂的图像背景中精准地提取出舌头区域。可当前的舌象分割方法问题不少,计算复杂度高,就像是一辆油耗巨大的汽车,消耗大量的计算资源;参数规模庞大,模型运行起来十分 “笨重”;舌边缘分割更是不准确,分割出来的舌头边缘参差不齐,这直接影响了后续舌象分析的准确性。为了解决这些难题,来自北京中医药大学第三附属医院的研究人员展开了深入的研究。
他们以经典的 DeepLabV3 + 模型为基础,进行了一系列创新性的改进。研究结果令人惊喜,改进后的模型在多个关键指标上表现优异。在两个数据集上,交并比(IoU)、平均交并比(mIoU)、骰子系数(Dice coefficient)、平均像素准确率(MPA)和准确率都有显著提升。而且,计算复杂度大幅降低,浮点运算次数(FLOPs)减少约 50%,参数规模缩小约 90%,训练和推理速度更快。这一研究成果发表在《Biomedical Signal Processing and Control》上,为舌象分割领域开辟了新的道路,有望推动中医舌诊朝着更加客观、精准、智能化的方向发展,让古老的中医舌诊在现代科技的加持下焕发出新的生机。
研究人员主要采用了以下关键技术方法:一是选用自建数据集和公开数据集 BIOHit 进行实验,自建数据集由北京中医药大学第三附属医院利用专业四诊仪在临床收集。二是对 DeepLabV3 + 模型进行改造,将骨干网络替换为轻量级的 MobileNet,以降低模型复杂度;改进空洞空间金字塔池化(ASPP)模块,调整空洞卷积率并引入卷积块注意力模块(CBAM),获取更丰富的多尺度语义信息;集成 PointRend 模块,弥补上采样时区域信息的缺失,提升舌边缘分割效果。
数据集和预处理
实验使用了两个数据集,自建数据集由北京中医药大学第三附属医院通过专业四诊仪在临床收集,在恒定光源下采集患者正面舌面和面部图像,共收集 1840 张舌面图像。另一个是公开数据集 BIOHit。对这些数据进行预处理,为后续模型训练提供优质的数据基础。
实验评估指标
研究采用交并比(IoU)、平均交并比(mIoU)、骰子系数(Dice coefficient)、像素准确率(PA)和平均像素准确率(MPA)来评估模型性能。这些指标基于混淆矩阵中的真阳性(TP)、假阳性(FP)、真阴性(TN)和假阴性(FN)计算,能准确衡量模型在舌象语义分割中的表现。
研究结果
通过在两个数据集上对改进模型与经典模型进行对比实验,结果表明改进模型在 IoU、mIoU、Dice 系数、MPA 和准确率等指标上均有显著提升。同时,改进模型的 FLOPs 减少约 50%,参数规模缩小约 90%,这意味着模型的计算复杂度和参数复杂度大幅降低,训练和推理速度更快,在实际应用中更具优势。
研究结论和讨论
本研究成功解决了舌象分割任务中模型复杂度高、训练和推理速度慢以及舌边缘分割不准确的问题。通过对 DeepLabV3 + 模型的改进,引入轻量级 MobileNet 骨干网络、CBAM 注意力机制和 PointRend 模块,有效提升了模型性能。该研究为舌象分割提供了新的方法,在中医舌诊自动化、智能化领域具有重要的实践应用价值,有望推动中医舌诊与现代医学技术的深度融合,助力中医现代化发展。