编辑推荐:
为解决菌状乳头(FPs)手动检测耗时主观等问题,研究人员采用经典 U-Net、MultiResUNet 和优化 U-Net 对 175 张舌图像开展 FP 自动识别研究。结果显示优化 U-Net 性能最佳,为味觉障碍诊断和个性化营养提供新方法。
味觉作为人体感知世界的重要感官,不仅关乎美食体验,更与健康息息相关。菌状乳头(Fungiform Papillae, FPs)作为味觉感知的关键结构,其数量与功能的个体差异会直接影响人们对滋味的辨别能力,甚至与肥胖、糖尿病等代谢性疾病的发生风险紧密相连。然而,传统的 FPs 检测依赖人工染色和视觉计数,不仅耗时费力,还存在主观误差大、标准化困难等问题,尤其在面对复杂形态的乳头或大规模样本时,效率与准确性均难以保证。因此,开发一种高效、可靠的自动化检测方法,成为味觉研究领域亟待突破的技术瓶颈。
来自意大利卡利亚里大学医院的研究团队针对这一挑战,开展了基于深度学习的 FPs 自动识别研究。他们利用三种卷积神经网络(Convolutional Neural Networks, CNNs)模型 —— 经典 U-Net、MultiResUNet 和优化 U-Net,对 175 名健康受试者的舌部图像进行分析,旨在筛选出对 FPs 形态和分布变异具有高鲁棒性的检测模型。研究成果发表在《Computational and Structural Biotechnology Journal》,为味觉功能的量化研究提供了新的技术范式。
研究人员采用标准化流程获取舌部图像:通过蓝色食用染料(E133)染色区分菌状乳头与丝状乳头,在舌前部划定 6mm 直径的圆形感兴趣区域,由三名观察者独立计数并达成共识,以此构建用于模型训练的金标准(Ground Truth)。图像预处理环节包括椭圆检测、区域裁剪、尺寸标准化(250×250 像素)和对比度受限的自适应直方图均衡化(CLAHE),以增强 FPs 的视觉特征。
模型训练采用五折交叉验证策略,以均方误差(MSE)为损失函数,结合 Adam 优化器和数据增强技术(旋转、翻转、亮度调整)提升泛化能力。研究对比了三种网络的性能表现:经典 U-Net 采用编码器 - 解码器结构,通过四层卷积块提取特征;MultiResUNet 引入多分辨率卷积块以捕捉不同尺度细节;优化 U-Net 则通过减少卷积核数量、添加批量归一化(Batch Normalization)和 dropout 层,降低过拟合风险并加速训练收敛。
3. 结果分析
3.1 模型训练稳定性
通过监测 500 个训练周期的损失函数(MSE)和平均绝对误差(MAE),优化 U-Net 表现出最佳稳定性:其训练与验证曲线趋势一致,误差值快速收敛且波动较小,而 MultiResUNet 出现明显过拟合迹象,经典 U-Net 虽收敛较快但验证误差波动大于优化模型。
3.2 量化性能对比
在关键评价指标中,优化 U-Net 以最低的 MAE(0.034±0.001)、最高的结构相似性指数(SSIM, 0.755±0.047)和骰子系数(DC, 0.712±0.033)显著优于其他模型。值得注意的是,经典 U-Net 虽能检测到更多真阳性(TP)样本,但假阳性(UP)率高达 37.33%,反映出其对 FPs 形态的特异性识别不足;MultiResUNet 则因假阴性(UN)率过高(25.48%),导致漏检问题突出;而优化 U-Net 在 TP(79.41%)、UN(20.57%)和 UP(24.31%)之间实现了更均衡的表现,完全准确率(63.89%)亦为最高。
3.3 复杂场景鲁棒性
在五组具有不同 FP 密度和形态的挑战性图像中,优化 U-Net 展现出更强的适应性。例如,在 FP 密集分布的样本中,其 UP 率仅为 2%,显著低于经典 U-Net 的 7% 和 MultiResUNet 的 4%;而在形态变异较大的样本中,优化模型的 TP 率保持在 93% 以上,充分证明了其对复杂输入的识别能力。
4. 结论与意义
本研究通过改进经典 U-Net 架构,成功开发了一种针对舌部菌状乳头的自动化检测模型 —— 优化 U-Net。该模型通过批量归一化和 dropout 层设计,有效提升了训练稳定性和特征提取精度,在多维度性能评估中均表现出最优的准确性与鲁棒性。研究结果不仅为味觉感知的个体差异研究提供了标准化工具,还为临床味觉障碍(如味觉减退 hypogeusia、味觉丧失 ageusia)的诊断及个性化营养干预奠定了技术基础。此外,研究团队公开的开源代码(GitHub)将推动该方法在跨学科领域的广泛应用,助力探索 FP 密度与代谢性疾病、药物干预等因素的关联机制。
尽管优化 U-Net 已展现显著优势,但研究仍存在一定局限性,如舌面非平面特性对金标准构建的影响,以及模型在儿童等特殊群体中的泛化能力待验证。未来研究可通过扩大样本多样性、引入三维图像重建技术等方式进一步优化模型,推动其从实验室走向临床实践,为精准健康领域开辟新的研究路径。