编辑推荐:
为解决月经疾病(MD)早期诊断难题,天津中医药大学第一附属医院的研究人员开展 HSI - ML 诊断 MD 的研究。结果显示相关识别模型性能良好。该研究为 MD 诊断提供新方法,极具科研价值,推荐科研读者阅读。
在女性健康的领域里,月经相关疾病(MD)就像一颗隐藏的 “定时炸弹”,给无数女性的生活带来了困扰。MD 可不是一个小问题,它涵盖了月经周期、经期时长、月经量异常,还有伴随月经周期出现的各种症状,甚至连绝经前后的一系列症状也包含在内 。像月经推迟、月经量少、月经提前、月经量过多、经期延长这些情况,在妇科门诊里十分常见。
你可别小瞧了这些月经异常,很多女性一开始都不把它当回事儿。但实际上,除了月经紊乱和月经量变化这些明显的症状外,MD 患者还常常被经前和经期腹痛、疲劳、失眠等全身性症状折磨,严重影响了日常生活和工作。要是不及时正确诊断和治疗,还可能引发贫血、闭经、子宫不规则出血等更严重的问题,甚至影响情绪,导致抑郁。而且,研究还发现,月经健康不仅关系到女性自身,还和后代的健康息息相关。所以,早点发现并治疗 MD,对减少不孕、先天性心脏病、骨质疏松等严重疾病的后遗症有着重要意义。这时候,就迫切需要一种无创又经济实惠的方法,来辅助筛查和早期诊断月经不调。
在中国,舌诊作为临床疾病诊断的辅助方法,已经有几千年的历史了。中医常通过观察舌体颜色、舌苔颜色、舌苔厚度、舌头干湿程度等来判断病情。舌体颜色能很好地反映人体血液微循环的状况,而月经失调的患者往往伴随着内分泌紊乱,血液循环也会发生变化,这些变化就可能体现在舌头上。同时,疾病的发生发展会影响口腔微生物及其代谢产物,从而让舌苔也出现改变,所以舌苔也能在一定程度上反映人体的基本状况。在现代妇科临床研究中,不少学者已经开始利用数字舌图像来观察和总结不同妇科疾病患者的舌像特征。不过,传统的数字相机拍摄的彩色照片,包含的信息远远不够,没办法满足临床疾病诊断的需求。
就在大家为这个问题发愁的时候, hyperspectral imaging(HSI,高光谱成像)技术出现了。这可是个厉害的角色,它能同时捕捉图像的空间和光谱信息,光谱和空间分辨率都很高,就像给医生们多了一双 “透视眼”,能更深入地了解身体状况。近年来,HSI 在疾病诊断领域大显身手,在癌症、心脏病、视网膜疾病、糖尿病、皮肤病等诊断中都有应用。但奇怪的是,在 MD 的诊断方面,相关研究却少之又少。
为了填补这个空白,天津中医药大学第一附属医院的研究人员在《Scientific Reports》期刊上发表了一篇名为《Hyperspectral tongue imaging combined with machine learning algorithm for the diagnosis of menstrual diseases》的论文。他们经过一系列研究,得出了令人惊喜的结论:基于高光谱舌图像构建的识别模型性能良好,能为临床妇科疾病的分类诊断提供参考。这一研究成果意义重大,意味着以后可能有一种更方便、更准确的方法来诊断 MD,为广大女性的健康保驾护航。
研究人员为了开展这项研究,用了不少关键技术方法。首先是 HSI 系统,这个系统由高光谱相机、光源和计算机系统组成,能收集参与者舌头的光谱数据,光谱范围在 370 - 1060nm,分辨率是 5nm,波长带数有 128 个。然后,他们通过一系列操作来处理数据,比如进行图像校正,用公式计算反射率,减少成像系统光强度和探测器暗电流的影响;提取感兴趣区域(ROI),把舌头中间部分当作舌苔,舌尖部分当作舌体来分析;对光谱数据进行归一化处理,减少外部干扰光的影响,增强数据稳定性。最后,他们用了多种统计分析方法和机器学习算法,像 K - 最近邻(KNN)、随机森林(RF)、支持向量机(SVM)和人工神经网络(ANN),还通过五折交叉验证来确定最佳参数,建立识别模型 。
下面来看看具体的研究结果。
1. MD 患者和健康参与者的光谱比较
研究人员给每个参与者都同时采集了舌体和舌苔的高光谱图像,然后对不同组参与者的感兴趣区域图像光谱数据进行归一化和平均处理。从光谱曲线对比图能明显看出,不同组之间舌苔和舌体的光谱曲线有很大差异。进一步分析发现,每个 MD 组和正常月经组在舌苔光谱特征上,整个波长范围都有显著差异。比如闭经组和正常月经组相比,在 450 - 530nm、580 - 600nm、680 - 998nm 波长带差异显著,600 - 680nm 波长带差异极其显著。舌体光谱特征方面,MD 组和正常月经组在整个波长带范围都有显著差异。而且,正常月经组的光谱反射率比各个 MD 组都高,说明正常月经组的舌体整体颜色更亮。闭经和月经推迟患者组的舌苔光谱反射率明显更低,舌体颜色更暗。另外,各组之间在近红外波段的光谱曲线差异比可见光波段更大,这反映出疾病状态引起的血液循环变化 。
2. 基于不同预处理方法的分类结果
研究人员用了归一化(Norm)、一阶导数(1st D)、二阶导数(2nd D)、Savitzky - Golay 平滑(S - G)、乘法散射校正(MSC)和标准正态变量变换(SNV)这六种预处理技术对光谱数据进行处理,然后用处理后的数据构建识别模型,对比不同预处理方法的效果。
3. 识别模型结果与分析
研究人员用 KNN、RF、SVM 和 ANN 这四种机器学习算法,以经过不同预处理方法处理的舌苔和舌体光谱数据为输入变量,构建识别 MD 患者和正常月经参与者的识别模型。结果发现,基于舌体光谱特征的最佳分类模型准确率比基于舌苔光谱特征的更高。其中,用 “2nd D + S - G + ANN” 方法构建的舌体光谱特征识别模型,各项评估指标得分最高,准确率达到 0.9729,宏观精度为 0.9697,宏观召回率是 0.9703,宏观 F1 分数为 0.97 。从混淆矩阵能直观地看出,基于舌体光谱特征的分类模型性能更好,能很好地区分闭经、不孕、月经量少、月经推迟的患者和正常月经的参与者,说明基于高光谱舌成像建立的分类模型能稳定地对六组志愿者进行区分和识别 。
在讨论部分,研究人员提到,MD 是临床上常见的妇科疾病,严重影响患者身心健康和生活质量。中医临床发现女性的舌像会随着月经期间激素波动而变化,所以舌诊在妇科疾病诊断和疗效评估中很重要。他们通过采集不同组志愿者的舌图像,发现 MD 患者和正常月经者的舌体和舌苔有明显差异,而且高光谱舌图像包含更丰富的光学信息。不过,这项研究也有一些局限性,比如还没确定舌内血液成分、舌苔厚度及其成分在光谱信息中的表现,实验样本量也不够。未来,研究人员打算进一步改进舌诊的定性研究,扩大舌信息的定量研究,增加样本量,开展多中心研究,用多模态数据融合技术整合其他诊断信息,建立更准确、稳定、适合临床的 MD 风险预测模型。他们还想深入研究 HSI - ML 在诊断其他引起月经改变的疾病,如多囊卵巢综合征、子宫肌瘤、宫颈癌等方面的潜在作用,探索更先进的算法来提升模型性能。
总的来说,这项研究把高光谱技术和机器学习算法结合起来用于 MD 的识别,实验结果证明基于高光谱舌图像构建的识别模型表现良好,为临床妇科疾病的分类诊断提供了参考。虽然研究还有一些不足,但它为未来的研究指明了方向,相信在研究人员的不断努力下,会有更多突破,为女性健康带来更多福祉。