利用机器学习识别功能性消化不良患者的关键特征,以确定其疾病模式

《Frontiers in Physiology》:Identifying key features for determining the patterns of patients with functional dyspepsia using machine learning

【字体: 时间:2025年10月10日 来源:Frontiers in Physiology 3.4

编辑推荐:

  功能性消化不良(FD)患者通过问卷数据运用监督学习(SVM)和无监督学习(t-SNE、k-means)识别症状模式。监督学习发现食欲减退、侧腹不适、腹胀及面色苍白是关键区分特征;无监督学习揭示四类新亚群:全身症状、上腹症状、肠道功能异常及恶心呕吐为主。研究证实两种方法互补,为FD个性化治疗提供依据。

  功能性消化不良(FD)是一种常见的胃-脑交互障碍(DGBI)疾病,其症状通常包括餐后饱胀感、早饱、上腹部疼痛或灼热感等。这种疾病的复杂性和反复发作的特性,使其在临床治疗中面临诸多挑战。尽管已有多种治疗手段,如质子泵抑制剂、促动力药物和抗抑郁药物,但许多患者更倾向于采用综合治疗方案,包括传统医学方法。因此,对FD症状模式的识别(Pattern Identification, PI)显得尤为重要,因为它有助于实现个性化治疗,提高患者的生活质量。

PI方法在传统东亚医学中被广泛应用,其核心在于通过对患者症状的整体观察,识别出具有临床意义的模式,从而指导治疗策略。然而,随着数据科学的发展,越来越多的研究开始尝试将机器学习方法引入PI过程,以探索新的分类方式。本研究旨在通过监督学习和非监督学习两种方法,从FD患者的问卷数据中提取关键特征,并比较传统PI类型与数据驱动PI类型之间的异同。

研究采用了标准化功能性消化不良症状识别工具(STPI-FD)问卷,该问卷包含36个问题,覆盖胃部症状、胸部症状、口腔症状、恶心呕吐、饮食习惯、嗳气、叹气、面色、精神状态、疲劳、冷热状态和排便情况等多个维度。问卷使用五级李克特量表(0-4分),以量化患者的主观感受。所有患者均完成该问卷,并根据其回答进行PI分类。此外,研究还结合了韩国版的Nepean消化不良指数(NDI-K)和功能性消化不良生活质量问卷(FD-QoL),以全面评估患者症状的严重程度及其对生活质量的影响。

在监督学习部分,研究使用了支持向量机(SVM)算法来识别最具区分性的特征。SVM是一种有效的分类方法,通过寻找最佳超平面来最大化不同类别的间隔。结果显示,SVM模型在区分FD的六种传统PI类型中表现最佳,其平衡准确率为0.67,显著高于其他模型。通过计算排列重要性(Permutation Importance),研究确定了以下五个关键特征:腹部疼痛在温暖或按摩后减轻、腰侧不适、腹部胀气或咕噜声、面色苍白或发黄以及食欲减退。这些特征不仅反映了患者的具体症状,还与传统PI类型密切相关。

在非监督学习部分,研究采用了t-分布随机邻域嵌入(t-SNE)和K-均值聚类算法,以发现数据驱动的新型子群。t-SNE是一种非线性降维方法,能够保留数据点之间的相似性关系。K-均值聚类则用于确定最佳的子群数量。通过比较不同降维方法的轮廓系数(Silhouette Score)和Calinski-Harabasz指数(CH Index),研究发现四组子群在二维空间中的可视化效果最佳。这些子群分别表现出不同的症状特征,如全身症状、上腹部症状、排便变化和恶心呕吐等。其中,Cluster A和Cluster B在症状分布上表现出明显的差异,Cluster C和Cluster D则具有更独特的特征。Cluster C的患者主要表现出排便功能减弱,而Cluster D则以恶心和呕吐为显著特征。

本研究的结果表明,通过监督学习和非监督学习方法,可以更全面地理解FD患者的症状模式。监督学习方法能够提取出与传统PI类型相关的特征,而非监督学习方法则有助于发现数据驱动的新型子群。这两种方法的结合,不仅为临床决策提供了新的视角,也为进一步研究FD的病理机制和治疗策略奠定了基础。此外,研究还指出了一些局限性,如样本量较小、缺乏外部验证以及未纳入其他重要诊断指标(如脉诊和舌诊)。因此,未来的研究需要进一步扩大样本量,加强模型的外部验证,并考虑整合更多的客观数据,以提高PI的准确性和临床适用性。

在临床实践中,PI方法能够帮助医生根据患者的整体状态进行诊断和治疗。然而,随着数据科学的发展,传统的PI方法正在面临新的挑战和机遇。机器学习方法的应用,使得PI过程更加系统化和数据驱动,有助于发现潜在的模式和子群。本研究通过比较监督学习和非监督学习方法,揭示了FD患者症状模式的多样性,为个性化治疗提供了新的思路。此外,研究还强调了PI方法在临床决策中的重要性,尤其是在处理复杂症状和多维数据时,PI方法能够提供更全面的视角,帮助医生更好地理解患者的病情。

总的来说,本研究通过机器学习方法,首次在传统韩国医学的背景下分析了FD患者的自我报告数据,为PI过程提供了新的工具和方法。结果不仅有助于识别FD患者的关键症状,还为未来的研究提供了方向,如探索其他机器学习方法(如潜在树分析)在PI中的应用。此外,研究还指出,为了进一步提高PI的准确性和临床适用性,需要考虑更多的客观数据和外部验证。这些发现为改善FD的临床管理和治疗策略提供了重要的参考。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号