基于机器学习方法探索泰国银屑病患者膳食模式与疾病严重程度的关联性及关键影响因素分析

【字体: 时间:2025年09月27日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对小样本高维临床数据挑战,采用集成重采样与特征选择技术,构建了可解释性机器学习模型。研究人员通过结合自助法(Bootstrapping)与K折交叉验证(K-fold CV),利用随机森林(RF)和极端梯度提升(XGB)算法,从37个特征中筛选出银屑病严重程度的关键预测因子。结果显示最优模型灵敏度/特异性超90%,AUC值达95%以上。SHAP分析揭示BMI、高钠食物(如FB22)、加工肉类(FB18)和酒精(FB17)是主要风险因素,而冬阴功汤等含抗炎香草的泰式菜肴可能缓解症状。该研究为泰国银屑病患者个性化饮食干预提供了数据驱动决策支持。

  
银屑病作为一种慢性炎症性皮肤疾病,其特征是异常的T辅助17细胞免疫和角质形成细胞功能障碍,导致皮肤出现覆盖银色鳞片的厚实红色斑块。对于中重度患者而言,这些位于颈部、手部、腿部和躯干的病变不仅造成身体不适,更会妨碍活动能力、日常任务和社交互动。尽管确切病因尚不明确,但多项研究表明营养在银屑病发展及其相关合并症中扮演重要角色。特别是在泰国,独特的饮食模式包含各种海鲜、发酵食品、热带水果和高钠调味品,与其它地区的饮食习惯截然不同。然而,膳食摄入对银屑病严重程度的潜在影响仍未被充分探索,需要更复杂的分析技术如机器学习来揭示其内在联系。
由于患者招募困难、数据获取成本高以及某些疾病本身罕见,临床数据集通常较小,这对训练稳健可靠的机器学习模型构成了显著瓶颈。本研究基于142名泰国银屑病患者的37个特征(包括人口统计学、临床和饮食特征),事件与预测变量比(EPP)仅为3.8378,远低于推荐阈值10,存在模型不稳定和过拟合的高风险。为解决这一挑战,研究人员采用了一种集成自助法(Bootstrapping)和K折交叉验证(K-fold CV)的混合重采样策略,结合三种特征选择方法——最小绝对收缩和选择算子(LASSO)、平均精度下降(MDA)和平均不纯度下降(MDI),通过随机森林(RF)和极端梯度提升(XGB)分类器构建了60个分类场景,最终利用SHAP可解释性分析识别关键饮食因素。
研究采用多阶段处理流程:首先进行数据收集与预处理,包括对缺失数据的清理、分类变量的虚拟编码以及数值特征的Z-score标准化;接着通过分层随机划分训练集/测试集(70/30、75/25、80/20比例),并应用自助法生成增强训练集(5轮自助后训练样本量增至375);特征选择阶段使用LASSO将特征从37个缩减至18个,再通过MDA和MDI进行重要性排序;模型训练采用RF和XGB分类器,性能通过灵敏度、特异性、F1分数和AUC曲线评估;最后对最佳模型进行SHAP分析以解释特征贡献。
重要特征
通过LASSO、MDA和MDI技术识别出影响银屑病严重程度的关键特征。人口统计学特征中,BMI、年龄、婚姻状况和吸烟位列前四;饮食特征中,FB17(饮酒)、FB20、FB18(加工肉类)和FB24等显示较高重要性。MDI评分显示所有饮食项目的重要性得分相近,表明这些特征具有一致预测力。
分类器比较
在没有自助法的情况下,30个分类场景表现均较差,无论采用何种特征选择方法或划分比例,灵敏度最高仅56.25%。引入自助法后,模型性能显著提升:LASSO结合RF使特异性达96.40-99.99%,F1分数达91.78-92.18%;MDA使灵敏度和特异性均超90%;MDI表现最稳定,在RF和XGB中均达到接近完美的性能指标。
SHAP特征贡献分析
基于最佳模型(RF结合自助法与K折CV)的SHAP分析显示:BMI以32.78%的贡献度成为最强预测因子,吸烟(13.17%)和合并症(13.11%)紧随其后。饮食特征中,辣椒与调味品(FB22)贡献度最高(33.39%),加工肉类(FB18)占31.09%,酒精(FB17)占12.78%,红肉(FB19)占10.79%。发酵食品(FB21)和深色蔬菜(FB23)影响较小。局部SHAP分析进一步展示了个体患者中这些因素的正负向贡献差异。
膳食模式与银屑病严重程度的关联
研究揭示了特定饮食成分与银屑病严重程度的机制联系:辣椒中的辣椒素虽具抗炎性,但可能通过升高体温和汗液刺激引发发作;加工肉类的高盐、精制碳水化合物和饱和脂肪促进系统性炎症;酒精刺激角质形成细胞增殖并促进促炎细胞因子;红肉中的花生四烯酸代谢为炎症介质;发酵食品的高钠含量影响肠道微生物群和免疫功能;深色蔬菜则通过维生素E和β-胡萝卜素减轻氧化应激。
泰国流行菜肴的触发因素分析
研究特别评估了泰国常见菜肴的影响:冬阴功汤因含有柠檬草、高良姜等抗炎香草成为潜在适宜选择;而Som Tum(青木瓜沙拉)、Pad Thai(炒河粉)、Moo Kratha(泰式烧烤)和Khao Niao Mamuang(芒果糯米饭)因高脂、高钠或高糖成分被确定为需适度食用的触发食物。建议患者在食用这些菜肴时减少味精、鱼露和油的使用量,增加蔬菜比例。
研究结论表明,机器学习方法结合重采样技术有效解决了小样本高维数据挑战,成功识别出银屑病严重程度的关键预测因子。临床实践中应优先关注体重管理,并将已识别的饮食触发因素纳入综合护理计划。减少高钠食物、加工肉类、酒精和红肉摄入,增加富含抗氧化剂的食物(如鱼类、水果和蔬菜)可能减轻严重程度。该框架不仅适用于银屑病管理,还可推广至其他小样本或高维医学数据集分析,为健康素养、健康管理和智能医疗技术创新提供支持。未来需在更大规模前瞻性研究中验证这些发现,并探索贝叶斯框架等先进方法增强小样本分析能力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号