
-
生物通官微
陪你抓住生命科技
跳动的脉搏
惩罚回归与机器学习在银屑病患者生活质量预测中的创新应用与模型优化
【字体: 大 中 小 】 时间:2025年09月21日 来源:Healthcare and Rehabilitation
编辑推荐:
本研究针对银屑病患者生活质量(QoL)预测中高维数据、多重共线性和小样本挑战,采用惩罚回归(包括岭回归、LASSO、自适应LASSO、弹性网络和自适应弹性网络)进行特征选择,并结合随机森林(RF)和支持向量回归(SVR)构建16种预测模型。结果显示,基于弹性网络特征选择的RF模型(RF-L1L2)表现最优,其RMSE为5.6344,MAPE为35.5404%,显著优于传统回归方法。Bland–Altman分析进一步验证了RF模型在减少系统偏差和提高预测一致性方面的优势。研究还通过SHAP分析明确了心理压力因素(如STR06、STR08)、年龄、PASI、合并症和性别等关键预测因子,强调了身心健康交互作用的重要性。该研究为临床决策提供了可解释的AI驱动解决方案,有助于实现个性化治疗和患者分层管理。
银屑病是一种慢性炎症性皮肤病,全球约2%-3%的人口受其影响,不仅带来皮肤上的红斑、鳞屑和瘙痒,还显著降低患者的生活质量。尤其是在泰国,银屑病的患病率呈上升趋势,与基因-环境相互作用、感染、肥胖和心理压力等因素密切相关。除了皮肤症状,银屑病还增加患者心血管疾病、糖尿病和代谢综合征的风险,进一步加剧临床复杂性。因此,现代治疗目标不仅关注皮损清除,更强调症状缓解、控制全身炎症以及维持生活质量(QoL)。
为了量化这些多维结果,临床常用银屑病面积和严重程度指数(PASI)评估疾病活动性,而皮肤病生活质量指数(DLQI)则捕捉 psychosocial 影响。较高的PASI分数通常与恶化的DLQI密切相关,但QoL损害存在异质性,病变在可见或功能关键区域、社会经济逆境,尤其是心理压力都会放大残疾。压力与DLQI呈现明显的剂量依赖关系,加剧皮肤严重性和主观痛苦。这种复杂性产生高维、相关数据,挑战了传统模型如多元线性回归(MLR)和二元逻辑回归(BLR),这些模型容易受到多重共线性和过拟合的影响。
这些挑战促使采用先进技术,如惩罚回归(包括岭回归、LASSO、自适应LASSO、弹性网络和自适应弹性网络)以稳定参数估计并执行嵌入式特征选择。同时,机器学习(ML)方法在银屑病护理中取得进展,从基于图像的诊断到治疗优化,通过建模非线性关系和处理大预测空间。然而,许多ML应用主要关注二元分类,提供有限的可解释性,丢弃了连续DLQI预测中的信息,且临床透明模型探索不足。
重要的是,大约一半的研究低于常用的事件每变量(EPV)阈值(约10),表明它们涉及高维或中高维数据。为应对这些限制,本研究提出以下主要贡献:首先,对连续DLQI进行建模,以保留QoL损害的全部变异性,允许比二元终点更精细的临床分层。其次,采用五种惩罚回归变体进行系统特征收缩,以比临时过滤或无过滤更有效地缓解多重共线性、高维和过拟合。第三,使用多算法融合进行全面比较,包括16种模型:MLR、五种惩罚回归、五种随机森林(RF)模型和五种支持向量回归(SVR)模型。第四,通过纳入独特开发的14项压力影响症状量表(SASS-14)以及人口统计和临床特征,调查QoL的关键心理和生物医学驱动因素。最终,采用SHapley Additive exPlanations(SHAP)进行模型可解释性,提供临床解释的透明途径,超越早期ML能力的有限可解释性。
通过结合压力因素、惩罚特征选择和可解释ML,这项工作旨在推进银屑病的个性化、压力敏感管理策略,并将当前最先进的方法从分类分类扩展到细致、连续的QoL预测。
为了开展研究,研究人员主要应用了以下关键技术方法:首先,数据来源于149名泰国银屑病患者,包括人口统计和压力相关信息,并通过清洗、转换和训练/测试分割进行预处理;其次,采用五种惩罚回归方法(岭回归、LASSO、自适应LASSO、弹性网络和自适应弹性网络)进行特征选择,以优化预测准确性和可解释性;第三,利用留一交叉验证(LOOCV)确定最佳正则化参数(λ);第四,构建多种机器学习模型,包括随机森林(RF)和支持向量回归(SVR),并通过网格搜索进行超参数调优;最后,使用RMSE、MAPE、R2和Bland–Altman分析评估模型性能,并通过SHAP分析实现模型可解释性。
样本包括男女患者,男性占53.69%,女性占46.31%。大多数患者已婚(42.95%),其次是单身(39.60%),17.45%属于其他类别。多数患者拥有学士以下学历(51.01%),48.99%拥有学士或更高学历。关于合并症,62.42%无合并症,37.58%有合并症。患者平均年龄42岁,平均BMI为25.68。DLQI和PASI的平均分数分别为14.76和12.89,表明中等到严重的QoL影响和疾病严重性。压力问卷的分布显示,心理压力对患者有显著影响,突显针对性压力管理策略的必要性。
开发了六种统计模型来预测DLQI。MLR和岭回归保留了所有21个特征,LASSO仅选择四个特征(PASI、STR06、STR08和STR11),自适应LASSO选择五个特征,弹性网络选择八个特征,自适应弹性网络选择11个特征。PASI是所有模型中最有影响力的特征,年龄显示强烈的负效应。STR06和STR08 consistently demonstrated predictive importance。与MLR相比,惩罚模型通过排除不相关变量和减少过拟合来提高可解释性。
RF-L1L2模型表现出最佳的预测性能,实现最低的RMSE(5.6344)和MAPE(35.5404%),以及较高的R2(51.6337%)。RF-based models总体上优于其他模型。SVR-based models在结合更多特征时表现改善。标准MLR表现较差,具有最高的RMSE(6.5044)、MAPE(44.0147%)和最低的R2(31.0136%)。惩罚回归作为特征选择技术与集成学习结合,带来显著改进。
Bland–Altman图评估预测值和实际值之间的一致性。MLR模型显示出最宽的LoA宽度(195.05),表明一致性差和变异性高。相比之下,RF-L1L2和L1L2表现出显著改善的一致性。RF-L1L2模型具有最窄的LoA宽度(139.92),偏倚最小,使其成为预测DLQI的最平衡模型。
SHAP分析揭示了心理困扰特征(STR06、STR08、STR11、STR03)对DLQI预测的影响最强,超过了年龄、PASI、合并症和性别的影响。SHAP值与QoL反向变化,正SHAP值表示更高的DLQI分数(更差的QoL),负值表示更低的DLQI分数(更好的QoL)。心理困扰指标显示清晰的正SHAP值,随着症状严重性增加而增加,强调情感和认知负担在降低银屑病患者QoL中的核心作用。年龄呈现强烈的反比关系,年龄较大的个体倾向于更低的DLQI分数。PASI分数和合并症与DLQI正相关,与临床证据一致。性别揭示性别差异,女性患者与负SHAP值相关,暗示更好的预测QoL,而男性患者对DLQI显示正贡献。
研究结论和讨论部分强调,本研究通过综合应用惩罚回归和机器学习方法,成功开发出高效预测银屑病患者DLQI的模型,其中RF-L1L2表现最优。这不仅解决了高维数据和小样本的挑战,还通过SHAP分析提供了模型的可解释性,明确了心理压力、年龄、PASI、合并症和性别等关键预测因子。这些发现对临床实践具有重要意义:首先,支持将ML模型整合到皮肤病学护理中,通过准确预测DLQI帮助患者分层,允许针对身体和心理症状的定制干预措施;其次,在远程医疗平台中实施预测模型可以增强远程监控,为患者和临床医生提供实时推荐;最终,这项工作肯定了可解释ML框架在改善皮肤病学生活质量预测和指导银屑病等慢性炎症性疾病的精准护理方面的价值。未来研究应扩展到多样化人群,探索深度学习或混合模型,并整合可穿戴设备数据以丰富压力相关特征捕获。
生物通微信公众号
知名企业招聘