基于可解释机器学习(LightGBM-SHAP)的患者满意度关键影响因素识别研究——以孟加拉国朗布尔地区私立医院为例

【字体: 时间:2025年10月14日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对医疗服务质量评估中患者满意度影响因素复杂难测的问题,研究人员在孟加拉国朗布尔地区两家私立医院开展了一项横断面调查(n=312),应用LightGBM、XGBoost等机器学习算法构建预测模型,并结合SHAP值分析进行特征解读。结果表明LightGBM模型(SMOTE前)预测性能最优(准确度0.85,MCC 0.69,ROC-AUC 0.83),识别出治疗计划、年龄、预约便利性等核心影响因素,为优化医患沟通、缩短候诊时间等精准干预措施提供了数据支撑,对提升医疗服务质量具有重要实践意义。

  
在医疗服务质量评估体系中,患者满意度作为衡量医疗体验的关键指标,直接影响着治疗依从性和健康结局。然而在孟加拉国这样的发展中国家,医疗资源分配不均、医患沟通不足等问题长期存在,传统研究方法难以精准捕捉影响患者满意度的复杂因素。特别是在朗布尔地区,尽管私立医院承担着重要医疗服务职能,但针对患者满意度的实证研究却十分有限,更缺乏基于数据驱动的深度分析。
为破解这一难题,Md. Mahafuzur Rahman团队在《Scientific Reports》上发表了开创性研究,首次将可解释机器学习方法系统应用于该地区患者满意度分析。研究人员通过构建LightGBM、XGBoost等先进预测模型,结合SHAP解释框架,成功揭示了影响患者体验的关键驱动因素,为医疗服务质量提升提供了科学依据。
本研究采用的核心技术方法包括:基于横断面调查的问卷数据采集(312名患者)、SMOTE过采样技术处理类别不平衡、多种集成学习算法(LightGBM/XGBoost/CatBoost/Random Forest)的对比验证、以马修斯相关系数(MCC)为主的模型评估体系,以及SHAP值分析实现特征重要性解读。
频率分析
通过对患者人口学特征和医患互动指标的统计分析发现,63.46%的患者表示满意,36-45岁年龄段占比最高(23.72%),70.19%患者候诊时间小于1小时,78.85%获得了治疗计划说明,但仅有51.92%参与治疗决策,这些基础数据为后续机器学习建模提供了重要特征工程基础。
性能比较
模型对比显示LightGBM(SMOTE前)综合性能最优,准确率达85.9%,MCC值0.69显著高于其他模型。混淆矩阵显示仅1例假阴性,ROC曲线下面积(AUC)达0.833,证明模型在保持高灵敏度的同时具备优异判别能力。值得注意的是,SMOTE过采样反而导致多数模型性能下降,提示合成样本可能引入噪声。
模型可解释性
SHAP分析揭示治疗计划(重要性0.32)、年龄(0.30)和预约便利性(0.16)为三大核心影响因素。依赖图进一步显示:年长患者(45岁以上)满意度显著更高;提供详细药物治疗计划可提升满意度;候诊时间超过2小时则产生负面影响。特别发现是决策参与度与满意度呈负相关,这可能源于患者更倾向于信任医生专业判断。
讨论与结论
研究证实机器学习方法能有效识别患者满意度影响因素,其中LightGBM模型展现出最佳预测效能。关键发现包括:结构化治疗计划、缩短候诊时间、清晰药物说明是提升满意度的核心环节,而年轻患者和低教育水平群体需要特别关注。医疗管理机构可依据这些发现优化服务流程,例如通过标准化沟通模板提升治疗计划质量,实施分时段预约减少等待时间。
本研究局限性在于横断面设计难以建立因果关系,且样本仅来自单一地区。未来研究可扩展至不同医疗场景,结合纵向追踪数据,进一步验证因素影响的动态变化。该研究框架为发展中国家医疗服务质量提升提供了可复制的分析方法,通过数据驱动决策推动患者中心型医疗模式转型。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号