编辑推荐:
研究人员基于 Andersen 行为模型,运用机器学习预测医疗保健需求,为资源分配提供依据。
在医疗领域,准确预测医疗保健需求对保障民众健康、优化资源配置至关重要。过去,传统预测方法存在诸多局限,难以精准把握复杂的医疗需求。比如,传统统计模型常做出过于简单的假设,无法反映实际中的复杂关系,导致资源分配不合理,部分地区医疗资源过剩,而部分地区却极度短缺,患者就医困难。为了解决这些问题,来自土耳其的研究人员开展了一项极具意义的研究,相关成果发表在《BMC Health Services Research》杂志上。
此次研究,研究人员基于 Andersen 行为模型,利用 2022 年土耳其健康调查(TUIK)的微观数据,运用多种机器学习方法,深入分析影响医疗保健需求的因素。研究人员用到的主要关键技术方法包括:从 TUIK 获取数据后,进行数据预处理,如处理缺失值、转换数据格式;运用多种机器学习模型,像决策树(DT)、随机森林(RF)、支持向量机(SVM)等;使用合成少数过采样技术(SMOTE)解决数据不平衡问题;通过召回率(Recall)、精确率(Precision)、F1 评分和受试者工作特征曲线下面积(ROC AUC)等指标评估模型性能。
研究结果显示:在 predisposing 因素方面,性别、教育水平和年龄组对医疗保健需求影响显著。例如,女性在健康检查和预防保健服务的使用上更为频繁,而随着年龄增长,慢性疾病患病率上升,医疗服务需求也相应增加。在 enabling 因素中,治疗成本、社区兴趣和支付困难等因素较为关键。高昂的治疗费用,尤其是牙科、心理健康服务和处方药费用,会阻碍人们获取医疗服务;社区的支持和兴趣则能促进医疗服务的利用。need 因素方面,吸烟状况、慢性疾病和整体健康状况等影响较大。吸烟会增加患多种疾病的风险,从而导致医疗服务需求上升;患有慢性疾病,如哮喘、冠心病等的患者,需要持续的医疗护理。
从模型性能来看,Gradient Boosting、XGBoost 和 Logistic Regression 等模型表现出色,在不同因素类别下都展现出较高的预测准确性。随机森林(RF)和支持向量机(SVM)也有良好表现,这些模型在处理复杂关系时,能有效识别关键因素,为预测医疗保健需求提供可靠依据。
研究结论和讨论部分指出,该研究全面评估了医疗保健需求预测,证明了机器学习技术在识别关键预测因素方面的有效性。研究发现的关键因素,如性别差异、社区支持、吸烟与慢性疾病等,为制定医疗政策提供了重要参考。例如,针对吸烟问题,可开展戒烟项目,减少吸烟相关疾病,降低医疗需求;加强社区支持网络建设,改善心理健康服务的可及性等。然而,研究也存在一定局限性,如依赖自我报告数据可能存在回忆偏差,部分变量缺失影响研究结果的普遍性等。
总体而言,这项研究为医疗保健政策制定和资源分配提供了宝贵的见解,有助于推动医疗体系更加高效地运行,为民众提供更优质的医疗服务。