
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习模型的潮汕地区农村儿童多重受害(PV)早期预警系统构建及风险因素解析
【字体: 大 中 小 】 时间:2025年07月06日 来源:BMC Public Health 3.5
编辑推荐:
本研究针对中国潮汕地区农村儿童(特别是留守儿童)多重受害(Poly-victimization, PV)高发问题,创新性地采用支持向量机(SVM)、随机森林(RF)等四种机器学习算法,构建了准确率超80%的预测模型。通过SHAP框架解析发现校园欺凌目睹(贡献度达22.72%)和自残意念(16.43%)是关键风险因素,并首次建立区域差异化的PV预警指数(汕头0.621 vs 揭阳0.497),为制定精准干预策略提供了AI驱动的科学工具。
在中国城市化进程中,数以千万计的"留守儿童"成为特殊弱势群体,他们因父母外出务工而长期缺乏监护,面临包括身体虐待、情感忽视、校园暴力等多重受害(Poly-victimization, PV)的威胁。国际研究表明,经历PV的儿童次年再受伤害风险激增5.1倍,但中国农村地区的PV研究长期存在三大空白:潮汕等特色文化区域数据缺失、传统统计方法难以捕捉复杂风险交互、缺乏可操作的预警工具。汕头大学医学院公共卫生学院的研究团队选择具有典型宗族文化和城乡差异的潮汕地区,通过4133名农村初中生的多维度调查,开创性地将人工智能技术引入儿童伤害预防领域。
研究采用分层整群抽样,覆盖汕头、揭阳7所农村中学7-9年级学生(含1005名留守儿童),运用青少年受害问卷(JVQ-R2)等工具采集34类受害事件数据。技术方法的核心在于:1) 采用支持向量机(SVM)、K近邻(KNN)、人工神经网络(ANN)和随机森林(RF)四种算法构建预测模型;2) 应用SHAP(Shapley加性解释)框架量化风险因素贡献度;3) 基于线性回归和最大-最小归一化方法建立区域特异性预警指数。
预测模型性能
随机森林(RF)在整体样本中表现最优(准确率84%),而支持向量机(SVM)在区域细分预测中优势显著(汕头准确率88%)。模型揭示揭阳儿童PV发生率是汕头的1.84倍(22.95% vs 12.49%),且汕头留守儿童在PV受害者中占比异常突出(46.09% vs 揭阳24.48%)。
风险因素解析
通过SHAP框架发现:1) 校园欺凌目睹是跨群体首要风险因素(贡献度:全体15.97%、汕头9.51%、揭阳22.72%);2) 自残意念对留守儿童影响尤为显著(16.43%);3) 区域差异明显,汕头受同伴不良行为影响更大(17.63%),而揭阳更易受社会治安水平(9.92%)和色情内容接触(6.93%)影响。
预警指数构建
研究创新性地建立60%累积贡献率的预警模型:1) PV儿童预警指数显著高于非PV群体(汕头0.621 vs 0.253;揭阳0.497 vs 0.161);2) 留守儿童指数普遍更高(汕头0.639 vs 非留守0.558);3) 揭阳地区非PV留守与非留守儿童指数无差异,提示需扩展风险因子库。
这项发表于《BMC Public Health》的研究具有三重突破价值:首次证实机器学习可有效预测农村儿童PV风险,为传统伤害流行病学引入新方法论;构建的预警指数实现从"事后干预"到"事前预防"的范式转变;发现的区域差异风险谱(如汕头侧重同伴影响、揭阳侧重环境因素)为精准施策提供靶点。研究局限性在于样本局限于潮汕地区,未来可通过多中心研究验证模型普适性。该成果不仅为完善中国儿童保护体系提供技术支撑,更开创了人工智能在公共卫生领域的创新应用范式。
生物通微信公众号
知名企业招聘