
-
生物通官微
陪你抓住生命科技
跳动的脉搏
决策树与分位数回归揭示贝宁孕妇妊娠结局及新生儿体重分布的关键影响因素
【字体: 大 中 小 】 时间:2025年07月20日 来源:Scientific African 2.7
编辑推荐:
本研究针对贝宁Couffo地区孕妇妊娠结局预测和新生儿体重分布问题,采用随机森林(Random Forests)特征选择、CART决策树和分位数回归(Quantile Regression)方法,发现年轻孕龄(18-24岁)、HIV病史、多次死产史等因素与不良妊娠结局显著相关,而25-40岁孕龄、≥3次产前咨询则与良好结局相关。新生儿死亡率达91.6‰,低出生体重(LBW)与孕龄14-24岁、高强度职业、妊娠并发症等相关,巨大儿则与剖宫产率升高(64.44%)显著关联。该研究为非洲地区产前护理策略制定提供了数据驱动的决策依据。
在全球范围内,妊娠作为特殊的生理事件始终牵动着家庭和社会的心弦,然而撒哈拉以南非洲地区仍面临着严峻的母婴健康挑战——该地区孕产妇死亡率高达391/10万活产,新生儿死亡率达38‰。贝宁作为西非国家,其Couffo省孕妇的健康状况更是公共卫生的重点关注领域。传统研究多采用逻辑回归等经典方法分析妊娠风险因素,但这些方法难以捕捉变量间的复杂交互作用,且无法全面反映新生儿体重的分布特征。
为突破方法学局限,研究人员创新性地将机器学习与传统统计模型相结合,开展了一项基于决策树和分位数回归的妊娠结局预测研究。通过分析2020年Couffo地区5家转诊医院的1,048名孕妇临床数据(含952例活产记录),研究团队首先运用随机森林筛选出10个关键预测变量,包括产次(Parity)、产前咨询次数等。随后构建的CART决策树模型以9.52%的错误率实现妊娠结局预测,其ROC曲线下面积(AUC)达0.779,证实模型具有良好的判别效能。
在技术方法层面,研究采用R 4.2软件平台,通过VSURF算法进行变量选择,构建包含2000棵树的随机森林确保稳定性。分位数回归则针对新生儿体重分布的不同分位点(τ=0.05/0.25/0.5/0.75/0.95)建立预测模型,所有模型的伪R2均>0.85,Fisher检验显示具有显著预测效力(C1>F0.95(476;462)=1.16436)。
研究结果揭示多个重要发现:
这项发表在《Scientific African》的研究具有多重意义:方法学上,首次在贝宁妇幼健康领域应用CART决策树与分位数回归的组合模型,克服了传统线性回归仅关注均值效应的局限;实践层面,为资源有限地区提供了可操作的产前风险管理指标——特别是证实≥3次产前咨询的防护效应,这对实现SDG3(良好健康与福祉)目标具有直接指导价值。研究者特别指出,未来需扩大样本至全国范围以验证结论的普适性,并建议结合质性研究深入探究影响妊娠结局的社会文化因素。
(注:全文基于原文数据解读,专业术语如CART=Classification and Regression Trees,VSURF=Variable Selection Using Random Forests等均保留原始表述;数值结果如91.6‰死亡率、64.44%剖宫产率等均引自原文统计;方法学描述避免涉及具体试剂和培养步骤,聚焦核心算法应用。)
生物通微信公众号
知名企业招聘