巧用弹性网络回归与机器学习:揭秘围产期抑郁和残余胆固醇的神秘关联

【字体: 时间:2025年05月09日 来源:BMC Pregnancy and Childbirth 2.8

编辑推荐:

  围产期抑郁(PPD)危害母婴健康,传统统计方法研究受限。研究人员结合弹性网络回归(ENR)和机器学习(ML)构建预测模型。结果显示随机森林(RF)模型最佳,残余胆固醇(RC)是潜在风险因素。为防治 PPD 提供新方向。

  在女性的孕期和产后阶段,有一种 “情绪小怪兽” 可能悄然来袭,它就是围产期抑郁(PPD)。全球约 11.9% 的女性会遭遇这只 “小怪兽”,它不仅严重威胁着妈妈们的身心健康,还可能通过改变激素和神经递质水平,影响胎儿的神经发育和行为。
一直以来,大家都在努力寻找引发围产期抑郁的 “幕后黑手”。虽然不少研究探索了饮食习惯、脂质参数等因素和 PPD 的关系,但大多采用传统统计方法。这些方法在分析高维度、多共线性的数据时困难重重,就像用一把小钥匙去开一把复杂的大锁,难以精准找到真正影响 PPD 的因素。而且传统方法对数据要求高,会丢失很多有价值的信息。同时,关于传统脂质指标和抑郁的关系研究结果也不一致,这让脂质生物标志物在临床应用中受到很大限制。

在这样的背景下,新疆医科大学的研究人员决心 “驯服” 这只 “情绪小怪兽”,探索 PPD 的影响因素。他们开展了一项从 2020 年 6 月到 2023 年 5 月的纵向研究,招募了 608 名健康的孕早期女性。

研究人员首先收集了这些孕妇孕早期(6 - 13 周)的基线数据和空腹血液生化检测结果,之后在孕中期(24 - 27 周)让她们完成抑郁量表评估。研究人员用爱丁堡产后抑郁量表(EPDS)来评估 PPD 症状,EPDS 总分为 0 - 30 分,得分越高抑郁症状越严重,≥10 分被判定为抑郁筛查阳性。残余胆固醇(RC)的数值通过总胆固醇(TC)减去高密度脂蛋白胆固醇(HDL - C)和低密度脂蛋白胆固醇(LDL - C)之和得出。

研究人员先用逻辑回归筛选出与 PPD 可能相关的特征,再用弹性网络回归(ENR)进一步筛选,最后用筛选出的特征构建了 6 种机器学习(ML)模型,包括随机森林(RF)、自适应增强(AdaBoost)、支持向量机(SVM)等,从中找出预测效果最好的模型。还用 SHapley 加性解释(SHAP)分析来可视化模型的决策过程,让模型的 “想法” 一目了然。

经过一系列复杂的分析,研究人员有了重要发现。在 608 名孕妇中,最终 325 名被纳入研究,其中 130 名有轻度抑郁,32 名有重度抑郁。单因素分析发现 19 个特征与抑郁有关,ENR 筛选后保留了 14 个重要特征变量。6 种 ML 模型里,RF 模型表现最佳,它的平均精度最高,AUC 值达到 0.850,远超其他模型,就像考试中成绩最优秀的学生。

SHAP 分析找出了影响 PPD 预测的前 5 个重要因素:镁(Mg)、残余胆固醇(RC)、钙(Ca)、平均红细胞血红蛋白浓度(MCHc)和钾(K)。其中,Mg、Ca、MCHc 和 K 与 PPD 呈负相关,是保护因素,就像身体的 “小卫士”;而 RC 与 PPD 呈正相关,是潜在的风险因素。研究还发现,挑食、不常吃早餐、烹饪常用沙拉油或调和油等行为和饮食习惯,也与 PPD 风险增加有关。

这项研究意义重大。它首次结合 ENR 和多种可解释的 ML 算法来探索 PPD 的相关因素,发现 RF 模型能高效分析暴露因素和 PPD 的关联,还确定了 RC 是 PPD 的潜在风险因素,这为 PPD 的早期筛查提供了新的生物标志物。不过研究也存在一些局限性,比如 PPD 是通过自我报告的 EPDS 评分确定的,可能存在信息偏差;分析只用了空腹数据,没纳入非空腹样本;ML 模型的复杂性可能影响可重复性和实际应用。

总的来说,这项发表在《BMC Pregnancy and Childbirth》的研究为我们认识围产期抑郁打开了新的窗户,虽然还有一些不足,但为后续研究指明了方向。未来,研究人员可以在更大的人群中验证这些发现,纳入非空腹数据,优化模型,让我们能更好地预防和治疗围产期抑郁,守护妈妈们的心理健康。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号