
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的哺乳期急性乳腺炎风险预测模型构建与关键生物标志物鉴定
【字体: 大 中 小 】 时间:2025年08月24日 来源:Scientific Reports 3.9
编辑推荐:
本研究针对哺乳期急性乳腺炎早期诊断困难、病因复杂等问题,通过机器学习算法(LR/NB/XGBoost/MLP)构建预测模型。研究人员收集369例患者与447例对照的临床数据,发现年龄、乳头皲裂、C反应蛋白(CRP)、中性粒细胞(NE)和白细胞(WBC)是五大关键预测指标,其中MLP模型表现最优(AUROC=0.898)。该成果为临床早期干预提供了精准预测工具,对改善母乳喂养妇女健康管理具有重要意义。
哺乳期急性乳腺炎是困扰母乳喂养女性的常见疾病,全球发病率达2.2-10%且呈上升趋势。这种由金黄色葡萄球菌等病原体引发的急性化脓性感染,不仅导致乳房肿痛、发热等症状,更会中断哺乳过程影响婴儿营养摄入。尽管其病理机制已较明确,但临床仍面临早期症状不典型、诊断延迟等挑战,约30%病例会发展为乳腺脓肿。现有预防主要依赖健康教育,缺乏量化风险评估工具,这正是Liujing Zhu团队在《Scientific Reports》发表这项研究的出发点。
为破解这一难题,研究团队采用回顾性病例对照设计,整合广州妇女儿童医疗中心柳州医院816例样本(369患者/447对照),采集年龄、产次、乳房手术史等12项指标。通过四种机器学习算法训练数据,首次构建了哺乳期急性乳腺炎的多维度预测体系。关键技术包括:1)采用Mann-Whitney U检验处理非正态分布数据;2)基于Youden指数优化决策阈值;3)通过决策曲线分析(DCA)评估临床效用;4)比较逻辑回归(LR)、朴素贝叶斯(NB)、XGBoost和多层感知器(MLP)的预测效能。
一般数据比较
数据分析显示患者组平均年龄(34.36±6.06岁)显著高于对照组(32.78±7.23岁,p=0.001)。炎症标志物差异尤为突出:急性乳腺炎组CRP中位数达21.1 mg/L(对照组6.7 mg/L),WBC计数9.239×109/L(对照组7.219×109/L),NE和乳头皲裂发生率也呈现统计学显著差异(p<0.05)。
模型评估和评估

MLP模型在测试集展现最佳综合性能:准确率84%、灵敏度82%、特异度86.3%,F1分数0.849,AUROC达0.898。XGBoost虽在训练集AUROC略高(0.927),但测试集表现(0.852)不及MLP稳健。
DCA曲线分析

决策曲线分析证实MLP在大多数阈值范围内净收益最高,其临床实用性显著优于其他模型。例如在风险阈值20-80%区间,采用MLP预测可使临床决策净获益提升15-28%。
这项研究通过机器学习首次揭示:年龄增长、乳头皲裂、CRP>21.1 mg/L、NE升高和WBC>9.239×109/L构成哺乳期急性乳腺炎五大核心预测因子。其中CRP作为全身炎症标志物,其水平与乳腺炎严重程度呈正相关,这与既往关于粒细胞性乳腺炎的研究发现一致。而NE的甲基化改变和WBC中PMN(多形核中性粒细胞)的浸润,则从免疫应答角度解释了乳腺炎的发病机制。
研究的创新价值在于将机器学习应用于哺乳期健康管理,MLP模型的高精度(AUROC 0.898)显著优于传统风险评估方法。但作者也指出局限性:数据单中心来源可能影响模型泛化能力,且CRP等生物标志物仅在症状出现后检测,限制早期预测价值。未来需通过多中心研究验证,并探索症状前生物标志物动态变化规律,以进一步完善预测体系。这项成果不仅为临床提供量化风险评估工具,更通过机器学习揭示了乳腺炎的新型生物标志物网络,为靶向干预开辟了新途径。
生物通微信公众号
知名企业招聘