
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多模态母体因素的深度神经网络在新生儿出生体重早期预测中的可解释性研究
【字体: 大 中 小 】 时间:2025年06月09日 来源:Journal of Biomedical Informatics 4.0
编辑推荐:
本研究针对新生儿低出生体重(LBW)预测中超声检查依赖性强、忽略营养因素等问题,开发了基于TabNet架构的可解释深度学习模型。研究整合了母体生理、生活方式及营养指标等多模态数据,在Reus-Tarragona队列和IEEE数据集上实现96%的准确率和0.96 AUC,证实维生素B12 和叶酸是核心预测因子,为无创产前监测提供了新工具。
新生儿出生体重是评估胎儿健康的核心指标,低出生体重(LBW)与20%的新生儿发病率和死亡率密切相关。传统超声预测方法存在操作依赖性强、资源受限地区可及性差等局限,且往往忽视母体营养等关键因素。这促使研究人员探索更精准、可解释的预测方案。
来自西班牙罗维拉-维尔吉利大学等机构的研究团队在《Journal of Biomedical Informatics》发表研究,创新性地将深度学习和多模态母体数据结合。他们收集了Reus-Tarragona出生队列中742对母婴的生理指标(如BMI、年龄)、生活方式(吸烟、社会经济地位)和营养数据(维生素B12
、叶酸水平),以及IEEE公开数据集1215例临床记录。通过线性插值和随机森林填补缺失值,采用SMOTE平衡数据后,研究人员对比了随机森林(RF)、XGBoost、1D-CNN和TabNet四种算法。
关键技术包括:1) 基于时间序列的线性插值处理缺失数据;2) SMOTE合成少数类样本解决数据不平衡;3) TabNet的注意力机制实现特征选择和解释;4) SHAP分析量化特征贡献度。
模型性能分析
TabNet在整合营养因素的多模态分析中表现最优,准确率达96.6%,AUC 0.978。相比仅用生理+生活方式因素的模型(92.8%准确率),纳入营养数据使预测性能显著提升。Tukey HSD检验证实该提升具有统计学意义(p<0.05)。
关键发现
临床意义
该研究首次证实营养生物标志物在出生体重预测中的核心地位,开发的TabNet模型可在妊娠15周实现早期预警。相比超声依赖方案,这套系统特别适合资源匮乏地区,其可解释性输出还能指导个性化干预,如调整叶酸补充方案。
局限与展望
当前模型未纳入遗传数据,且队列主要来自西班牙高收入人群。未来需在多元人群中验证,并探索实时动态监测功能。这项研究为构建下一代产前监护系统奠定了重要基础,标志着人工智能在围产医学应用的新突破。
生物通微信公众号
知名企业招聘