
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习预测乳糜泻抗体血清阳性的生化检测参数模型研究
【字体: 大 中 小 】 时间:2025年07月04日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对乳糜泻(CD)诊断延迟的临床难题,通过机器学习方法分析初级医疗中的生化检测数据,构建了两种预测模型(全参数集与精选参数集)。结果显示,模型对CD抗体血清阳性的预测AUC分别为0.68和0.63,虽预测效能有限,但揭示了食物过敏原抗体和IgA的关键作用,为优化CD早期筛查策略提供了数据支持。
乳糜泻(CD)是一种由麸质摄入触发的终身性自身免疫疾病,全球约1%人群受累,但高达80%患者未被确诊。诊断延迟平均达6年,导致患者生活质量下降、医疗负担加重。当前诊断依赖组织转谷氨酰胺酶(TTG)抗体检测,但非特异性症状(如贫血、疲劳)使初级医疗中的早期识别尤为困难。
为突破这一瓶颈,哥本哈根大学医院等机构的研究团队利用2006-2015年丹麦初级医疗实验室(CopLab)数据库,纳入54,877例接受CD抗体检测的患者数据(672例血清阳性),开发了两种机器学习预测模型:全参数模型(含75项生化指标)和临床精选模型(16项指南相关指标)。通过极端梯度提升(XGBoost)、逻辑回归等方法分析检测结果,发现模型区分能力有限(AUC 0.63-0.68),预测概率分布重叠显著。
研究采用10折交叉验证框架,结合四种算法(XGBoost、逐步回归、支持向量机、LASSO交互项回归)构建集成模型。关键创新点在于:1)纳入五年回溯期的检测数据均值/极值;2)处理90%以上缺失率的参数时采用均值插补;3)通过特征重要性分析识别核心指标。
主要结果
讨论与意义
该研究首次系统评估初级医疗生化数据对CD的预测价值,揭示现有检测参数的局限性:
尽管预测效能未达预期,研究为后续工作指明方向:
该成果发表于《Scientific Reports》,为缩短CD诊断延迟提供了方法论基础,强调未来需平衡预测精度与临床可操作性的研究设计。
生物通微信公众号
知名企业招聘