神经网络模型在低密度脂蛋白胆固醇(LDL胆固醇)估计方面的表现优于传统方程:一项针对188,887名中国人群(重点关注高甘油三酯血症患者)的比较研究
《Atherosclerosis plus》:Neural Network Model Outperforms Conventional Equations in LDL Cholesterol Estimation: A Comparative Study of 188,887 Chinese Individuals with Focus on Hypertriglyceridemia
【字体:
大
中
小
】
时间:2025年11月28日
来源:Atherosclerosis plus 2.1
编辑推荐:
精准估算低密度脂蛋白胆固醇(LDL-C)对心血管疾病风险管理至关重要,但传统公式在极高甘油三酯血症中误差显著。本研究基于18.8万例中国人群血脂数据,开发了神经网络模型(LDL-C(NN)),并对比了Friedewald、Martin/Hopkins和Sampson公式的性能。结果显示,LDL-C(NN)在相关系数(r=0.9742-0.9778)、根均方误差(RMSE=0.1762-0.2379 mmol/L)和一致性相关系数(CCC=0.8750-0.8815)方面均优于传统公式,尤其在TG≥9.03 mmol/L时优势显著,临床分类准确率提升至83.4%-87.5%。
这篇研究由北京大学深圳医院实验室医学部团队主导完成,聚焦于开发基于神经网络的低密度脂蛋白胆固醇(LDL-C)估算模型,并通过大规模真实世界数据验证其临床价值。研究团队整合了来自深圳医院门诊(Mindray系统)和住院患者(Beckman系统)的18.8万份血脂检测数据,系统评估了传统LDL-C估算公式(包括Friedewald、Martin/Hopkins和Sampson公式)与新型神经网络模型的性能差异,特别是在高甘油三酯血症患者中的表现。
**核心发现与临床意义**
1. **传统公式的局限性**
Friedewald公式作为临床最常用的LDL-C估算方法,在高甘油三酯血症(TG≥9.03 mmol/L)场景下表现严重恶化。研究显示,当TG超过9.03 mmol/L时,Friedewald公式估算值与实测值的误差率可达115%,并产生大量生物学不合理的负值。其他改良公式(如Martin/Hopkins和Sampson)虽通过引入动态系数部分缓解问题,但在极端高TG水平(≥13.56 mmol/L)时仍存在高达40%的误差率。
2. **神经网络模型(LDL-C(NN))的突破性表现**
研究团队采用三层前馈神经网络(输入层:TC、TG、HDL-C;输出层:直接测定的LDL-C),通过60,000例样本训练,成功实现了非线性关系的建模。在独立测试集(Mindray:53,731例;Beckman:75,156例)中,LDL-C(NN)展现出显著优势:
- **高相关性**:Mindray系统r值达0.978,Beckman系统达0.974,均优于传统公式(Friedewald r=0.89,Martin/Hopkins r=0.96)
- **低误差率**:Mindray系统RMSE为0.176 mmol/L,是Friedewald公式的37%(0.478 mmol/L),且未出现负值
- **临床分类准确率提升**:Mindray系统分类准确率87.5%,较Friedewald提升21个百分点;Beckman系统达83.4%,较传统公式最高提升11.7个百分点
3. **关键亚组分析**
在高TG亚组(≥9.03 mmol/L)中,LDL-C(NN)的CCC值达到0.875(Mindray)和0.882(Beckman),较次优的Martin/Hopkins公式分别高58.7%和56.4%。特别值得注意的是,该模型在高TG场景下仍能保持稳定性能:
- 当TG达到13.56 mmol/L时,传统公式误差率普遍超过100%
- LDL-C(NN)的RMSE控制在0.63-1.14 mmol/L,且未出现负值或生物矛盾结果
4. **系统特异性与跨平台验证**
研究首次实现跨检测系统(Mindray与Beckman)的模型验证。通过对比发现,神经网络模型在两种不同分析设备上的性能差异极小(Mindray CCC=0.875 vs Beckman CCC=0.882),证实其泛化能力。此外,模型已转换为Excel可执行公式,解决了AI模型临床应用的技术壁垒。
**技术实现与创新**
研究采用分层随机抽样策略,针对不同TG水平(<2.26、2.26-9.03、9.03-13.56、≥13.56 mmol/L)构建差异化训练集,确保极端高TG样本(占比0.57%-0.61%)的充分覆盖。通过Levenberg-Marquardt算法优化参数,最终模型不仅实现非线性映射,还通过自动稀释技术(针对TG>11.3 mmol/L样本)保持结果可靠性。
**临床转化价值**
1. **风险分层优化**:在3.4-4.9 mmol/L关键治疗窗范围内,传统公式平均低估率达14.7%-20.7%,而神经网络模型将误差控制在3.5%以内
2. **治疗决策支持**:研究显示,使用LDL-C(NN)可减少63%(Mindray)-32%(Beckman)的患者被错误分类至不同治疗等级,尤其在极高危患者(LDL-C>4.9 mmol/L)中分类准确率提升达27%
3. **标准化解决方案**:通过将神经网络参数导出为可执行公式,解决了机器学习模型临床落地的技术难题,使基层医疗机构无需额外设备即可应用
**局限性与未来方向**
1. **数据局限性**:样本主要来自单一医院(北京大学深圳医院),且未纳入特殊人群(如罕见遗传性脂质异常患者)
2. **模型解释性**:研究承认当前为"黑箱"模型,后续计划引入SHAP等可解释性工具增强临床信任度
3. **扩展应用**:团队正在探索将模型与载脂蛋白B(ApoB)联合评估系统结合,以更全面预测ASCVD风险
**行业影响**
该研究为2023年《中国血脂管理指南》的实践提供了重要数据支撑。研究证实,当TG>4.52 mmol/L时,传统公式应停止使用,而神经网络模型可在该范围内保持稳定性能(CCC>0.85)。这一结论与2024年NLA专家共识形成呼应,共识强调需建立针对高甘油三酯血症的LDL-C评估新标准。
**总结**
这项研究标志着LDL-C估算技术从线性假设向数据驱动模型的重大转变。通过整合18.8万份真实检测数据,开发的首个中文人群专用神经网络模型,在关键临床场景(高TG血症)中展现出革命性性能提升。其成果不仅验证了人工智能在血脂管理中的可行性,更为建立新一代血脂评估标准提供了科学依据,预计将推动心血管疾病风险分层管理进入智能化新时代。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号