基于大语言模型代理的Cascade框架在高血压筛查与临床决策支持中的效能评估
【字体:
大
中
小
】
时间:2025年10月10日
来源:Hypertension 8.2
编辑推荐:
本研究针对大语言模型(LLM)在高血压管理中的应用瓶颈,开发了Cascade框架并完成两阶段验证。结果显示:经Cascade增强的ChatGPT-4o模型在血压分类准确率(87.0% vs 62.5%, P<0.001)、风险分层(98.6% vs 60.4%)和临床决策适宜性(92.5% vs 72.0%)方面显著提升,外部验证组性能超越3名医师,证实其可有效整合于临床工作流。
研究人员开发了基于大语言模型(Large Language Model, LLM)的智能代理框架Cascade,用于高血压患者的筛查与个性化健康管理。该研究采用Dify平台构建系统,并于2024年8月至2025年6月期间通过两阶段评估方案进行验证。第一阶段针对三种基础LLM(包括ChatGPT-4o、ChatGPT-4oMini和DeepSeek-V3)及其Cascade增强版本进行系统性能对比;第二阶段则在疑似高血压患者队列中进行外部验证。
结果显示,Cascade集成显著提升了所有模型表现。以ChatGPT-4o为例,其在健康教育多项指标上取得进步:准确性从3.87提高至4.10(P=0.02),可信度自3.79升至4.03(P<0.001),情感支持得分由3.87增至4.01(P<0.001)。血压分类准确率从62.5%上升至87.0%(P<0.001),风险因素分层准确率由60.4%提高到98.6%(P<0.001),临床决策准确率则从72.0%提升到92.5%。
在外部验证队列中,4o-Cascade模型同样表现优异:血压分类准确率从58.9%大幅上升至95.3%,风险分层准确率由71.0%提高到90.7%,临床决策适宜性自66.4%提升至92.5%(所有比较P<0.001),其综合性能甚至超越了参与评估的三名医师。
该研究表明,Cascade框架能有效改善高血压管理质量,其可扩展架构既能融合于现有临床工作流程,又具备透明化的推理路径,为LLM在医学领域的深入应用提供了重要实践依据。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号