
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于大语言模型与知识图谱融合的临床试验预筛选问卷智能生成框架研究
【字体: 大 中 小 】 时间:2025年07月29日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对临床试验招募效率低下的难题,创新性地将大语言模型(LLM)与知识图谱技术相结合,开发出自动化问卷生成与参与者筛选系统。上海工程技术大学电子电气工程学院团队通过构建临床实验知识图谱约束LLM输出范围,实现了包含纳入/排除标准的精准问卷生成(JSON格式准确率98.57%)和应答分析(资格判定准确率92.85%)。该框架显著提升招募效率,为加速医学研究进程提供智能化解决方案。
医学研究的"招募困局"与智能破局之道
在医学研究领域,80%的临床试验因招募不足而面临统计效力下降和成本增加的困境。传统依赖医护人员推荐的被动招募模式,常因专业术语晦涩、流程繁琐导致患者参与意愿低下。更棘手的是,电子健康记录(EHR)数据存在时效性差、记录详略不一等问题,直接匹配参与标准犹如大海捞针。
上海工程技术大学电子电气工程学院的Chen Zihang团队在《Scientific Reports》发表的研究给出了智能化解决方案。该团队创造性地将知识图谱的精准知识约束能力与大型语言模型(LLM)的自然语言处理优势相结合,开发出临床试验预招募框架。通过Neo4j构建包含579项试验数据的知识图谱,采用GLM-3-Turbo等多模型协同,实现了从标准解读→问卷生成→资格判定的全流程自动化,使招募效率产生质的飞跃。
关键技术方法
研究团队通过临床trials.gov API获取复旦大学相关试验数据,设计9类实体和关系构建Neo4j知识图谱。采用Prompt Engineering设计四要素提示模板(任务描述/参与标准/输出格式/示例),通过调整temperature(0.5-0.85)和top_p(0.4)参数优化LLM输出。使用GLM-4、llama3-70b-instruct等模型生成JSON格式问卷,并开发智能评估模块分析患者应答数据,最终在562项试验验证中实现ROUGE-L评分0.5459的语义保持能力。
研究结果
知识图谱构建
设计Recruitment_Project等9类核心实体及其关系网络,其中Recruitment_Project实体包含Inclusion Criteria等8个关键属性。如图3所示的知识图谱结构,为症状关联扩展招募范围提供可视化支持。
问卷生成优化
对比实验显示,添加示例的提示模板使JSON格式准确率提升25.56%,llama3-70b-instruct模型在生成质量(BLEU-5 0.3836)和资格判定准确率(92.85%)上表现最优。温度参数调至0.5时,问题数量减少8.3%的同时保持97.33%格式准确率。
智能资格评估
通过85例模拟患者测试,系统能自动输出包含result/reason/correctNumber三要素的JSON判定结果。如表4所示,当患者预期生存期不满足3个月标准时,模型能精准定位不符合项并量化符合标准数(6/7)。
伦理合规设计
框架集成匿名化处理与知情同意机制,在问卷中嵌入心理咨询资源链接,满足GDPR等法规要求。如图1所示的招募流程,确保在EHR初步筛选后通过多种渠道分发LLM生成问卷。
研究启示
该研究突破性地解决了临床试验招募的"最后一公里"难题。知识图谱的精准知识锚定有效规避了LLM的"幻觉输出",而动态提示模板设计使问卷能适配不同疾病场景。特别值得注意的是,框架在保持90%应答分析准确率的同时,将传统数周完成的问卷设计压缩至分钟级。未来通过引入人类反馈机制,可进一步优化隐私保护与标准输入规范化。这项技术不仅缩短招募周期,更通过智能问答功能提升患者参与体验,为AI驱动医学研究树立了新范式。
生物通微信公众号
知名企业招聘