多智能体大语言模型驱动阿尔茨海默病药物组合发现:协同假说生成与实验验证

《iScience》:Multi agent large language models for biomedical hypothesis generation in drug combination discovery

【字体: 时间:2025年11月23日 来源:iScience 4.1

编辑推荐:

  本研究针对数据稀缺领域开放科学假说生成的挑战,提出了一种创新性多智能体大语言模型框架Coated-LLM。该框架通过模拟科研协作流程(研究者-评审者-仲裁者三级审核机制),结合动态少样本学习、检索增强生成及自一致性校验等技术,实现了阿尔茨海默病(AD)药物组合疗效的精准预测。实验表明,该模型在测试集上准确率达0.74,显著优于传统网络模型(0.52),并成功通过体外实验验证了模型预测的M266抗体与绞股蓝皂苷XVII(Gypenoside XVII)组合可显著抑制Aβ42淀粉样蛋白聚集。这一研究为复杂疾病药物发现提供了可扩展的AI驱动假说生成范式。

  
在阿尔茨海默病(AD)药物研发领域,单一靶点疗法屡屡受挫,而组合疗法虽被寄予厚望,却因疾病机制复杂、实验成本高昂及组合爆炸问题难以系统性探索。传统方法依赖人工假设与有限数据,存在认知偏差和效率瓶颈。尤其对于数据稀缺的研究方向,机器学习模型往往束手无策。如何突破人类理性局限,高效生成可靠的科学假说,成为加速疾病治疗创新的关键挑战。
为此,德克萨斯大学休斯顿健康科学中心等机构的研究团队在《iScience》发表论文,提出了一种名为Coated-LLM(Combinatorial Alzheimer's disease Therapeutic Efficacy Decision)的人工智能框架。该框架受科研协作启发,构建了多智能体大语言模型系统,通过模拟研究者提出假说、评审者批判质疑、仲裁者整合决策的流程,实现了AD药物组合疗效的自动化预测与优化。研究不仅通过内部验证展示了模型的高准确性,还经体外实验证实了模型推荐的新组合M266+Gypenoside XVII能显著抑制Aβ42聚集,为AD治疗提供了新的候选方案。
关键技术方法
研究首先通过文献挖掘收集了280篇AD药物组合研究(250例有效、30例无效),并采用随机替换策略对负样本进行数据增强,最终构建包含530个组合的数据集。Coated-LLM框架包含三个阶段:预热阶段通过检索增强生成(RAG)和链式思维(CoT)提示构建高质量学习样本;推理阶段结合动态少样本学习与自一致性投票生成初步预测;修订阶段引入多评审者树状思维(ToT)讨论与仲裁者整合,提升预测严谨性。体外实验采用硫黄素T(ThT)荧光法检测Aβ42聚集抑制率。
研究结果
模型开发
预热阶段生成的231个正确预测样本作为后续推理的学习范例。动态少样本检索中,测试问题与top-5示例的平均余弦相似度达0.919,显著高于随机样本(0.13),确保示例相关性。修订阶段,156个测试组合中129个达到80%以上自一致性,83个实现完全一致。
Coated-LLM显著提升药物组合疗效预测准确率
在156个测试组合上,Coated-LLM准确率达0.74(精确度0.71,召回率0.80,F1分数0.75),置信度0.87,预期校准误差(ECE)0.17。相比之下,传统网络模型准确率仅为0.52(表1)。模型对非传统药物(如无膜干细胞提取物)同样有效,凸显其灵活性。
回顾性体外验证
使用独立私有数据集(11个组合,含9个无效案例)进行验证,Coated-LLM准确率达0.82,显著高于基线模型(0.27)(表2)。尽管数据集分布偏向阴性,模型仍保持稳健性能。
实验验证药物组合彰显实用价值
从假阳性案例中筛选前三名组合进行体外实验。结果显示,Gypenoside XVII单药可抑制约50%的Aβ42聚集,而M266单药无效;二者联用后抑制效果显著增强(图3),证实模型发现协同疗法的潜力。
消融实验揭示关键贡献因素
从零样本GPT-4基线开始,逐步引入动态少样本、RAG、自一致性和多智能体修订机制(图4)。结果显示:RAG带来最大提升(准确率+17%);多智能体修订虽降低召回率,但显著提升精确度(+9%),更符合实际应用中优先控制假阳性的需求。
讨论与结论
Coated-LLM通过多智能体协作有效模拟了科学发现的严谨性,其评审者与仲裁者机制类似人类同行评审,倾向于优先排除假阳性。研究指出,动态少样本学习中高质量真实样本对性能提升至关重要,而数据增强虽轻微降低指标,却是平衡类别偏差的必要手段。失败案例分析揭示了模型可能过度泛化先验知识或忽略天花板效应等局限。
该框架单次预测耗时约4分钟,成本0.95美元,在学术与工业场景中具备可扩展性。研究为数据稀缺领域的生物医学假说生成提供了新范式,其核心价值在于将人类从组合爆炸的搜索困境中解放出来,通过AI驱动的高效推理加速靶向发现。未来需进一步优化数据质量与模型泛化能力,但本研究无疑为复杂疾病药物开发开辟了一条充满希望的智能化路径。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号