
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:基于大语言模型的中医智能问答系统综述
【字体: 大 中 小 】 时间:2025年07月26日 来源:Journal of Pharmaceutical Analysis 6.1
编辑推荐:
这篇综述系统梳理了大语言模型(LLM)在中医(TCM)领域的应用进展,重点探讨了中医智能问答系统(QA)的技术架构、训练方法(如预训练PT、微调FT、检索增强生成RAG)和典型模型(如华佗GPT、黄帝、仲景等),并展望了其在医学教育、药物研发(如ADMET预测)和临床诊疗(如多模态诊断)中的潜力,为中医现代化发展提供了新思路。
大语言模型(LLM)的演进与中医智能问答革命
从NLP阶段到突破发展期,大语言模型经历了以Transformer架构为核心的四大发展阶段。2017年Vaswani提出的Transformer凭借多头注意力机制(Multi-Head Attention)和位置编码(Positional Encoding),彻底改变了序列建模范式。GPT-3的1750亿参数和ChatGPT的多模态能力,为医疗领域应用奠定基础。
中医大模型的三大技术支柱
中医LLM的核心技术架构包含:1)基于Query-Key-Value的注意力计算机制,通过Softmax(QKT/√d)V实现语义关联;2)采用旋转位置嵌入(RoPE)增强长文本处理;3)混合专家(MoE)架构提升计算效率。训练方法上,华佗GPT采用监督微调(SFT)结合CMeKG知识图谱,而仲景模型创新性地引入人类反馈强化学习(RLHF),通过近端策略优化(PPO)算法对齐专家偏好。
中医QA系统的实战派阵容
• 华佗GPT:基于LLaMA-7B架构,在8000条高质量指令数据上微调,安全评分达2.88/3
• 黄帝模型:整合《黄帝内经》等古籍,构建50万对话数据集,F1@10提升11.89%
• 仲景系统:采用Baichuan2-13B底座,在763629条医疗指令上训练,多轮对话胜率63%
• 灵丹处方推荐模型:通过QLoRA技术实现4比特量化,Top@20 F1值提升18.39%
突破临床应用的三大挑战
数据异构性成为首要瓶颈——中医数据涵盖古籍文献(如《伤寒论》)、舌诊图像、脉象信号等多模态信息。药物研发中,SMILES分子表示与方剂知识的融合亟待解决。隐私保护方面,联邦学习(Federated Learning)展现潜力,实现"数据不动模型动"的协作训练。
未来发展的黄金赛道
1)多模态诊断:整合舌象识别(CNN)与问诊文本(BERT)
2)方剂优化:基于40万临床处方构建知识图谱
3)教育革新:LLM生成的虚拟病例提升《金匮要略》教学效率
4)基层医疗:Qihuangwendao模型已服务100万+农村患者
这些突破正推动中医从"经验医学"向"数智医学"转型,而大语言模型将成为这场变革的核心引擎。
生物通微信公众号
知名企业招聘