综述：基于大语言模型的中医智能问答系统综述

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年07月26日 来源：Journal of Pharmaceutical Analysis 6.1

编辑推荐：

　　这篇综述系统梳理了大语言模型(LLM)在中医(TCM)领域的应用进展，重点探讨了中医智能问答系统(QA)的技术架构、训练方法（如预训练PT、微调FT、检索增强生成RAG）和典型模型（如华佗GPT、黄帝、仲景等），并展望了其在医学教育、药物研发（如ADMET预测）和临床诊疗（如多模态诊断）中的潜力，为中医现代化发展提供了新思路。

大语言模型（LLM）的演进与中医智能问答革命

从NLP阶段到突破发展期，大语言模型经历了以Transformer架构为核心的四大发展阶段。2017年Vaswani提出的Transformer凭借多头注意力机制（Multi-Head Attention）和位置编码（Positional Encoding），彻底改变了序列建模范式。GPT-3的1750亿参数和ChatGPT的多模态能力，为医疗领域应用奠定基础。

中医大模型的三大技术支柱
中医LLM的核心技术架构包含：1）基于Query-Key-Value的注意力计算机制，通过Softmax(QK^T/√d)V实现语义关联；2）采用旋转位置嵌入（RoPE）增强长文本处理；3）混合专家（MoE）架构提升计算效率。训练方法上，华佗GPT采用监督微调（SFT）结合CMeKG知识图谱，而仲景模型创新性地引入人类反馈强化学习（RLHF），通过近端策略优化（PPO）算法对齐专家偏好。

中医QA系统的实战派阵容
• 华佗GPT：基于LLaMA-7B架构，在8000条高质量指令数据上微调，安全评分达2.88/3
• 黄帝模型：整合《黄帝内经》等古籍，构建50万对话数据集，F1@10提升11.89%
• 仲景系统：采用Baichuan2-13B底座，在763629条医疗指令上训练，多轮对话胜率63%
• 灵丹处方推荐模型：通过QLoRA技术实现4比特量化，Top@20 F1值提升18.39%

突破临床应用的三大挑战
数据异构性成为首要瓶颈——中医数据涵盖古籍文献（如《伤寒论》）、舌诊图像、脉象信号等多模态信息。药物研发中，SMILES分子表示与方剂知识的融合亟待解决。隐私保护方面，联邦学习（Federated Learning）展现潜力，实现"数据不动模型动"的协作训练。

未来发展的黄金赛道
1）多模态诊断：整合舌象识别（CNN）与问诊文本（BERT）
2）方剂优化：基于40万临床处方构建知识图谱
3）教育革新：LLM生成的虚拟病例提升《金匮要略》教学效率
4）基层医疗：Qihuangwendao模型已服务100万+农村患者

这些突破正推动中医从"经验医学"向"数智医学"转型，而大语言模型将成为这场变革的核心引擎。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号