TCM-DS:基于DeepSeek-R1的食药同源智能推荐系统创新研究

《Chinese Medicine》:TCM-DS: a large language model for intelligent traditional Chinese medicine edible herbal formulas recommendations

【字体: 时间:2025年11月18日 来源:Chinese Medicine 5.7

编辑推荐:

  本研究针对传统中医食药同源配方推荐依赖经验、缺乏智能化系统的问题,开发了基于DeepSeek-R1的领域专用大语言模型TCM-DS。通过LoRA微调和RAG模块,构建包含288个食药同源配方、484种症状和9种体质的数据集,实现了0.9924的推荐精度,显著优于通用大语言模型。该研究为中医"治未病"理论提供了智能化实践方案,推动了中医药现代化发展。

  
在传统中医(Traditional Chinese Medicine, TCM)悠久的发展历史中,"药食同源"(Medicine and Food Homology, MFH)这一理念始终占据着重要地位。这一概念最早可追溯至《黄帝内经》,认为许多物质兼具食物和药物的双重属性,既能提供营养又具有治疗功效。基于这一理论发展而来的食药同源配方,通过多种食药同源物质的协同组合,将饮食营养与治疗效果有机结合,在健康管理和慢性病预防方面展现出独特价值。
然而,传统的中医配方推荐主要依赖医师的经验知识,这种模式在公共卫生场景下存在明显的可扩展性限制。随着人工智能技术的快速发展,大语言模型(Large Language Models, LLMs)在自然语言处理(Natural Language Processing, NLP)领域展现出强大潜力,为中医药智能化应用提供了新的技术路径。尽管已有一些研究尝试将LLMs应用于中医药领域,但这些模型主要专注于传统药方生成,缺乏专门针对食药同源配方的推荐框架,且未能充分整合中医体质理论这一个性化诊疗的核心要素。
澳门科技大学创新工程学院流行病智能与医学大数据应用呼吸疾病实验室的李玄锋等人,在《Chinese Medicine》杂志上发表了题为"TCM-DS: a large language model for intelligent traditional Chinese medicine edible herbal formulas recommendations"的研究论文,提出了一种专门针对中医食药同源配方推荐的领域专用大语言模型TCM-DS。
该研究的创新之处在于首次将中医体质理论系统性地融入智能推荐系统,基于王琦的九种体质分类法(平衡质、阳虚质、阴虚质、气虚质、气郁质、痰湿质、湿热质、血瘀质、特禀质),构建了体质感知的配方推荐机制。研究人员遵循中国国家卫生健康委员会和国家市场监督管理总局的监管指南,系统收集了426种食药同源物质,并从中整理出288个食药同源配方及其对应的症状信息,建立了结构化的数据集。
技术方法上,研究团队采用DeepSeek-LLM-7B作为基础模型,通过低秩自适应(Low-Rank Adaptation, LoRA)微调和检索增强生成(Retrieval-Augmented Generation, RAG)模块进行领域适配。数据集按9:1比例划分为训练集和测试集,使用排名r=8、缩放因子lora_alpha=32的LoRA配置,在3个训练周期内实现了参数高效微调。RAG模块通过向量数据库检索相关配方信息,结合症状和体质特征生成个性化推荐。
模型构建与优化
TCM-DS模型通过系统的数据清洗和标准化流程,将口语化症状描述转化为标准TCM术语,并构建了提示-补全格式的训练数据。模型采用综合征优先的推理模式,首先将症状聚类为证候候选,再结合体质信息进行配方推荐。这种设计模拟了中医师"辨证论治"的临床思维过程,而非简单匹配症状与草药。
性能评估与比较
消融实验结果显示,基础模型推荐精度仅为0.3848,单独使用LoRA微调提升至0.6711,单独使用RAG模块达到0.9081,而结合两种技术的TCM-DS模型实现了0.9924的最佳精度。在与通用大语言模型的对比中,TCM-DS在正序和反序症状输入条件下均表现最优,精度分别达到0.9924和0.9702,显著优于Qwen-Plus-latest(0.7615/0.8322)、ERNIE-4.0-8.0.0.0K(0.8344/0.9597)、ChatGPT-4o-latest(0.9854/0.8945)和DeepSeek-R1-671B-chat(0.9738/0.9301)等模型。
案例应用展示
基于TCM-DS模型开发的智能推荐平台,能够通过结构化问卷自动分析用户体质,并提供个性化配方推荐。如图4所示,当用户报告黑眼圈明显、畏寒、腹胀、身体沉重、行动困难、皮肤干燥等症状时,系统首先识别为阳虚体质,然后优先推荐养正草本饮,同时提供敏正草本饮和育生草本饮作为备选方案。这种设计既保证了推荐的科学性,又保留了实际应用的灵活性。
研究结论与意义
TCM-DS模型通过LoRA微调和RAG模块的有效结合,成功实现了对中医食药同源配方的高精度个性化推荐。该模型不仅显著提升了推荐准确性,还创新性地整合了中医体质理论,实现了"同病异治"的个性化诊疗原则。研究开发的智能平台为中医"治未病"理论提供了可行的智能化实践方案,推动了中医药在现代健康管理中的应用。
尽管TCM-DS模型取得了显著成果,研究团队也指出了若干需要进一步完善的方面。当前模型主要依赖结构化问卷输入,而真实环境中的症状描述具有高度异质性,未来需要开发自然语言处理模块来处理非结构化症状描述。此外,将面诊、舌诊、眼诊等中医关键诊断维度系统性地纳入模型,建立更全面的诊断推荐系统,也是未来的重要研究方向。
这项研究代表了中医药智能化领域的重要进展,首次将大语言模型技术与中医食药同源理论、体质学说有机结合,为中医药的现代化发展和国际化推广提供了技术支撑。随着数据集的持续扩展和技术的不断优化,TCM-DS模型有望在临床实践和健康管理中发挥更大价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号