基于检索增强大语言模型与药食同源知识图谱的中医膳食推荐系统构建与验证

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月23日 来源：JMIR Medical Informatics 3.8

编辑推荐：

　　为解决传统中医(TCM)药食同源(MFH)膳食推荐依赖专家经验、大语言模型(LLM)存在幻觉和领域知识不足的问题，Hangyu Sha团队开发了Yaoshi-RAG框架。该研究通过构建不确定知识图谱(UKG)增强LLM，实现了24,984实体、29,292三元组的MFH知识表示，使DeepSeek-R1模型的Hits@1提升至84.2%，为个性化中医食疗提供可靠决策支持。

在传统医学与现代科技的交汇处，药食同源（Medicine Food Homology, MFH）理念正面临数字化挑战。中医典籍记载的食疗智慧长期依赖人工解读，而火爆全球的大语言模型（Large Language Model, LLM）虽能生成流畅建议，却常犯"把绿豆汤推荐给胃寒患者"的专业错误——这种因缺乏领域知识导致的"幻觉"问题，可能让养生建议变成健康隐患。

针对这一矛盾，东南大学Hangyu Sha团队在《JMIR Medical Informatics》发表创新研究，将不确定知识图谱（Uncertain Knowledge Graph, UKG）与LLM结合，打造出能"引经据典"的智能膳食推荐系统。

研究团队运用三大核心技术：首先采用LLM驱动的开放信息抽取（OpenIE）构建MFH知识图谱，从1359份古籍、文献等多元数据中提炼出2.9万条带置信度评分的三元组；接着开发基于加权PageRank的推理路径检索策略，通过SBERT嵌入实现语义匹配；最终设计多阶段提示工程，引导DeepSeek-R1等LLM生成证据充分的推荐。

【知识图谱构建】

通过LLM驱动的OpenIE从6类数据源构建包含24,984实体的MFH-KG，采用UKG推理补全缺失三元组并计算置信度，最终形成29,292条带概率标注的知识单元。

【检索增强生成】

• 实体链接：用SBERT编码实现查询关键词与图谱实体的语义匹配

• 路径推理：生成多跳关系路径（如"失眠多梦→关联体质→阴虚质→适宜食物→百合"）

• 结果优化：综合三元组置信度和加权PageRank得分对推理路径排序

【性能验证】

• 指标提升：MFH-KG使DeepSeek-R1的Hits@1提升14.5%，F₁-score达71.5%

• 案例展示：对"手足心热伴失眠"患者，系统准确推荐百合银耳羹并说明申时（15-17点）食用增效

• 策略对比：路径检索优于BM25和TransE RAG等基线方法，消融实验证实UKG和排序模块关键作用

这项研究开创性地解决了TCM数字化中的三大难题：通过UKG处理古籍知识的不确定性，利用推理路径增强可解释性，结合LLM实现个性化适配。其构建的MFH-KG不仅填补了中医食疗结构化知识的空白，更探索出传统智慧与AI融合的新范式——当《本草纲目》遇上知识图谱，千年养生哲学正在智能时代焕发新生。

值得注意的是，框架仍存在古籍文本解析精度、复杂证型处理等局限。未来通过细粒度关系抽取和领域微调，或将进一步释放传统医学数据的价值，为全球数字健康提供独特的"中医方案"。正如论文所示，在LLM席卷医疗的浪潮中，保持专业性与创新性的平衡，才是AI赋能传统医学的可持续之道。