《npj Digital Medicine》:KT-LLM: an evidence-grounded and sequence text framework for auditable kidney transplant modeling
编辑推荐:
为解决肾移植领域长期存在的纵向随访数据与文本临床规则脱节问题,研究人员开发了KT-LLM框架,通过检索增强生成技术将Banff病理分类、OPTN/SRTR政策文档与移植受者随访序列相结合。该系统包含SRTR-MambaSurv(离散时间竞争风险预测)、OPTN-BlackClust(黑人受者亚型聚类)和Policy-Ops(政策合规检查)三个可审计智能体,在OPTN/UNOS队列中显著提升了证据溯源准确性和预测校准度,为多中心标准化诊疗提供可验证的决策支持。
在肾移植临床实践与研究中,结构化随访数据与文本化临床规则如同两条平行线,难以有效协同。移植受者随访系统(TRF)要求术后6个月、1年及每年定期提交数据,而Banff移植病理分类通过中央数据库动态更新诊断标准,SRTR项目特异性报告(PSR)每半年发布中心质量评估结果。这种割裂导致报告一致性差、合规性难以追溯,尤其面对黑人受者结局异质性、种族中性eGFR(估算肾小球滤过率)计算规则变更等复杂场景时,传统模型缺乏将政策条文转化为可执行检查机制的能力。
为解决这一难题,广东人民医院肾移植团队在《npj Digital Medicine》发表研究,提出KT-LLM框架。该框架通过检索增强生成(RAG)技术将Banff中央库、OPTN/UNOS政策手册、SRTR方法学文档等权威知识源嵌入系统,构建可验证的决策流水线。其核心创新在于协调三个专业智能体:Agent-A(SRTR-MambaSurv)采用线性时间Mamba模型处理TRF对齐的离散时间序列,预测移植肾失功与死亡的竞争风险;Agent-B(OPTN-BlackClust)通过深度嵌入聚类识别黑人受者临床亚型;Agent-C(Policy-Ops)将OPTN提交时限、SRTR报告周期等规则编译为可执行检查表。通过覆盖约束解码与证据指针机制,系统确保每个结论均锚定版本化来源。
关键技术方法上,研究基于OPTN STAR(标准移植分析与研究)文件与SRTR SAF(标准分析文件)2015-2019年数据,采用离散时间竞争风险模型处理非等距随访序列。Mamba架构通过输入依赖的状态更新实现线性复杂度推理,显著降低长序列计算开销。政策规则通过术语感知重新加权与交叉编码器重排序实现精准检索,而深度聚类模块结合IDEC(改进深度嵌入聚类)目标函数与共识选择保证亚型稳定性。
研究结果
证据溯源的问答性能提升
在Banff-QA与Policy-QA测试中,KT-LLM的精确匹配率分别达91.8%与82%,证据命中率提升至83.5%。相比传统检索模型(BM25+BERT:72.5%)与医学大语言模型(Med-PaLM 2:86.7%),其优势主要体现在多条款融合与阈值符号化验证能力。
长序列生存预测精度优化
SRTR-MambaSurv在移植肾失功与死亡的C指数分别达到0.82与0.80,较最佳基线(Dynamic-DeepHit:0.79/0.77)提升0.03。时间依赖性AUC在1年死亡预测中达0.84,3年移植肾失功预测为0.82,集成Brier分数降至0.136,显示更优的校准度。
黑人受者亚型识别有效性
OPTN-BlackClust在2015-2019年黑人受者队列中发现稳定聚类(NMI=0.58,ARI=0.45),Gray检验显示集群间移植肾失功风险差异显著(-log10p=4.6)。聚类轮廓系数(0.25)与自助法杰卡德稳定性(0.79)均优于传统方法(K-means:0.14/0.56),证实其捕捉异质性的能力。
政策规则引擎执行效能
Policy-Ops将OPTN Policy 18规定的60/90天TRF提交窗口、种族中性eGFR阈值等编译为可执行规则,规则触发一致率达88%。通过对齐PSR数据冻结期(发布前6个月),系统自动标记时间轴偏差超30天的异常记录。
研究结论表明,KT-LLM通过将文本规则转化为可计算检查表、随访序列转化为可校准表征、治理时钟转化为可操作约束,实现了肾移植证据模型的审计闭环。其意义在于首次建立政策版本、病理术语与生存预测的同步机制,支持多中心时代公平性监测。未来可扩展至个体化随访调度、实时政策对齐等场景,但需持续跟踪Banff分类更新与OPTN政策迭代,通过滚动再校准保持系统时效性。