
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于大语言模型的数字孪生技术在罕见妇科肿瘤精准医疗中的应用研究
【字体: 大 中 小 】 时间:2025年07月11日 来源:npj Digital Medicine 12.4
编辑推荐:
本研究针对罕见妇科肿瘤(RGTs)临床管理面临的低发病率、异质性高和治疗方案缺乏等挑战,创新性地利用大语言模型(LLM)构建数字孪生系统。研究人员整合了21例临床病例和655篇文献数据,开发出能模拟患者个体化治疗轨迹的预测模型,成功识别出传统方法可能遗漏的转移性子宫癌肉瘤(UCS)治疗方案。该研究为生物标志物驱动的肿瘤分类提供了新范式,显著提升了RGTs的精准医疗水平。
在妇科肿瘤领域,罕见肿瘤类型(RGTs)约占所有妇科恶性肿瘤的50%以上,却因年发病率低于6/10万而长期面临临床试验数据匮乏的困境。这类肿瘤具有高度异质性,包含30多种组织学亚型,如性索间质肿瘤和子宫癌肉瘤(UCS)等。传统以器官为基础的分类方式和"一刀切"的治疗方案导致患者预后普遍较差,三线单药治疗的中位无进展生存期(PFS)仅1.8个月。更棘手的是,电子健康记录(EHR)中非结构化的数据和分散的文献资源,使得分子肿瘤委员会(MTB)难以及时获取有效的生物标志物信息来指导治疗决策。
德国慕尼黑工业大学医学院(Technical University of Munich, TUM)的Jacqueline Lammert团队在《npj Digital Medicine》发表的研究中,开创性地将大语言模型(LLM)与数字孪生技术相结合,构建了RGTs精准医疗决策支持系统。研究团队开发的双阶段数据处理流程:首先使用本地部署的gemma-2-27b-it模型处理院内1821例MTB讨论病例的EHR数据,再通过云端Google-Gemini-1.5-Pro模型分析663篇科学文献。该系统成功整合了7例机构病例和14例文献病例的临床数据,并链接了包含404,265个病例的科学数据库,最终为PD-L1高表达(CPS≥40)、错配修复正常(pMMR)且具有中低肿瘤突变负荷(TMB<15mut/Mb)的子宫癌肉瘤患者建立了21个数字孪生模型。
关键技术包括:(1)基于Transformer架构的LLM进行非结构化医疗文本挖掘;(2)光学字符识别(OCR)与上下文学习(in-context learning)结合的EHR数据处理;(3)生物标志物驱动的患者相似性匹配算法;(4)跨机构数据整合的HL7 FHIR标准;(5)动态更新的数字孪生预测模型。所有分析均在符合GDPR的本地化环境中进行,确保了数据隐私安全。
对2017-2023年间MTB讨论的1821例病例回顾分析,筛选出9例PD-L1高表达(CPS≥40)、pMMR且TMB<15mut/Mb的妇科/癌肉瘤患者。其中7例接受免疫检查点抑制剂(ICI)治疗,包括5例派姆单抗(pembrolizumab)单药、1例派姆单抗+乐伐替尼(lenvatinib)和1例伊匹木单抗(ipilimumab)+纳武利尤单抗(nivolumab)。中位PFS达6个月,显著优于历史对照组的1.8个月。
本地LLM处理89份临床报告的中位准确率达0.76,在诊断和ICI治疗提取上实现100%准确率。云端LLM分析663篇文献的7956个属性,准确率0.97。文献分析发现15项UCS免疫治疗研究(共215例),但仅10例报告了PD-L1状态,且多数未进行生物标志物分层。
针对一例77岁转移性UCS患者(PD-L1 CPS=41,TMB=6.3mut/Mb),系统推荐了6种靶向方案:
研究揭示了当前RGT管理的三大瓶颈:(1)PD-L1作为预测标志物在UCS中验证不足,现有试验均未将其作为分层因素;(2)非结构化EHR导致关键临床信息提取困难;(3)德国个性化医疗网络(DNPM)数据模型尚待完善。数字孪生系统通过LLM实现了6.3倍的数据提取效率提升,使MTB决策时间从55分钟/例缩短至8.69分钟/例。
这项研究的突破性在于:(1)首次证明LLM可有效整合分散的RGTs证据,填补了罕见肿瘤证据空白;(2)创建了动态更新的数字孪生框架,支持治疗方案的实时模拟与优化;(3)为生物标志物驱动的"肿瘤不可知论"(tumor-agnostic)治疗提供了实践范例。正如研究者强调,当一位接受派姆单抗治疗的UCS患者持续缓解超30个月且CA-125保持稳定时,这种成功不仅验证了PD-L1在跨瘤种治疗中的价值,更预示着人工智能将重塑罕见肿瘤的精准医疗格局。未来随着德国分子肿瘤委员会门户(Molecular Tumor Board Portal)等国际协作平台的完善,这种LLM增强的决策系统有望在全球范围内提升RGTs患者的生存获益。
生物通微信公众号
知名企业招聘