
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于大语言模型的多源报告融合技术在脑肿瘤自动诊断分类与零样本预后预测中的应用研究
【字体: 大 中 小 】 时间:2025年06月13日 来源:Meta-Radiology CS10.2
编辑推荐:
为解决脑肿瘤诊断中多源医学报告信息整合困难的问题,研究人员开发了基于大语言模型(LLM)的多源集成管道,通过融合MRI和病理报告数据,实现了肿瘤存在性(准确率84.9%)和稳定性(92.9%)的自动分类,并在独立队列中验证了其预后预测价值(p=0.017),为精准医疗提供了新工具。
脑肿瘤尤其是胶质瘤的诊断和治疗面临巨大挑战,其敏感部位和快速进展特性使得精准评估成为临床难题。尽管MRI和病理检查是金标准,但不同医疗机构采用的评估标准不一致,导致报告解读存在主观偏差。更棘手的是,放射科与病理科报告间的术语差异使得跨科室沟通效率低下,直接影响患者的长期随访和治疗决策。在这种背景下,如何通过人工智能技术整合多源医疗数据,建立客观统一的诊断体系,成为神经肿瘤学领域亟待突破的瓶颈。
来自美国罗德岛医院的研究团队在《Meta-Radiology》发表创新性研究,首次将临床大语言模型(GatorTron)应用于脑肿瘤多源报告分析。该研究通过构建包含426名患者的5562份MRI报告和657份病理报告的数据集,开发了基于双向编码器表征转换器(BERT)架构的多层感知机(MLP)分类系统。关键技术包括:1)采用PRISSMM框架标注肿瘤存在性(存在/不存在)和稳定性(改善/恶化/稳定);2)使用预训练LLM提取多源报告特征;3)通过加权交叉熵损失解决数据不平衡问题;4)在33例胶质母细胞瘤患者中验证零样本预后预测能力。
研究结果显示,多源报告整合显著提升分类性能。在肿瘤存在性分类任务中,模型达到微F1分数0.849(95%CI:0.814-0.880),AUROC为0.893;肿瘤稳定性分类更达F1分数0.929(95%CI:0.904-0.954),AUROC高达0.964。与单源(MRI-only)相比,多源输入使肿瘤存在性和稳定性分类的F1分别提升10.4%和5.6%。
在预后验证中,模型预测的"肿瘤稳定性"标签成功区分高低风险组(p=0.017),其预测效力与MGMT启动子甲基化状态(p=0.006)相当,优于部分放射组学特征。值得注意的是,肿瘤核心球形度(sphericity)和T1增强成像偏度(skewness)等影像特征也显示出预后价值(p<0.05),但模型生成的自动化标签避免了侵入性检测,展现出临床转化优势。
讨论部分指出,该研究的突破性在于首次实现LLM对跨模态医疗报告的深度整合。与传统NLP方法相比,LLM通过注意力机制捕捉报告间的隐含关联,如将影像学描述与病理诊断自动对应。尽管存在"黑箱"局限性,但模型通过特征级融合策略有效降低了病理报告冗余带来的噪声干扰。研究者建议未来可结合可解释AI技术,如通过注意力权重可视化关键诊断依据,并探索基因组数据的整合以进一步提升预测精度。这项研究为脑肿瘤的精准诊疗提供了可扩展的智能化解决方案,标志着多模态医疗数据分析进入新阶段。
生物通微信公众号
知名企业招聘