
-
生物通官微
陪你抓住生命科技
跳动的脉搏
超越传统模型:基于欧洲癌症登记数据、利用大语言模型进行乳腺癌预后分析
《BMC Medical Informatics and Decision Making》:Beyond classical models: LLM-driven survival analysis for breast cancer prognosis using European cancer registry data
【字体: 大 中 小 】 时间:2026年06月14日 来源:BMC Medical Informatics and Decision Making 3.8
编辑推荐:
摘要背景生存分析是临床预后评估中的重要工具,但传统统计模型往往难以捕捉现代医疗数据中复杂的、高维度的关系。大型语言模型的最新进展为构建灵活且具备上下文感知能力的模型提供了新可能。与此同时,由于隐私限制,获取真实临床数据仍然十分困难,这促使人们使用合成数据集作为保护隐私的替代方案,
生存分析是临床预后评估中的重要工具,但传统统计模型往往难以捕捉现代医疗数据中复杂的、高维度的关系。大型语言模型的最新进展为构建灵活且具备上下文感知能力的模型提供了新可能。与此同时,由于隐私限制,获取真实临床数据仍然十分困难,这促使人们使用合成数据集作为保护隐私的替代方案,用于模型的开发与评估。
我们提出了一种基于微调后大型语言模型的生存分析框架,并在基于欧洲癌症登记数据构建的大规模合成乳腺癌数据集上进行了测试。该合成数据集模拟了国家层面的癌症登记系统,包含60,000名乳腺癌患者,是在经过特征工程和数据填补处理后得到的。我们将传统的生存分析方法,如Cox回归和梯度提升算法,与多种微调后的大型语言模型进行了比较,这些模型分别采用仅编码器、仅解码器以及编码器-解码器架构。模型性能是通过考虑数据缺失情况的标准化生存分析指标来评估的。为检验模型的泛化能力,表现最佳的模型还被应用到了荷兰癌症登记系统中183,304名患者的真实数据集上。
所提出的基于大型语言模型的模型在多项生存分析指标上的表现都相当出色,不同模型架构之间的性能差异也较为稳定。当将这些模型应用于真实登记数据时,无论是在基于合成数据训练的模型还是基于真实数据训练的模型,都在回顾性评估中保持了强劲的性能;而在无法获取生存状态的标准推理条件下,其性能则有所下降。这项研究提供了大规模的实证证据,表明基于合成癌症登记数据训练的模型能够泛化到真实人群中,在回顾性评估中表现优异,而在标准推理条件下的性能则处于中等水平。
本研究证明,大型语言模型可以作为一种灵活的生存分析工具。使用高保真度的合成数据不仅能够在保护隐私的同时进行模型开发,还能保持出色的预测性能。这些研究结果支持将生成式人工智能技术整合到生存分析流程中,尤其是在数据资源有限的临床环境中。
生存分析是临床预后评估中的重要工具,但传统统计模型往往难以捕捉现代医疗数据中复杂的、高维度的关系。大型语言模型的最新进展为构建灵活且具备上下文感知能力的模型提供了新可能。与此同时,由于隐私限制,获取真实临床数据仍然十分困难,这促使人们使用合成数据集作为保护隐私的替代方案,用于模型的开发与评估。
我们提出了一种基于微调后大型语言模型的生存分析框架,并在基于欧洲癌症登记数据构建的大规模合成乳腺癌数据集上进行了测试。该合成数据集模拟了国家层面的癌症登记系统,包含60,000名乳腺癌患者,是在经过特征工程和数据填补处理后得到的。我们将传统的生存分析方法,如Cox回归和梯度提升算法,与多种微调后的大型语言模型进行了比较,这些模型分别采用仅编码器、仅解码器以及编码器-解码器架构。模型性能是通过考虑数据缺失情况的标准化生存分析指标来评估的。为检验模型的泛化能力,表现最佳的模型还被应用到了荷兰癌症登记系统中183,304名患者的真实数据集上。
所提出的基于大型语言模型的模型在多项生存分析指标上的表现都相当出色,不同模型架构之间的性能差异也较为稳定。当将这些模型应用于真实登记数据时,无论是在基于合成数据训练的模型还是基于真实数据训练的模型,都在回顾性评估中保持了强劲的性能;而在无法获取生存状态的标准推理条件下,其性能则有所下降。这项研究提供了大规模的实证证据,表明基于合成癌症登记数据训练的模型能够泛化到真实人群中,在回顾性评估中表现优异,而在标准推理条件下的性能则处于中等水平。
本研究证明,大型语言模型可以作为一种灵活的生存分析工具。使用高保真度的合成数据不仅能够在保护隐私的同时进行模型开发,还能保持出色的预测性能。这些研究结果支持将生成式人工智能技术整合到生存分析流程中,尤其是在数据资源有限的临床环境中。