编辑推荐:
本文聚焦大语言模型(LLMs)在肿瘤学领域的应用。介绍其模型构建策略、医学应用,详细阐述在癌症筛查诊断、转移预测、分期、治疗推荐及文档处理等方面的作用,探讨面临的挑战并提出解决方向,为精准肿瘤学发展提供新思路。
大语言模型推进精准肿瘤学的潜力
随着人工智能(AI)在医学领域的快速发展,大语言模型(LLMs)逐渐成为临床研究的前沿热点。癌症作为全球主要死因之一,严重威胁公共健康。LLMs 在肿瘤管理方面展现出巨大潜力,有望推动精准肿瘤学的进步。
模型构建策略和医学应用
自 2018 年 GPT-1 发布,LLMs 不断发展,参数数量增加、知识拓展,性能逐步提升,如 GPT-4。LLMs 的构建过程可分为三个关键部分:获取内部知识、外部知识和患者特定数据;利用这些信息,基于合适的提示生成特定任务的输出。这种结构为 LLMs 融入癌症研究提供了途径。
LLMs 具备广泛解决临床问题的能力,可作为医学领域特定知识库(KBs),通过零样本或少样本学习进行推理。而微调能基于特定领域数据集调整模型参数,使其在保持预训练知识的同时,获取肿瘤学等领域的专业技能和见解。通过提示工程或上下文学习,LLMs 能快速响应用户,符合人类偏好,且无需修改模型参数。
自然语言理解可用于规范化临床数据,通过信息提取将非结构化医疗数据转换为统一格式。思维链(CoT)能让 LLMs 更好地模拟人类思维过程,提高推理能力,解决复杂任务。外部知识可增强 LLMs 的领域知识,检索增强生成(RAG)是一种有效的方法,但需注意患者数据的安全和隐私保护。
在医学领域,LLMs 可处理临床实践中产生的大量文本信息,如用于医疗记录书写、出院小结生成和影像报告结构化,减轻医生工作量。在疾病管理方面,能从诊断到预后预测提供临床决策支持,还可用于药物敏感性评估、免疫相关不良事件(irAEs)预测等。
肿瘤学中的应用
在癌症筛查和诊断方面,早期发现对癌症干预至关重要。利用 GPT-4o 分析纵向 CT 图像转化的视频,可识别肺癌高风险的肺结节,预测结果与放射科医生相符;设计问题测试 ChatGPT 对乳腺癌、前列腺癌和结直肠癌(CRC)的筛查和预防能力,模型表现出一定的准确性;Bard 和 GPT-4 对多种癌症的诊断准确率超 90%,GPT-4V 在病理分类任务中对结直肠肿瘤和正常组织的区分准确率达 90%。
肿瘤转移影响患者预后,LLMs 可协助预测癌症转移和靶器官。研究应用 ChatGPT 和 GPT-4 分析肺癌 CT 报告,GPT-4 在识别转移方面准确率更高;GPT-4V 在乳腺癌淋巴结转移检测中准确率达 88.3%。
准确的肿瘤分期对制定治疗方案至关重要。研究评估 ChatGPT-3.5 对肺癌病理评估的准确性,平均准确率为 0.89;对甲状腺癌,四个 LLMs 的集成分类器在肿瘤分期和风险预测任务中 F1 分数分别高达 98.1% 和 95.5%;Bard 和 GPT-4 在肿瘤分期任务中的准确率分别为 91.75% 和 95.88%。
在治疗推荐方面,评估 GPT-4 和 GPT-3.5 对胰腺癌手术可切除性的判断能力,GPT-4 准确性更高;基于 GPT-4 和 CNN 开发的 Radformer 可自动勾勒头颈部癌肿瘤体积;ChatGPT-3.5 在放疗领域特定和通用问题回答中表现出较高准确率;DrugFormer 可预测药物敏感性,AUC 达 0.975;RAG 辅助的 LLMs 可预测 irAEs,敏感性和特异性较高。但 LLMs 在治疗推荐中也存在数据量小、结论普遍性受限和产生幻觉等问题。
LLMs 在医学文档处理方面也有潜力。在乳腺癌研究中,ChatGPT-3.5 总结医学案例的能力得到评估;研究 LLMs 对乳腺影像报告和数据系统(BI-RADS)分类的能力,其与人类的一致性系数为 0.42 - 0.52;ChatGPT 可提取肺癌 CT 报告的关键特征,GPT-4 能有效总结胶质母细胞瘤的 MRI 报告。
挑战
尽管 LLMs 在肿瘤学应用中取得一定成果,但仍面临诸多挑战。LLMs 的 “黑箱” 效应使其决策过程难以理解,虽然有通过 CoT 提示模仿现实推理的模型,但可视化其逻辑的流程图仍有待完善。幻觉现象普遍存在,由于预训练数据和学习方式的问题,添加医学知识提示并不总能提升性能,在 LLMs 达到人类思维水平前,临床决策仍需人类专家主导。
LLMs 还存在社会偏见,如无法捕捉人口统计学多样性、夸大疾病与人口统计学的关联,不同语言和文化下表现差异明显。伦理问题也备受关注,包括责任不清和用户数据泄露风险,因此需要建立监管机构规范数据使用和医疗器械审批。
在肿瘤患者的整体医疗中,LLMs 全面发挥作用还有很长的路要走。基于 LLMs 的分子研究、基因突变识别、生存和预后预测等方面仍需深入研究,目前多数研究为探索性,需要更多综合研究、大规模多中心前瞻性验证和合理资源分配,以确保 LLMs 能跟上肿瘤学进展,提高模型输出的可信度。
结论
LLMs 的创新重塑了语言处理范式,在肿瘤学领域为推进精准肿瘤学、减轻健康负担提供了机会。但技术障碍和应用限制影响其在临床的可行性,未来深入研究和严格评估有助于实现针对恶性肿瘤的个性化医疗指导。