综述:人工智能在癌症中的应用、挑战与未来展望

《Molecular Cancer》:Artificial intelligence in cancer: applications, challenges, and future perspectives

【字体: 时间:2025年10月31日 来源:Molecular Cancer 33.9

编辑推荐:

  本综述系统阐述了人工智能(AI)在肿瘤学研究与临床实践中的革命性作用。文章详细梳理了AI在癌症筛查与诊断(如结肠镜AI辅助检测、乳腺X线摄影深度学习模型)、精准治疗(如预测免疫治疗反应)、药物发现(如生成式AI设计小分子抑制剂)等关键领域的应用,同时深入探讨了数据隐私、算法公平性、临床验证等现实挑战。作者强调,通过多模态数据整合与可解释AI(XAI)技术的发展,AI有望加速精准肿瘤学(Precision Oncology)进程,最终改善全球癌症负担。

  
人工智能模型与数据模态
人工智能(AI)系统能够从数据中学习、识别模式并做出决策。在肿瘤学领域,AI利用医学影像、基因组学和临床记录等多种数据模态应对复杂挑战。AI模型的选择取决于数据类型和临床目标。例如,基因组生物标志物等结构化数据常使用逻辑回归等经典机器学习(ML)模型进行分析;而组织病理学和放射学等影像数据则利用卷积神经网络(CNNs)等深度学习(DL)架构来提取空间特征。近年来,大型语言模型(LLMs)如GPT系列的进步,增强了从科学文献和临床文本中提取知识的能力,加速了癌症研究中的假设生成。
加速癌症筛查、检测与诊断
AI通过显著提高速度、准确性和整体可靠性,在增强各种癌症筛查和检测方法方面发挥着日益重要的作用。
在结直肠癌(CRC)筛查中,结肠镜检查是金标准,但其效果受操作者经验影响。AI通过深度学习(DL)和机器学习(ML)技术,利用大量带注释的结肠镜图像训练深度神经网络(DNNs),实现了息肉的实时自动检测、分类和质量评估。例如,Zhou等人开发的CRCNet模型在三个独立数据集中显示出高性能。多项随机对照试验已证明这些计算机辅助检测(CADe)系统的临床效能。此外,AI驱动的计算机辅助诊断(CADx)系统能区分良恶性病变,自主AI诊断的准确性不劣于内镜医师诊断。
在乳腺癌(BC)领域,AI已彻底改变了通过乳腺X线摄影进行自动BC检测的能力。McKinney等人开发的AI系统在BC识别任务上超越了放射科医生。类似Mirai的系统能够直接从乳腺X线照片预测未来五年BC风险。除了X线摄影,AI在超声、磁共振成像(MRI)等影像以及液体活检(如循环细胞游离DNA(cfDNA)甲基化分析)中也显示出潜力。在病理学方面,深度学习模型能够对浸润性和非浸润性BC亚型进行分类,检测前哨淋巴结中的转移灶,并标准化评估Ki-67和人类表皮生长因子受体2(HER2)等生物标志物。
对于肺癌(LC),AI辅助解读胸部X光片是其最早期的应用之一。低剂量CT(LDCT)筛查是当前唯一被证明可降低LC死亡率的检查方法,多种AI软件设备已获美国食品药品监督管理局(FDA)批准,用于提高肺结节检测的工作流程效率和性能。AI模型还能预测肺结节的恶性风险,其准确性优于放射科医生的解读或现有风险预测模型。在血液液体活检方面,基于cfDNA片段化模式或深度甲基化测序的ML分类器有助于LC的早期检测和治疗效果评估。在组织学诊断中,AI模型能有效区分肺腺癌(LUAD)和肺鳞癌(LUSC),甚至能从H&E图像预测关键驱动基因的突变状态。
在前列腺癌(PCa)诊断中,多参数MRI(mpMRI)对于识别具有临床意义的前列腺癌(csPCa)至关重要。AI方法已被开发用于促进MRI图像分析,例如AutoProstate和可解释AI(XAI)模型。诸如前列腺成像-癌症AI(PI-CAI)挑战赛和前列腺癌分级评估(PANDA)框架等倡议为AI算法的评估和基准测试建立了透明、严格的框架。在病理学方面,深度学习系统(如Paige Prostate)已获批用于自动检测前列腺穿刺活检中的PCa,并在提高格里森分级的精确度方面得到广泛研究。
在脑癌领域,AI驱动工具有望协助神经放射科医生进行病变检测和鉴别诊断。例如,深度学习模型可以准确确定胶质瘤分级,显著改善脑转移瘤的检测和分割,并能从术前mpMRI预测较低级别胶质瘤(LGG)的1p/19q状态。在病理诊断中,基于H&E染色图像的卷积神经网络(CNNs)可用于提供胶质瘤的无偏诊断,而将快速纳米孔测序与机器学习相结合的方法(如Sturgeon)可改善中枢神经系统(CNS)肿瘤的术中诊断。
促进精准癌症治疗
AI算法正越来越多地被开发用于通过协助治疗选择、设计个性化治疗和指导治疗实施来直接增强治疗干预。
在结直肠癌(CRC)中,AI已进入手术领域,例如达芬奇手术系统有望提高手术精度。AI工具也被集成到临床工作流程中以优化放疗过程,例如磁共振引导放射治疗(MRgRT)。预后AI模型已广泛开发,利用组织病理学分析和多重成像方法等数据模态。研究还采用AI预测先前表征的预后和预测性生物标志物,例如微卫星不稳定性(MSI)。
对于乳腺癌(BC),AI通过预测乳房满意度、实现保乳手术中的实时切缘评估等方式,正在改变手术领域。在药物治疗方面,可解释的深度学习模型可预测对CDK4/6抑制剂(如帕博西利)的反应。基于组织学分析的AI驱动预测模型,例如通过联邦学习预测三阴性乳腺癌(TNBC)对新辅助化疗的组织学反应,或开发组织学预后签名(HiPS)来评估生存风险,都能增强临床决策。深度学习还能直接从常规组织学中确定分子生物标志物状态,例如雌激素受体(ER)、孕激素受体(PR)和HER2。
在肺癌(LC)治疗中,基于液体活检的AI应用取得了显著进展。机器学习框架可以模拟循环肿瘤DNA(ctDNA)的改变,以改善患者风险分层和在临床试验早期敏感地检测治疗差异。AI还能从NSCLC患者的病理数据中预测免疫治疗生物标志物,如PD-L1表达和肿瘤浸润淋巴细胞(TILs)。此外,AI在识别和分析基因组图谱以预测疾病预后、治疗反应和生存率方面发挥了革命性作用,例如开发全自动人工智能系统(FAIS)来检测表皮生长因子受体(EGFR)基因型,或利用机器学习进行免疫表型分析以识别术后复发风险较高的患者。
在前列腺癌(PCa)中,AI系统可以在机器人辅助根治性前列腺切除术(RARP)中增强情境感知能力。AI也已被广泛研究用于PCa的非手术治疗计划,例如机器学习可以生成可重复、高性能的放疗方案。为了选择最佳疗法,多模态深度学习模型(MMAI)利用临床数据和数字组织病理学图像预测长期PCa结果(如转移、生存),其性能优于美国国家综合癌症网络(NCCN)的标准风险分层。此外,AI还用于增强PCa的预后判断,例如检测神经周围浸润,或识别可能从短期雄激素剥夺疗法(ADT)中获益的中危患者。
在脑癌治疗中,AI方法被用于非侵入性分类O6-甲基鸟嘌呤-DNA甲基转移酶(MGMT)基因启动子甲基化状态(IDH1野生型胶质母细胞瘤(GBM)的预测因子),预测对伽玛刀放射外科治疗转移性脑瘤的反应,以及区分放疗后坏死与肿瘤进展。AI在增强预后能力方面也发挥着关键作用,例如整合不同的成像标志物来准确预测患者生存期和分类GBM分子亚型。
改善癌症监测
超越个体患者护理,AI在人群水平癌症监测中扮演着关键角色,能够实现更高效的数据收集、分析和风险预测,为公共卫生策略提供信息。例如,MOSSAIC项目采用先进的AI方法加速向美国国家癌症研究所(NCI)的监测、流行病学和最终结果(SEER)项目提交数据。AI算法能够自动从非结构化临床叙述中提取肿瘤特征。此外,用于电子健康记录(EHR)监测的大型语言模型(LLMs)正在帮助研究人员更深入地了解健康的社会决定因素。
革新癌症药物发现
AI正在改变癌症药物开发的上游过程,加速新靶点、治疗候选物和优化策略的识别。
在靶点识别和验证方面,AI驱动的蛋白质结构计算预测(如AlphaFold)可以显著推进基于结构的药物设计。越来越多的AI识别候选物正在走向成功验证,例如使用生成式AI设计的高效小分子抑制剂在肝癌细胞系中显示出选择性抗增殖活性。
在药物发现方面,AI有望显著压缩药物发现时间并降低成本。例如,生成式AI平台在短短21天内发现了一种有效的酪氨酸激酶抑制剂(TKI)。将AlphaFold预测的结构与生成式AI相结合,可以在目标选择后30天内识别出新型CDK20抑制剂。除了从头设计,AI支持的药物重定位已成为一种补充策略,通过利用现有药物的安全性特征,绕过早期开发成本。
在药物设计和优化方面,AI驱动的方法通过提高精确度、可解释性和治疗优化,正在改变癌症药物开发。例如,AI“指纹”技术可以通过观察癌细胞形态变化来准确显示其对新药的反应。预测模型集成可以揭示癌症突变对常见DNA复制应激诱导剂反应的影响。
改善癌症护理可及性
AI驱动的患者参与工具(如聊天机器人、虚拟助手)在支持癌症护理服务方面显示出潜力。聊天机器人可以模拟人类对话,增强用药依从性和自我管理。例如,聊天机器人的使用提高了BC患者的用药依从性,并开发了ChemoFreeBot等聊天机器人来教育BC患者。然而,局限性包括如果训练数据缺乏多样性可能加剧健康不平等,以及处理复杂患者查询方面的挑战。未来的整合应侧重于补充(而非替代)临床医生主导的护理。
增进对癌症生物学的基础认识
AI方法正日益用于加深我们对癌症发生、进展和耐药机制的理解。专家们正在利用LLMs开发创新的计算工具,以增强从研究出版物中提取知识的能力。例如,regulaGPT被设计用于从描述分子调控通路(MRPs)的句子中进行端到端的联合命名实体识别和关系提取。研究人员还利用AI模拟RAS蛋白(癌症中最常突变的蛋白之一)的原子动力学,以期揭示新的治疗机会。此外,还开发了AI驱动的软件平台(如TransposonUltimate)用于转座子相关事件的分类、检测和注释,以及集成多种DL算法的综合平台(如DeepBIO)用于增强高通量生物序列预测的功能注释、可视化分析和自动解释的准确性。
肿瘤学中AI的挑战与机遇
数据隐私
在医疗保健领域,对数据隐私和安全的担忧比几乎任何其他行业都更为紧迫。联邦学习(FL)允许进行多机构模型训练,而无需将原始数据暴露于机构边界之外,从而在支持协作分析的同时保留本地控制。合成数据增强技术通过模仿真实数据的统计特征而不泄露可识别信息,有助于平衡创新和数据保护。源自由域自适应(SFDA)旨在使在源域上训练良好的模型适应目标域,而无需访问源域数据或需要目标域标签,从而促进隐私保护和注释效率。区块链技术、同态加密和差分隐私(DP)等技术共同为保护医疗AI中的患者隐私创建了全面的框架。
监管框架与合规性
大多数AI应用都受到监管机构的监督。在美国,FDA根据“作为医疗设备的软件(SaMD)”框架对AI应用进行授权和监管。授权要求主要取决于设备的类别和预期用途。例如,通过De Novo途径授权的AI设备需要提交关键研究的临床证据,并包括上市后监测要求。在欧盟,AI系统受医疗器械法规(MDR)和体外诊断医疗器械法规(IVDR)的管辖,并且通常根据欧盟AI法案被归类为“高风险”,需要实施风险管理体系、数据治理控制等技术文档要求。
可靠性与可扩展性
AI模型的代码共享对于确保透明度和可重复性至关重要,从而增强其临床适用性。采用面临数据代表性、算法公平性和方法学异质性方面的重大挑战。
许多用于训练和评估AI模型的数据集存在根本性偏见,倾向于特定的种族和族裔群体。例如,TCGA中欧洲血统个体的中位比例为83%。GWAS目录中约95%的数据来自欧洲人群。商业医学影像数据集也常常缺乏种族、地理和社会经济地位的多样性。解决偏见的方法包括整合来自不同人口群体的数据、使用严格的测试和验证协议以及对模型性能进行持续监控。
实现算法公平性提出了一个独特的未来挑战。不公平的结果源于模型开发和部署过程中的复杂相互作用,表现为在受保护亚组(如种族、性别)之间模型性能的系统性差异。缓解策略包括预处理(重新加权样本)、处理中(将公平约束纳入学习目标)和处理后(设置亚组特定决策阈值)的方法。在临床AI中实施这些方法面临独特障碍,例如数据集偏移下性能和公平性可能下降,以及由于严格规定常常无法获得受保护属性。
AI肿瘤学研究中的异质性妨碍了对报告结果的解释和比较,并限制了对临床效用的评估。主要变异来源包括数据集大小、金标准标签和外部验证队列的差异。解决这些挑战需要朝着标准化共同努力,包括确定不同任务的最小数据集大小建议,建立清晰一致的金标准诊断和结果定义,以及作为临床效用声明的先决条件,强制要求使用来自不同环境的前瞻性收集队列进行严格的独立外部验证。
社会影响
AI仍然是人类的创造物,由可能怀有恶意或本身存在缺陷的个体打造。因此,可能出现偏见和公平性问题。另一个关键考虑因素是当人为监督最小化或取消时的人际责任问题。例如,如果AI系统出错,谁应承担法律责任(如医疗事故诉讼)以及这是否会影响保险范围和责任范围,这些都是长期未决的问题。
临床整合与验证
临床验证是决定AI系统是否能在开发数据集的技术性能之外有意义地改善癌症护理的关键步骤。与侧重于留存数据或交叉验证数据内准确性指标的技术验证不同,临床验证评估在真实患者和工作流程中的普适性、校准、安全性和影响。需要进行跨机构、地域、设备和时间的稳健外部验证,以评估对数据集偏移的弹性,并量化模型在与训练数据不同的人群中是否保持区分度和校准。适当的终点应从诊断准确性扩展到决策影响、下游护理过程、患者中心结局和危害。对于学习或定期更新的工具,自适应或平台试验结构以及学习型医疗系统方法有助于使评估与模型变更保持一致。公平性考虑需要计划按人口统计学、肿瘤亚型、地点、扫描仪或设备以及社会经济背景进行亚组分析,并结合偏见缓解和异质性效应报告。监管途径强调预期用途、获益-风险评估、良好机器学习实践(GMLP)、自适应算法的变更控制以及上市后监测。部署后,需要持续监测性能漂移、必要时重新校准、事件报告和人在回路的保障措施,以维持安全性和有效性。
在肿瘤学领域,当前许多文献仍然是回顾性和单中心的,前瞻性影响评估较少,随机研究数量有限。在进行严格前瞻性验证的情况下,结果有时证实了效用,有时则显示性能下降,强调了谨慎和针对具体情境进行评估的必要性。最终,只有在设计良好的研究中证明其可靠、公平的临床获益,并在真实世界实践中得到持续治理和监测的支持,AI系统才应考虑用于常规使用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号