基于位置信息的可扩展临床注释系统(SCALE)
《Computers in Biology and Medicine》:Scalable Clinical Annotation with Location Evidence (SCALE)
【字体:
大
中
小
】
时间:2025年11月22日
来源:Computers in Biology and Medicine 6.3
编辑推荐:
前列腺癌MRI检测中全自动位置引导标注方法研究。通过结合大语言模型提取的病灶位置信息、活检坐标及解剖分区,构建了SCALE全自动体素级标注系统。在跨24家医院、15662名患者的17,896例数据集中验证,所训练模型在测试集上达到0.856的案例级AUROC,较传统监督学习提升+0.012(p<0.02),较弱监督方法提升+0.007。研究证实位置引导的自动标注能有效扩展标注数据集,提升前列腺癌AI检测性能。
在当今医疗影像领域,人工智能(AI)的应用正迅速发展,尤其是在癌症筛查和诊断方面。随着全球范围内放射科医生数量的不足,AI技术展现出巨大的潜力,能够提升诊断效率并减轻临床工作负担。然而,AI模型的训练依赖于大量高质量的标注数据,这对数据的获取和处理提出了更高的要求。本文提出了一种名为SCALE(Scalable Clinical Annotation with Location Evidence)的全新方法,旨在通过自动化的、基于位置信息的标注,实现大规模医学影像数据集的构建,从而推动AI在临床显著前列腺癌(csPCa)检测中的应用。
SCALE方法的核心在于利用位置先验信息来生成体素级别的标注。这些位置先验信息可以从医学报告、跟踪活检坐标或手动指定的解剖区域中提取。通过这种方式,不仅能够显著减少人工标注的工作量,还能确保标注的准确性与一致性。此外,本文还提到,传统的弱监督学习方法通常依赖于较粗略的案例级别标注,而SCALE则通过引入更具体的位置信息,提高了AI在图像分析中的表现。
研究团队在多个国际医疗中心收集了大量数据,涵盖了来自24家医院、10个国家、2个大洲的17,896个病例,涉及16,562名患者。这些数据包括前列腺的轴向双参数磁共振成像(MRI)扫描,具体为T2加权成像、高b值扩散加权成像(DWI,b值≥1000 s/mm2)以及表观扩散系数(ADC)图。通过这些数据,研究者能够全面评估SCALE方法在不同医疗环境下的适用性与有效性。
在开发过程中,团队手动标注了1166个恶性病例,而通过自动解析放射学和病理学报告,他们将1184个病例归类为良性,从而构建了一个包含11,901个良性病例的训练数据集。剩余的4829个未标注的恶性病例则用于训练AI模型,以生成体素级别的标注。这种数据构建方式不仅提高了标注的效率,还确保了数据的多样性和代表性,为模型的泛化能力提供了坚实的基础。
在模型评估阶段,研究团队使用了来自19家医院、3个国家、1个大陆的1561个独立测试病例。结果显示,使用SCALE标注训练的模型在案例级别的接收者操作特征曲线下面积(AUROC)达到了0.856,这一成绩优于传统的监督学习方法(+0.012,p=0.02),也优于基于弱监督学习的方法(+0.007,p=0.12),并且在性能上超过了PI-CAI(Prostate Imaging: Cancer AI)挑战中的 Ensemble AI 系统(+0.006)。这些结果表明,SCALE方法在提高AI模型诊断性能方面具有显著优势。
此外,研究团队还探讨了位置信息在AI标注中的重要性。他们指出,在癌症检测等应用中,定位信息对于准确识别病变区域至关重要。然而,传统的标注方法往往依赖于人工提取这些信息,这不仅耗时费力,还需要专业的医学知识。为此,研究者开发了一种基于大型语言模型(LLMs)的流程,能够直接从临床报告中提取病变的位置信息,并将其整合到新的AI标注框架中。这种方法不仅提高了标注的自动化程度,还减少了人为误差的可能性。
值得注意的是,该研究还强调了位置信息在病理学确认病变中的作用。由于放射学上的可疑病变并不总是意味着存在临床显著的前列腺癌,因此需要结合病理学检查来确认癌症的性质和严重程度。研究团队发现,通过将病理学确认的病变位置信息作为先验,AI模型能够更准确地识别出具有临床意义的病灶,从而提高诊断的可靠性。
在讨论部分,研究者进一步分析了SCALE方法的优势及其在临床实践中的潜在影响。他们指出,该方法不仅能够在大规模数据集中实现高效的标注,还能确保标注的一致性和准确性。这种基于位置信息的自动标注方法,为AI在医学影像分析中的应用提供了新的思路,特别是在处理复杂、多中心的数据时具有显著的优势。
结论部分强调,SCALE方法的引入使得大规模、全自动、基于位置的标注成为可能,这不仅提升了AI模型的诊断性能,还为AI在医学影像领域的广泛应用奠定了基础。通过使用SCALE生成的标注训练优化后的轻量级PI-CAI算法,研究团队在独立的多中心测试队列中取得了令人瞩目的成果。这些成果不仅证明了自动标注在医学影像分析中的可行性,也为未来的临床部署提供了有力支持。
在作者贡献声明中,团队成员详细列出了各自在研究中的角色和贡献。Joeran S. Bosma作为主要作者,负责撰写、编辑、可视化、验证、软件开发、资源管理、方法论设计、调查研究、形式分析、数据整理以及概念化工作。其他成员如Luc Builtjes、Anindo Saha、Jasper J. Twilt、Manolis Tsiknakis、Kostas Marias、Daniele Regge、Nickolas Papanikolaou、Ivo G. Schoots、Jeroen Veltman、Mattijs Elschot、Derya Yakar、Nancy A. Obuchowski、Mattias P. Heinrich、Alessa Hering和Maarten de Rooij也都参与了不同的研究环节,包括撰写、方法论设计、数据整理等。这种分工明确、协作紧密的团队结构,为研究的顺利进行提供了保障。
研究团队还特别提到,在撰写过程中,他们使用了ChatGPT(4o, o3, 4.5, 5 Instant, 5 Thinking和5 Pro)和Claude Code等生成式AI工具来优化语言表达。尽管这些工具在写作过程中发挥了重要作用,但作者们强调,最终的内容经过了严格的审查和编辑,所有观点和结论均由他们本人负责。
在竞争利益声明中,研究者披露了部分成员与医疗设备或药品公司的潜在关系。例如,Anindo Saha与Guerbet BV有合作关系,涉及演讲和讲座费用;Derya Yakar则与Astellas和Bayer公司有联系,包括咨询和演讲活动。这些声明有助于读者全面了解研究的背景和潜在利益冲突,从而对研究结果的客观性产生更深入的理解。
最后,研究团队对支持该项目的研究资助机构表示了感谢。这些机构包括Health Holland(LSHM20103)、欧洲联盟的HORIZON-2020项目(ProCAncer-I,编号952159;PANCAIM,编号101016851)以及PPP Allowance(由Health Holland和Top Sector Life Sciences & Health共同资助)。这些资助不仅支持了数据的收集和处理,还促进了跨学科的合作,为研究的顺利开展提供了重要保障。
综上所述,本文通过提出SCALE方法,为AI在医学影像分析中的应用提供了一种新的解决方案。该方法利用自动化的、基于位置的标注技术,有效解决了传统标注方法在效率和准确性方面的不足。研究结果表明,SCALE方法能够显著提升AI模型在前列腺癌检测中的诊断性能,为未来大规模临床应用铺平了道路。此外,该研究还展示了跨机构合作和先进AI工具在医学研究中的价值,为后续研究提供了重要的参考和启示。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号