
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于神经网络的胶质母细胞瘤勾画方法临床评估:提升放疗精度的AI解决方案
【字体: 大 中 小 】 时间:2025年08月10日 来源:Taiwanese Journal of Obstetrics and Gynecology 2.0
编辑推荐:
本研究针对放疗中胶质母细胞瘤(GTV)精准勾画的临床需求,评估了Cercare Medical Inc(CMN)和Raidionics两种神经网络模型在70例真实临床病例中的表现。通过Hausdorff 95%(HD95)距离、Dice相似系数(DSC)等指标分析发现,CMN模型(HD95=4.24mm,DSC=0.83)显著优于Raidionics模型(HD95=5.61mm,DSC=0.80),但均低于临床专家水平(HD95=2.91mm,DSC=0.89)。研究证实AI模型可减少假阳性体积(<10%),为临床辅助勾画提供可靠工具。
在神经肿瘤放疗领域,精确勾画肿瘤靶区始终是临床面临的重大挑战。胶质母细胞瘤(GBM)作为最具侵袭性的脑肿瘤,其治疗成败往往取决于放疗靶区定义的准确性。传统人工勾画不仅耗时费力,更因医师主观差异导致高达20-30%的靶区变异。随着人工智能技术发展,神经网络辅助勾画工具应运而生,但其在真实临床环境中的表现究竟如何?这正是丹麦奥胡斯大学医院(Department of Oncology, Aarhus University Hospital, Aarhus, Denmark)的研究团队Anders Traberg Hansen等人试图解答的问题。
研究团队设计了一项严谨的临床对照试验,选取2020-2024年间70例新诊断的增强性胶质母细胞瘤患者(含活检、部分切除和全切除病例),采用1.5T/3.0T Philips Ingenia磁共振获取T1加权、T1加权钆增强和T2-Flair序列图像。通过比较CMN模型(基于EfficientNet-B4改进的U-Net架构)与Raidionics模型(AGU-Net架构)的自动勾画结果与专家手动金标准,首次在真实临床场景中系统评估了AI模型的性能边界。
关键技术方法包括:采用3D Slicer软件进行体积分析,通过Hausdorff 95%(HD95)距离和Dice相似系数(DSC)量化空间一致性;计算假阳性/假阴性体积百分比;选取12例患者评估临床医师间变异(interobserver variability);对10例差异显著病例进行剂量学验证,分析靶区变化对95%等剂量线覆盖体积(V95)的影响。
研究结果揭示:
Hausdorff 95%和Dice相似系数
CMN模型整体表现最优,平均HD95为4.24mm[2.05,10.2],显著优于Raidionics的5.61mm[2.13,14.8](p<0.00002)。在活检亚组中,CMN的DSC达0.86[0.70,0.94],明显高于Raidionics的0.81[0.66,0.93]。但两种模型均不及临床专家水平(平均HD95=2.91mm,DSC=0.89)。
假阳性和假阴性
CMN模型的平均假阴性体积(17.4%)显著低于Raidionics(22.6%)(p<0.0007),尤其在活检病例中差异更显著(15.7% vs 25.0%)。两种模型的假阳性体积均控制在10%以下,显示AI在避免过度治疗方面的优势。
剂量学分析
当采用AI勾画靶区时,原始PTV的V95平均变化为12.7%(CMN)和18.2%(Raidionics)。极端病例出现44.1%的覆盖损失,提示AI勾画仍需临床审核。
讨论部分深入剖析了模型局限性:对于大型术后空腔(图4所示DSC低至0.38)和多灶性肿瘤,两种模型均出现显著偏差。值得注意的是,CMN模型因输出坏死区、增强灶和水肿三个独立分割结果,其GTV可能呈现不符合临床习惯的凹陷形态。研究建议未来开发应纳入更多复杂病例训练数据,并考虑整合医师的勾画偏好模式。
这项发表于《Taiwanese Journal of Obstetrics and Gynecology》的研究具有重要临床意义:首次在非筛选的真实世界队列中验证了AI勾画工具的可靠性边界,建立了4-6mm HD95误差对应约10%剂量波动的量化关系。虽然当前AI尚不能完全替代专家判断(尤其对术后复杂病例),但其稳定的低假阳性特性(<10%)和可解释的性能指标,为临床实施"AI初筛+人工复核"的混合工作流程提供了循证依据。该研究也为后续模型优化指明了方向——需要重点提升对术后空腔和多灶病变的识别能力,这将是实现AI辅助勾画全面临床应用的关键突破点。
生物通微信公众号
知名企业招聘