编辑推荐:
本文通过系统评价和荟萃分析,研究 PI-RADS 2.1 升级规则对前列腺移行带(TZ)病变中前列腺癌(PCa)检出率的影响。发现 “2 + 1” 和 “3 + 1” 病变的癌症风险符合评分系统,但假阳性率高,对活检决策意义重大。
研究背景
磁共振成像(MRI)在前列腺癌(PCa)的检测和风险分层中应用广泛,前列腺影像报告和数据系统 2.1 版(PI-RADS v2.1)是评估前列腺 MRI 可疑发现的风险分层工具,尤其用于估计临床有意义的前列腺癌(csPCa - GG≥2)的可能性 。PI-RADS v2.1 对移行带(TZ)病变评估引入了重要变化,如 “非典型结节” 概念及升级规则,旨在提高 TZ 病变特征描述的准确性和一致性,但这些规则对活检决策的影响尚待明确。本研究旨在评估 PI-RADS v2.1 升级规则的临床意义,聚焦基于 DWI 的升级在 MRI 引导的 TZ 病变诊断路径中的益处。
材料和方法
- 文献检索:在 MEDLINE、EMBASE 和 Web of Science 数据库中进行系统检索,检索问题基于 “PICO” 原则,即患者(P:TZ 区疑似 / 确诊 PCa 患者)、干预措施(I:PI-RADS V2.1 评分结合 TZ 区 DWI 升级(“2 + 1” 和 “3 + 1”))、比较(C:未进行 DWI 升级的 TZ 结节 PI-RADS 评分)、结局(O:基于前列腺活检或根治性前列腺切除术组织病理学结果诊断高 / 低风险肿瘤)。检索词见补充文本 1,检索限于英文文献和人体研究,还通过评估纳入文章及相关综述的参考文献列表获取更多文献,最后将所有引文导入文献数据库(EndNote X)。
- 研究选择:检索后,根据标题和摘要筛选,符合原始研究(非综述或病例报告)、全面评估 TZ 病变且采用 DWI 升级诊断 PCa、未进行过前期治疗等标准的研究进入全文评估。用于荟萃分析的研究需报告经组织学证实的 PCa、PI-RADS v2.1 评分,并提供足够数据计算各评分的癌症检出率,若关键数据缺失则联系研究作者。
- 数据提取:由两名研究者(A.G., K.M.)独立提取计算所需信息,包括患者总数、病变数、各 PI-RADS 类别中 GG≥1、GG≥2、GG = 1 和良性病变的数量,重点关注升级的 3 类(2 + 1)和 4 类(3 + 1)。由于研究中缺乏患者层面的数据,所有分析均在病变层面进行。同时记录每项研究的患者和方法特征。
- 方法学质量评估和发表偏倚:使用修订的诊断准确性研究质量评估工具(QUADAS-2)评估纳入研究的方法学质量、潜在偏倚和适用性。通过 Deeks 漏斗图不对称检验评估发表偏倚。
- 统计分析:采用随机截距逻辑回归模型进行单比例荟萃分析得出癌症检出率的汇总估计值,用随机效应模型计算研究间的合并优势比(OR)。用双变量二项式模型得出敏感性和特异性的汇总估计值,绘制 SROC 曲线。用 Deek 诊断比值比检验和漏斗图分析发表偏倚,用卡方值检验的 Q 统计量和不一致性指数(I2)评估研究间的异质性,通过元回归分析探索异质性的影响因素。使用 R 软件(版本 4.3.0)及 meta 和 mada 包、RevMan 5.4 进行所有分析。
研究结果
- 研究选择:根据 PRISMA 流程图,最终纳入 8 项研究,这些研究发表于 2020 - 2024 年,其中 2 项为前瞻性设计,6 项为回顾性数据收集。
- 纳入研究概述:8 项研究共包含 1535 个 TZ 病变,部分研究采用活检结果,部分采用根治性前列腺切除术结果作为参考标准,研究在 MRI 供应商和阅片者经验方面存在差异。
- 质量评估:QUADAS-2 评估显示,患者选择、参考标准和指标测试在多数研究中总体偏倚风险较低,但超过一半的研究在流程和时间方面不明确,所有研究在适用性方面均无问题。
- 发表偏倚:Deeks 漏斗图不对称检验结果(p=0.08)表明无发表偏倚。
- 癌症检出率:603 个病变(39%)为 PCa 阳性,386 个(25%)为 GG≥2 阳性。不同 PI-RADS 评分的 GG≥2 癌症检出率分别为:PI-RADS 1 为 2%;PI-RADS 2 为 6%;PI-RADS 2 + 1 为 13%;PI-RADS 3 为 19%;PI-RADS 3 + 1 为 37%;PI-RADS 4 为 49%;PI-RADS 5 为 73%。
- 优势比:PI-RADS 2 + 1 的 GG≥2 癌症优势比显著高于 PI-RADS 2;PI-RADS 2 + 1 与 PI-RADS 3 的优势比无显著差异;PI-RADS 3 + 1 的优势比显著高于 PI-RADS 3;PI-RADS 3 + 1 与 PI-RADS 4 的优势比无显著差异。
- 诊断准确性:以 PI-RADS≥2 + 1 为阈值检测 GG≥2 疾病,敏感性为 94%,特异性为 31%,SROC 曲线下面积为 0.86;以 PI-RADS≥3 为阈值(排除 2 + 1),检测 csPCa 的敏感性为 88%,特异性为 46%,AUC 为 0.69。两种阈值下检测 GG≥2 疾病的假阳性率均较高。
- 元回归分析:限于数据可用性,元回归分析仅针对年龄(临界值 65 岁)和 PSA 密度(阈值 0.15),结果显示二者对研究间异质性无显著影响。
讨论
- 升级规则的价值:本研究表明,基于 DWI 的升级规则可提高癌症检出率。PI-RADS 2 + 1 的 GG≥2 癌症检出率较 PI-RADS 2 显著提高,PI-RADS 3 + 1 的 GG≥2 癌症检出率较 PI-RADS 3 显著提高,验证了 DWI 升级规则在提高癌症检测方面的有效性。
- 研究结果的差异:不同研究中,“2 + 1” 病变的结果存在差异。部分研究显示 DWI 升级显著提高了 csPCa 的检测率,但也有研究发现 “2 + 1” 病变与传统 3 类结节的检测率无显著差异,甚至有研究指出 “2 + 1” 结节比未升级的 “3” 类病变更不易含有 csPCa,这凸显了 DWI 升级诊断效用的变异性。
- 与其他研究的比较:与以往研究相比,本荟萃分析纳入了更多的病变数量,且首次对 PI-RADS 3 + 1 类别进行了定量分析,验证了 PI-RADS 各类别与 2 + 1 和 3 + 1 类别的差异。
- 诊断挑战与应对策略:当前诊断方法特异性较低(31% - 47%),易导致过度诊断和不必要的活检。未来研究可优化成像标准、纳入更多风险因素、探索定量成像生物标志物或机器学习算法,以提高特异性的同时不降低敏感性。
- 对活检决策的影响:PI-RADS 3 + 1 病变的癌症检出率与 PI-RADS 4 病变相似,应与 PI-RADS 4 病变同等对待,考虑进行活检;PI-RADS 2 + 1 病变虽 GG≥2 癌症检出率高于 PI-RADS 2,但 GG1 癌症检出数量也较多,需避免过度治疗。不同类别病变对活检决策的影响不同,应制定个性化活检策略。
- 研究局限性:本研究存在一定局限性,如纳入研究数量较少、研究间存在异质性、数据有限、基于病变层面的分析存在局限性、无法分析 GG≥3 病变等,未来需进一步研究不同活检决策阈值,尤其是 GG3 + 相关研究。
研究结论
“2 + 1” 和 “3 + 1” 病变中存在显著癌症的风险符合 PI-RADS 评分系统,虽提高了整体敏感性,但假阳性率增加。这些发现对 TZ 病变患者的活检决策具有重要意义,强调了个性化活检决策对减少过度诊断和过度治疗的必要性。