基于定量MRI生物标志物与分子亚型构建列线图模型:实现乳腺癌新辅助治疗后病理完全缓解的个体化预测
【字体:
大
中
小
】
时间:2025年09月26日
来源:Frontiers in Oncology 3.3
编辑推荐:
本刊推荐:本研究通过整合乳腺癌新辅助治疗(NAT)前后的MRI定量特征与分子亚型(ER/HER2/DCIS状态),构建了预测病理完全缓解(pCR)的列线图模型(AUC=0.894)。该模型为个体化手术策略规划提供了影像学决策支持工具,显著提升了pCR预测精度。
根据2022年全球癌症统计数据,乳腺癌已成为全球女性最常见的恶性肿瘤和癌症相关死亡的首要原因。新辅助治疗(NAT)作为术前系统性药物治疗手段,不仅适用于初始不可手术的局部晚期患者,也越来越多地应用于早期患者。NAT能显著增强肿瘤可切除性和保乳手术可能性,其反应模式还可指导术后治疗方案的个性化调整。研究表明,达到病理完全缓解(pCR)的患者长期预后显著改善,部分患者甚至可接受降阶梯治疗。然而,部分患者对NAT反应不佳或出现疾病进展,需及时调整治疗策略。因此,早期精准评估NAT疗效对实施个体化精准肿瘤治疗至关重要。
虽然pCR是评估治疗后肿瘤反应的金标准,但其判定存在固有延迟性——需待NAT完成并实施手术切除后方可确认。目前评估NAT疗效的方法包括体格检查、乳腺超声(US)、 mammography(MMG)、乳腺磁共振成像(MRI)和正电子发射断层扫描-计算机断层扫描(PET-CT)等,但均未达到理想精度水平。其中,乳腺MRI特别是动态对比增强MRI(DCE-MRI)和扩散加权MRI(DWI-MRI)展现出较大评估潜力。DCE-MRI可反映肿瘤血液灌注和血管通透性变化,DWI-MRI则提供肿瘤细胞结构和膜完整性信息,使MRI诊断具有高敏感性和特异性。尽管文献报道乳腺MRI评估新辅助治疗反应的总体准确率为76–90%,但持续存在的诊断不准确性仍是临床挑战。
既往研究虽已探讨影响乳腺MRI评估NAT疗效准确性的因素,但受限于样本量小和因素纳入不全面,结论有限。本研究旨在对影响NAT反应的决定因素进行全面多因素分析,并开发一个整合乳腺MRI特征与临床病理指标的验证预测模型。可视化列线图有望为临床医生提供早期疗效评估和循证治疗决策优化的精准医学工具。
研究共纳入2019年1月至2022年12月期间在天津医科大学肿瘤医院接受治疗的554例女性乳腺癌患者。所有患者均经空心针活检组织学证实为浸润性乳腺癌,接受指南一致的新辅助治疗后进行根治性手术,并在NAT前后接受乳腺MRI检查。排除标准包括:临床病理或影像数据不完整;未完成NAT及后续手术治疗;双侧乳腺癌;隐匿性乳腺癌或副乳腺癌;NAT前原发性部分或完全切除;诊断时存在远处转移或复发;合并其他原发性恶性肿瘤。
临床特征收集包括诊断年龄、绝经状态、淋巴结转移情况、肿瘤临床分期(按AJCC第8版TNM分期手册严格判定)、NAT方案与周期数以及乳房手术类型(乳房切除术或保乳手术)。所有患者术前均接受标准NAT方案:HER2阳性患者接受曲妥珠单抗单药或联合帕妥珠单抗的双靶治疗;HR阳性或三阴性乳腺癌(TNBC)患者多数接受以蒽环类药物为基础联合或序贯紫杉类药物的化疗方案。
病理学分析采用治疗前空心针活检标本和根治性手术切除标本,评估参数包括:组织学类型、DCIS存在与否、组织学分级、分子亚型、雌激素受体(ER)、孕激素受体(PR)、HER2、Ki-67及肿瘤浸润淋巴细胞(TILs)表达。ER/PR阳性定义为核染色肿瘤细胞≥1%;HER2阳性定义为IHC(3+)或IHC(2+)伴FISH(+);分子亚型根据ER、PR、HER2表达分为四类:HR+/HER2-、HR+/HER2+、HR-/HER2+和HR-/HER2-(TNBC);Ki-67高表达定义为≥20%;间质TIL密度按国际工作组建议分为低(<10%)中高(≥10%);pCR定义为原发灶无浸润癌(允许存在DCIS)且区域淋巴结阴性(ypT0/is ypN0)。
MRI采集与评估包括NAT前MRI的纤维腺体组织量(FGT)、背景实质强化(BPE)水平、病灶形态特征、时间-信号强度曲线(TIC)类型、T2加权成像(T2WI)信号强度、相关特征、瘤周水肿、皮下水肿及淋巴结状态。形态特征包括肿瘤大小(最大直径)、肿瘤分布(单灶、多灶或多中心)、病灶类型(肿块、非肿块强化[NME]、肿块伴NME)、NME分布、肿块内部强化及形状边缘。NAT后MRI评估包括:影像学完全缓解(rCR)、肿瘤大小和TIC类型。rCR严格按RECIST 1.1标准定义:早期和晚期强化完全缺失,且所有病理性淋巴结短轴直径<10 mm。为最大限度避免假阴性,本研究采用比既往报道更严格的rCR阈值,导致观察到的rCR率低于常规标准。通过比较NAT前后MRI数据,得出变异指标包括肿瘤大小变化(Δ肿瘤大小)和TIC类型变化(ΔTIC)。最后回顾性收集空心针活检与NAT前MRI检查间隔时间(活检至MRI天数)及NAT后末次MRI与手术间隔时间(MRI至手术天数)。NAT前后乳腺MRI由两位五年以上乳腺影像诊断经验的放射科医师独立解读,且对病理结果设盲,分歧病例通过重新阅片讨论达成共识。
统计分析中,为评估MRI对pCR的诊断性能,将rCR归类为“阴性”,非rCR为“阳性”,计算敏感性、特异性、准确性、阳性预测值(PPV)和阴性预测值(NPV)及95%置信区间(CI)。定义:真阴性(TN)为MRI提示rCR且病理证实pCR;真阳性(TP)为MRI提示非rCR且病理显示非pCR;假阴性(FN)为MRI提示rCR但病理显示非pCR;假阳性(FP)为MRI提示非rCR但病理显示pCR。FP或FN病例归入影像-病理不一致组,TP或TN归入一致组。
连续变量经Shapiro-Wilk(SW)正态性检验,正态分布数据以均数±标准差(x ± s)表示,采用独立样本t检验或方差分析(ANOVA)进行组间比较;非正态分布数据以中位数和四分位间距[M(Q1, Q3)]表示,采用Wilcoxon秩和(Mann-Whitney U)检验。分类数据以率或比例(%)表示,采用Pearson卡方检验或Fisher精确检验进行组间比较。根据组间比较结果初步确定潜在影响因素,进一步通过单因素和多因素Logistic回归分析确定影响MRI评估NAT疗效准确性的独立因素。单因素Logistic回归分析中p<0.05的变量纳入多因素分析。
患者按7:3比例随机分配至训练队列(388例,70%)和验证队列(166例),比较基线特征以确保队列平衡。在训练集中,采用多变量Logistic回归以手术病理为金标准识别pCR的独立预测因子,并进行Bootstrap重采样(1000次迭代)评估预测因子稳定性。置信区间排除零且符号一致性>90%的变量视为稳定。开发并验证预测NAT反应的列线图模型,采用受试者工作特征曲线下面积(AUC)评估区分能力,校准曲线评估校准度,Brier评分评估拟合优度,决策曲线分析评估临床效用。
采用Cohen’s Kappa系数评估两位放射科医师解读的一致性:0.00–0.20为差;0.21–0.40为一般;0.41–0.60为中等;0.61–0.80为高度;0.81–1.00为几乎完全一致。所有检验p<0.05视为有统计学意义。统计分析使用SPSS 25.0和R软件4.4.3进行。
临床与病理特征显示,共纳入554例患者,诊断中位年龄48岁(四分位距:40–57岁)。初始临床分期主要为I/II期(354例,63.9%)。分子亚型分布:HR+/HER2- 44.9%(249例),HR-/HER2+ 19.9%(110例),HR+/HER2+ 19.1%(106例),TNBC 16.1%(89例)。所有患者接受4–8周期NAT。末次MRI检查与手术间隔中位时间9天(IQR 3–13天)。86.8%(481例)接受乳房切除术,13.2%(73例)接受保乳手术。
诊断准确性评估显示,NAT后手术标本病理结果显示136例(24.5%)达到pCR;418例(75.5%)非pCR患者中石蜡病理残留肿瘤中位大小1.6 cm(四分位距:0.0-2.5 cm),15例乳房无浸润癌残留但存在腋窝淋巴结转移。NAT后MRI评估显示仅15例(2.7%)达到rCR;539例非rCR患者中,301例(55.8%)表现为肿块强化,146例(27.1%)为NME,92例(17.1%)为肿块与NME共存。乳腺MRI评估NAT疗效的总体准确性为77.44%。429例(77.4%)评估准确病例中,pCR且rCR占3.0%(13例),非pCR且非rCR占97.0%(416例);125例(22.6%)评估不准确病例中,非pCR但rCR占1.6%(2例),pCR但非rCR占98.4%(123例)。MRI诊断pCR的性能如下:敏感性99.5%(95% CI 98.2–99.9%),特异性9.6%(95% CI 5.6–15.6%),PPV 77.2%(95% CI 73.5–80.5%),NPV 86.7%(95% CI 61.1–96.0%)。
MRI评估NAT疗效准确性的影响因素分析显示,临床病理特征分析中影像-病理一致组与不一致组在新辅助方案、新辅助治疗周期数、组织学分级、ER、PR、HER2、Ki-67(p=0.003)和TILs(p=0.043)表达以及DCIS存在与否(p<0.001)方面存在显著差异。MRI特征分析中,两组在BPE(p=0.005)和病灶类型(p=0.013)方面差异显著,其余指标无统计学意义(p>0.05)。
单因素Logistic回归分析显示,新辅助方案、新辅助治疗周期数、组织学分级、ER、PR、HER2、Ki-67和TILs表达、DCIS存在与否、BPE及病灶类型均与MRI评估NAT疗效准确性显著相关(p<0.05)。多因素Logistic回归分析进一步揭示,ER阴性(OR=0.300,95% CI:0.152-0.592,p=0.001)、无DCIS(OR=0.522,95% CI:0.301-0.905,p=0.021)以及肿块与NME共存(OR=0.469,95% CI:0.226-0.974,p=0.042)是MRI评估NAT疗效不准确的独立影响因素。
训练队列与验证队列基线特征比较显示,训练队列388例,验证队列166例,基线特征比较表明,训练队列与验证队列在NAT前乳腺MRI的T2WI信号强度(p=0.036,φ=0.089)、TIC类型(p=0.003,φ=0.128)和瘤周水肿(p=0.005,φ=0.119)方面存在显著差异,其余特征无统计学意义(p>0.05)。经Bonferroni法校正(α=0.05/33≈0.0015)后这些差异不再显著,所有标准化效应量均低于0.3,表明临床差异可忽略,队列间基线特征具有满意可比性。
新辅助治疗疗效影响因素分析中,单因素回归分析识别出多个与pCR相关的因素(p<0.05),包括淋巴结状态、组织学分级、ER、PR、HER2、Ki-67和TILs表达、DCIS存在与否、BPE、病灶类型、瘤周水肿(NAT前乳腺MRI)、rCR、肿瘤大小、TIC(NAT后乳腺MRI)以及Δ肿瘤大小和ΔTIC。
多因素Logistic回归分析显示,ER阴性状态(OR=0.249,95% CI:0.119–0.520;p<0.001)、HER2阳性状态(OR=6.041,95% CI:3.388–10.771;p<0.001)、无DCIS(OR=0.495,95% CI:0.273–0.899;p=0.021)、rCR(OR=19.888,95% CI:2.985–132.498;p=0.002)、较小肿瘤大小(OR=0.780,95% CI:0.662–0.920;p=0.003)和持续/平台型TIC(OR=0.033,95% CI:0.005–0.240;p=0.001)与较高pCR率相关。NAT前MRI上,肿块(OR=0.45)和NME(OR=0.415)与混合病灶相比pCR率较低。
通过训练集1000次Bootstrap重采样评估变量稳定性,结果显示病灶类型变量的95%置信区间包含零且符号一致性低(肿块型:50.2%;NME型:89.6%),故从最终模型中排除。最终多变量模型纳入六个稳健预测变量。Bootstrap重采样内部验证确认所有纳入变量稳定性极佳,95%置信区间均排除零且各预测因子符号一致性超过99%。
列线图开发与验证基于开发队列的单因素和多因素Logistic回归分析,进一步构建预测pCR的列线图模型。该列线图在训练队列(AUC=0.894,95% CI:0.857–0.932)和验证队列(AUC=0.888,95% CI:0.841–0.935)均表现出良好区分能力。模型校准可接受:训练队列校准曲线与理想校准线拟合良好,验证队列校准曲线基本聚集于理想校准线附近。训练队列和验证队列的Brier评分分别为0.102和0.131。临床决策曲线显示,在多数阈值下该模型的净收益优于全pCR/全非pCR诊断策略,具有临床应用价值。
本研究数据显示乳腺MRI评估NAT反应的总体准确性为77.44%,与既往研究一致。探究导致影像-病理不一致的因素有助于优化特定临床病理或影像特征患者的MRI结果临床解读,为提升MRI性能提供基础。
当前关于伴发DCIS对MRI准确性影响的研究多基于术后石蜡病理,提示伴DCIS患者MRI评估准确性降低——这一发现受pCR定义影响。相比之下,本研究聚焦NAT反应的早期评估,解决传统病理评估的固有时间滞后问题。值得注意的是,我们观察到空心针活检无DCIS的患者MRI不准确性更高,这一发现与传统认知不符。我们推测该差异可能源于空心针活检的取样局限性,多灶或微观DCIS病灶可能未被检测到。在空心针活检诊断为“无伴发DCIS”的病例中,可能存在活检过程中未取样的弥漫分布DCIS成分。此类隐匿性DCIS对NAT反应较差,治疗后更可能持续存在。其MRI上的持续强化可能被误判为残留浸润癌,从而降低该亚组MRI评估的特异性和总体准确性。相比之下,活检确诊“伴发DCIS”的病例分类更可靠。因此临床实践中应警惕活检DCIS阴性患者NAT后因残留DCIS导致MRI假阳性结果的风险。这些结论仍需大规模前瞻性研究进一步验证。
本研究发现乳腺MRI的诊断效能因乳腺癌分子亚型而异:HR+/HER2-型(96.79%)、HR-/HER2-型(74.16%)、HR+/HER2+型(67.92%)和HR-/HER2+型(41.82%),与文献趋势一致(Luminal A型94.5%,Luminal B型74.4%,TNBC 88.9%,HER2型58.2%)。TNBC的MRI评估准确性较高可能直接与其独特细胞和血管特征相关:通常组织学分级更高,伴细胞增殖增加、细胞密度更高、结构更复杂、代谢活性显著增强;新生血管化增加导致肿瘤血管结构和功能异常、动静脉分流增多、血流失调,共同促进对比剂更大摄取和细胞外间隙渗漏增加,最终表现为MRI上更明显强化,可能是TNBC诊断准确性较高的基础。相反,HER2阳性肿瘤的MRI诊断准确性较低可能机制解释包括:HER2基因扩增与新生血管化密切相关,靶向治疗抑制HER2信号转导,破坏促血管生成和抗血管生成因子平衡,抑制血管生成并促进异常血管正常化,从而改变MRI成像特征;血管生成残留效应可能起作用:HER2阳性乳腺癌固有高度增殖性,诊断时常呈现高水平血管生成,即使NAT后达到pCR,残留新生血管仍可能表现为MRI上的非rCR,导致诊断准确性降低。
关于基线MRI特征,多项研究证实其与NAT后MRI-病理不一致相关。Hu等研究表明多灶/多中心病灶、段样或区域NME分布以及强化肿块边缘增加不一致风险。Negr?o等报道NME是与MRI-病理不一致唯一显著相关因素。NME病灶MRI评估准确性降低源于两个主要因素:首先,与边界清晰、均匀的肿块病灶不同,NME呈现弥漫、异质性生长模式,NAT后通常不规则消退,而肿块通常表现为向心性收缩,这种差异使NME的MRI大小评估更具挑战性;其次,局灶性、区域性或不对称背景实质强化(BPE)易被误判为NME。Chikarmane等发现先前分类为NME的病灶中20%(77例)实为BPE。此外,本研究揭示肿块与NME成分共存显著放大MRI评估不准确性,源于异质性强化模式复杂相互作用、冲突成像特征、不同基础病理和可变治疗反应。
空心针活检DCIS存在与否与NAT后pCR的关联在现有研究中不一致。Labrosse等发现活检伴发DCIS与pCR无显著关联。相反,von Minckwitz等报道无DCIS是HER2阳性乳腺癌pCR的独立预测因子。Helal等证明TNBC中活检无DCIS与pCR显著相关。本研究观察到可比结果:治疗前空心针活检无DCIS与更高pCR可能性相关。这一观察可能解释为:虽然DCIS对NAT可表现出某些反应并在部分病例中完全消除,但DCIS细胞通常相比浸润癌具有更低增殖和侵袭潜力,因此伴DCIS的乳腺癌通常比纯浸润癌对NAT总体反应率更低,导致新辅助治疗反应性降低。
此外,我们发现MRI评估的rCR与pCR显著相关,与Santamaría等研究一致:NAT后MRI无晚期强化与pCR显著相关。Kim等表明NAT后MRI肿瘤床内无早期和晚期强化与pCR独立相关。本研究中rCR定义为治疗后MRI原发灶无早期和晚期强化,且所有病理性淋巴结短轴直径<10 mm。多因素回归分析确认rCR为NAT反应的强预测因子。但由于本队列rCR病例有限(15例,2.7%),需更大队列研究验证该发现。此外,NAT后TIC类型与pCR显著相关,与既往报告一致。TIC反映病灶血流动力学,特指组织血流灌注和微血管通透性。达到pCR的患者常表现为持续或平台型TIC曲线,该模式可能源于肿瘤血管重塑或闭塞、血管生成减少伴破坏增加、血管壁通透性降低。虽有文献提示NAT前后MRI的TIC模式变化与pCR相关,但本多因素分析未揭示TIC模式变化与pCR有统计学显著关联。
许多研究基于MRI特征开发了NAT反应预测模型。与这些既往模型相比,本研究构建的模型在区分能力、校准度和临床决策适用性方面表现出更优性能。本研究模型仅纳入基线特征和NAT后乳腺MRI参数,因此其主要效用在于术前风险分层以指导手术决策。为此我们系统评估了一系列概率阈值并报告相应敏感性和特异性。为最小化因治疗不足导致的长期生存损害风险同时保持足够敏感性,我们采用0.70概率阈值,此时模型特异性达97.7%、敏感性40.4%,从而正确识别绝大多数病理证实pCR患者。基于该阈值,当预测概率≥0.70时,可与患者讨论保乳手术(BCS)联合前哨淋巴结活检(SLNB),并在未来前瞻性试验中评估省略手术可行性;若预测概率<0.70,则推荐标准改良根治术或常规BCS。
然而本研究存在若干局限性:首先为单中心回顾性分析;其次因样本量有限未按分子亚型进行亚组分析;此外MRI评估rCR病例数少(15例,2.7%)削弱了该结果的诊断性能评估;最后训练与验证队列在少数基线MRI特征存在微小差异,虽统计分析
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号