综述:新辅助化疗与直接手术切除治疗骨肉瘤的比较结局:一项系统评价和荟萃分析
《World Journal of Surgical Oncology》:Comparative outcomes of neoadjuvant chemotherapy versus upfront surgical resection in osteosarcoma: a systematic review and meta-analysis
【字体:
大
中
小
】
时间:2025年11月24日
来源:World Journal of Surgical Oncology 2.5
编辑推荐:
本综述系统评价了25项研究(4867例患者),发现新辅助化疗(NACT)虽未显著改善骨肉瘤患者的总生存期(OS)和无病生存期(DFS),但能显著降低局部复发(LR)风险(RR=0.45)并提高保肢手术(LSS)可行性,支持其在以局部控制和功能保留为优先考量时的临床应用价值。
骨肉瘤是最常见的原发性恶性骨肿瘤,约占所有骨癌的20%。它好发于青少年和年轻成人,第二个十年是发病高峰,与骨骼快速生长时期重合。全球年发病率估计为每百万人3-4例,在10-19岁男性中发病率更高。大多数肿瘤起源于长骨的干骺端区域,特别是股骨远端、胫骨近端和肱骨近端,虽然骨盆和轴骨受累相对罕见,但此类病例通常预后较差。
尽管化疗方案和保肢手术技术取得了进步,但由于其侵袭性行为、早期转移潜力以及幸存者中长期发病率高,骨肉瘤仍然是一个具有挑战性的肿瘤。化疗的引入已将局限性骨肉瘤的5年总生存率从不到20%显著提高至70%。然而,诊断时即存在转移的病例预后仍然很差,5年总生存率约为20%。
包括新辅助化疗(NACT)、手术切除和辅助化疗在内的多模式治疗现在是大多数患者的标准治疗方案。NACT具有几个理论和实践上的优势:肿瘤减灭以方便保肢手术(LSS)、早期治疗微转移灶以及组织学评估肿瘤坏死情况。组织学反应,定义为≥90%的肿瘤坏死, consistently与优越的生存结局相关。因此,NACT已成为许多地区骨肉瘤治疗的基石。然而,化疗和手术的最佳顺序仍然是临床争论的话题。在某些情况下,例如小肿瘤或在资源有限的环境中,可能更倾向于直接手术切除后辅以辅助化疗。这种方法消除了与术前治疗相关的等待期;然而,它牺牲了评估肿瘤化疗敏感性的机会,并且在体积大的肿瘤中可能影响切缘控制。
比较NACT与直接手术疗效的文献存在异质性,主要包括回顾性队列研究,仅有少数临床试验,且往往样本量小、随访时间不一。此外,不同地区在治疗可及性和对多模式方案的依从性方面存在差异,这可能影响不同人群的结局。
本系统评价和荟萃分析遵循系统评价和荟萃分析优先报告项目(PRISMA)2020指南进行。研究方案已在国际系统评价前瞻性注册库(PROSPERO)注册,注册号为CRD420251070504。
检索的数据库包括通过PubMed访问的MEDLINE、Cochrane对照试验中心注册库(CENTRAL)和Google Scholar,时间从建库至2025年6月。使用了两组检索词,分别关注新辅助化疗和手术管理相关术语。检索结果提取并导入EndNote X9进行去重。检索限于同行评审期刊上发表的英文研究,无地域限制。
两位评审员独立筛选所有已识别记录的书名和摘要,以评估其潜在资格。对看似符合纳入标准或摘要信息不足难以确定资格的文章进行全文审查。任一阶段的任何分歧均通过协商一致解决,必要时咨询第三位评审员以达成最终决定。
数据提取到标准化的Microsoft Excel表格中,捕获关键变量,包括作者姓名、发表年份、国家、研究设计、样本量、人口学特征、肿瘤部位、转移状态、治疗细节(化疗方案、周期数、手术类型)和结局指标。主要结局是总生存率。次要结局包括无病生存率、局部复发率、远处转移、手术并发症和化疗相关不良事件。
使用Cochrane偏倚风险评估工具(ROB 2)评估随机对照试验(RCT)的方法学质量,该工具评估随机化过程、偏离既定干预措施、结局数据缺失、结局测量和报告结果选择五个领域的潜在偏倚来源。对于队列研究,使用纽卡斯尔-渥太华量表(NOS)进行评估,该量表基于三个标准评估方法学质量:研究组的选择、组的可比性和结局的确定。每项研究采用星标系统评分,最高九星代表最高质量。两位评审员独立进行质量评估,任何分歧均通过与第三位评审员讨论解决。被认为存在严重或关键偏倚风险的研究被排除在荟萃分析之外。
对于二分类结局,使用Mantel-Haenszel(MH)方法计算风险比(RR)和95%置信区间(CI)。由于预期的临床和方法学异质性,采用了随机效应模型(DerSimonian-Laird估计量)。研究间异质性用τ2和I2量化,并报告95%预测区间。通过留一法分析进行影响诊断,并应用Hartung-Knapp调整作为敏感性分析。由于绝大多数研究仅报告汇总事件和总数(无风险比、对数秩统计或可重建的Kaplan-Meier数据),我们使用报告时间点的风险比作为主要效应测量指标。在因数据不足或异质性无法进行荟萃分析的情况下,进行叙述性综合。按地理区域(北美、亚洲、欧洲)、年龄组(儿童/年轻成人 vs 老年)、研究设计(RCT和回顾性研究)和转移状态(是/否)进行亚组分析。在跨研究可获得足够协变量的情况下进行了研究水平的荟萃回归。由于研究数量少,荟萃回归分析的结果被视为探索性的。发表偏倚的评估不适用,因为荟萃分析结局的纳入研究数量少于10项。使用GRADE评估证据的确定性,涵盖偏倚风险、不一致性、间接性、不精确性和发表偏倚,并在结果总结表中总结。所有分析均在R(RStudio v2025.05)中使用meta和metafor包进行。
通过系统数据库检索共识别出947条记录。去除35篇重复文献后,对912条记录进行了标题和摘要筛选。其中,704篇因不符合资格标准被排除。对208篇文章进行了全文审查,最终排除了183项研究。最终,25项研究被纳入定性综合(系统评价),其中14项被纳入定量综合(荟萃分析)。
纳入的25项研究涉及4867例经组织学确诊的骨肉瘤患者。大多数为回顾性队列设计(n=22),而三项为RCT。研究来源于不同的地理区域,包括意大利(n=7)、美国(n=6)、中国(n=5)、台湾(n=2)、韩国(n=2),以及日本、印度和澳大利亚各一项。
样本量从25到792例患者不等。年龄分布广泛,一些研究侧重于儿童和青少年人群,而其他研究则包括60岁以上的老年患者。性别分布大致平衡,尽管一些队列显示男性占主导地位。随访时间从最短24个月到某些队列超过20年不等。大多数研究提供了足够的长期随访以评估生存和复发结局。
纳入研究的质量评估显示,在三项随机研究中,Zhu等人证明了在所有五个ROB 2.0领域中均为低偏倚风险。Bernthal等人和Goorin等人因偏离既定干预措施和结局数据缺失分别被评为存在“一些担忧”。所有22项非随机研究基于NOS被评为“良好质量”,得分在7到8星之间。这些研究在队列选择、暴露评估和随访时间方面显示出强大的方法学。在可比性或对照组代表性方面注意到较小的局限性。总体而言,方法学质量支持本综述中综合结果的可靠性。
在25项纳入的研究中,主要肿瘤部位涉及股骨远端、胫骨近端和肱骨。肿瘤大小的报告方式不一,许多研究按体积(>150 cm3)或长度(>10 cm)对病变进行分类,较大尺寸与较差的预后相关。
在纳入的研究中,“直接手术”的定义存在异质性。一些研究将“直接手术”定义为手术后计划进行辅助化疗。相比之下,其他研究将“直接手术”定义为单独手术,无辅助化疗;我们将其视为NACT组的直接手术比较对象。
诊断时转移存在于某些队列中高达23.4%的患者,而几项研究完全排除了转移病例。肺转移的存在在年轻和老年人群中均有显著报道。
尽管各研究的NACT方案不同,但通常包括甲氨蝶呤(MTX)、多柔比星(ADM)、顺铂(CDDP)和异环磷酰胺(IFO)。大多数患者接受2至4个术前周期,然后根据组织学反应和机构方案接受3-6个术后周期。一些试验使用较老或实验性的方案(例如,T-10B, DIA, MMIA)以增强疗效或降低毒性。
保肢手术(LSS)在可行的情况下是首选手术方式,许多研究中LSS率超过80%。相反,当省略NACT时,截肢仍然是必要的。有计划化疗方案的研究报告了改善的保肢率,且未损害肿瘤学结局。重要的是,接受NACT的患者更可能接受保肢手术,这是由于肿瘤缩小、更好的手术切缘和组织学反应。这些发现支持将NACT整合到标准骨肉瘤护理中,以在保持治愈意图的同时增强功能结局。
对来自9项研究的OS、来自5项研究的DFS和来自5项研究的LR率进行了荟萃分析,以定量评估NACT后手术与直接手术切除的影响。
我们综合了9个比较队列(NACT+手术 vs 直接手术;NACT总n=1442,直接手术n=623)。随机效应模型得出的汇总RR为1.09(95% CI:0.95-1.24),表明策略之间的OS无统计学显著差异;异质性为中度(I2=57.8%,T2=0.0189;p=0.015)。留一法分析表明,在剔除任何一项研究后,汇总估计值范围在RR=1.01至1.14之间,所有置信区间均跨越1;结论未改变。异质性度量与主模型大致相似,尽管剔除Dharanikota A等人的研究将异质性从中度降低到轻度(I2=13.9%),表明该研究对研究间变异性贡献过大,但未改变整体推论。应用Hartung-Knapp调整后,点估计值不变,但不确定性扩大至RR=1.09(95% CI:0.91-1.30;t8=1.06;p=0.32)。OS的证据确定性(GRADE)被评为低质量,因不一致性(中度异质性)和不精确性(95% CI跨越无效线且预测区间宽)而降级,间接性无严重问题;鉴于研究数量少(n=9),未正式评估发表偏倚。
在OS的亚组分析中,没有因素显著改变治疗效应。按地区划分,北美的汇总RR为0.98(95% CI:0.90-1.07;I2=15.7%),亚洲为1.25(0.94-1.67;I2=70%),欧洲为1.57(95% CI:0.79-3.10;I2=0%),地区间无差异(p=0.125)。按年龄划分,儿童/年轻成人显示RR为1.22(0.92-1.63;I2=79.7%),老年人为1.03(95% CI:0.94-1.13;I2=0%),亚组间无显著差异(p=0.271)。按转移状态划分,转移队列的RR为1.00(95% CI:0.92-1.09;I2=6.2%),非转移队列的RR为1.23(95% CI:0.89-1.68;I2=77.4%),再次无显著差异(p=0.227)。
对于DFS,汇总了五项研究,包括625例接受NACT加手术治疗的患者和199例接受直接手术治疗的患者。随机效应模型显示策略之间无统计学显著差异(RR=1.18,95% CI:0.47-2.96),具有显著的异质性(I2=88.0%,T2=0.2336,p<0.0001)。95%预测区间很宽(0.26-5.28),反映了真实效应的相当大的不确定性。应用Hartung-Knapp调整产生了相同的点估计值(RR=1.18),但95% CI更宽(0.47-2.96;t4=0.49;p=0.65),进一步证实NACT加手术并未赋予比直接手术显著的DFS优势。留一法分析显示了一致的结果,汇总估计值范围从RR=0.93到1.41,所有置信区间都跨越1。虽然排除Bacci G等人的研究降低了异质性(I2=69.2%),但整体推论未变。DFS的证据确定性(GRADE)被评为极低质量,因明显的不一致性(异质性非常高)和严重的不精确性(宽的CI和预测区间跨越了显著的益处和危害)而降级;间接性未被判断为严重,鉴于研究数量少(n=5),未正式评估发表偏倚。
区域亚组分析揭示了不同背景下的差异。亚洲队列(n=3)报告的RR为0.96(95% CI:0.64-1.46;I2=79.3%),北美(单项研究)显示RR为0.87(95% CI:0.65-1.17),而欧洲队列(单项研究)报告的RR显著更高,为7.11(95% CI:2.40-21.05)。亚组差异检验具有统计学意义(p=0.0012),表明地区可能有助于DFS结局的异质性。按年龄分层时,儿童/年轻成人队列(n=3)显示汇总RR为1.35(95% CI:0.54-3.39;I2=94.1%),而老年成人队列(n=2)产生了更精确的估计(RR=1.19,95% CI:0.94-1.52;I2=0%)。亚组差异检验无统计学意义(p=0.79),表明年龄组没有明显的效应修饰作用。按研究设计划分,随机对照试验(n=2)证明RR为1.03(95% CI:0.75-1.43;I2=62.2%),而回顾性队列(n=3)产生了更高但不显著的估计(RR=1.63,95% CI:0.41-6.43;I2=94.8%)。亚组间差异不显著(p=0.52)。
对于LR,纳入了五项研究,包括NACT加手术组的651例患者和直接手术组的153例患者。随机效应模型下的汇总分析表明,NACT加手术显著降低了LR风险(RR=0.45,95% CI:0.25-0.79;p=0.0059),相当于相对风险降低约55%。研究间异质性为低至中度(I2=31.9%,τ2=0.1277,p=0.21),95%预测区间为0.12至1.61。应用Hartung-Knapp调整后,效应大小未变(RR=0.45),但置信区间变宽(95% CI:0.19-1.08;t4=-2.53,p=0.065),在这种保守方法下结果变得不显著。留一法敏感性分析证实了结果的稳定性,汇总RR范围在0.41至0.51之间。通过剔除Bacci等人的研究,异质性完全解决(I2=0%),且具有统计学显著的效应大小(RR=0.41,95% CI:0.27-0.63)。LR的证据确定性(GRADE)被评为中等质量,因不精确性(HK CI跨越无效线且预测区间宽)而降级,不一致性或间接性无严重问题;鉴于研究数量少,未正式评估发表偏倚。
按地区进行的亚组分析显示,欧洲队列(n=3)的汇总RR为0.44(95% CI:0.07-4.37;I2=65.6%),表明高度不精确性和研究间显著的异质性。相比之下,亚洲队列(n=2)证明了NACT加手术在降低局部复发方面更一致且具有统计学显著性(RR=0.46,95% CI:0.27-0.77;I2=0%)。亚组差异的总体检验无统计学意义(p=0.87)。
荟萃回归分析显示,没有调节因子具有统计学显著性。转移状态系数为-0.692(95% CI -1.829 至 0.446);男性百分比系数为-1.579(95% CI -6.556 至 3.397);保肢手术系数为0.176(95% CI -5.047 至 5.398)。
远处转移是纳入研究中疾病进展的常见模式。发生率差异很大,从12%到78.4%不等。Bacci等人报告了较高的转移率,最常见于肺部。类似地,在其他纳入的研究中也观察到以肺为主的模式。值得注意的是,Wang B等人报告NACT组的远处转移率(30.4%)低于接受非计划手术切除的患者(45.8%),但无显著差异。转移性复发的时间在各研究中也不同:Bernthal等人和Ellis等人报告远处转移的中位时间分别为11个月和15个月。总体而言,虽然肺转移占主导地位,但一些病例涉及骨或多个部位,少数患者在诊断时即出现远处转移。
手术并发症的报告不一,并受手术类型和重建方式的影响。Goorin等人记录了保肢手术较高的并发症发生率,包括6例伤口感染和7例皮瓣坏死,而只有1例截肢患者发生感染。类似地,Mankin等人注意到同种异体骨移植相关并发症、感染、骨折和骨不连的发生率高。此外,Wang B等人还报告了机械性失败,如假体松动、感染和固定失败,部分病例最终需要二次截肢。
化疗相关的毒性主要是血液学和心脏毒性。Goorin等人报告了3例治疗相关死亡,2例由多柔比星引起的充血性心力衰竭,1例由闭塞性细支气管炎引起。此外,中性粒细胞减少是最常见的不良事件,发生在89%接受NACT的患者中。其他并发症包括粘膜炎、恶心、呕吐以及与顺铂和甲氨蝶呤相关的电解质紊乱。在4例患者中观察到神经系统副作用,如癫痫发作或偏头痛,1例出现听力损失。尽管存在这些问题,大多数毒性是中度且可通过支持性管理逆转的。类似地,Zhu等人报告了化疗相关毒性,主要发生在NACT期间或之后一周内。这些包括骨髓抑制、消化系统反应如恶心和厌食,以及肝肾功能受损。大多数并发症通过适当的对症治疗得到解决。Yuan等人进一步报告化疗相关毒性主要为轻度(I-II级),影响血液学、胃肠道、肝和肾系统。一部分患者出现高级别(III-IV级)毒性,但这些仍然是非致命的。此外,在一些病例中观察到低度周围神经病变,通常通过保守治疗改善。
总体而言,肺转移是主要的复发模式,其发生时间和频率在不同研究中有很大差异。手术并发症率因重建类型而异,而化疗毒性很常见,但在大多数情况下是可管理的。
本系统评价和荟萃分析评估了NACT后手术与直接手术切除在骨肉瘤治疗中的作用。共纳入25项研究,其中14项符合定量荟萃分析,评估与OS、DFS和LR相关的结局。我们的研究结果表明,虽然NACT在OS和DFS方面未提供统计学显著优势,但它与显著降低LR风险和增强手术可行性相关。
我们的荟萃分析显示,接受NACT后手术治疗的患者与接受直接手术切除的患者相比,汇总的5年OS风险比为1.09(95% CI:0.95-1.24),表明生存结局无统计学显著差异。这一发现与Danese等人的研究一致,该研究分析了792例肢体骨肉瘤患者,报告两种治疗方法之间无显著生存差异,尽管手术优先组的5年OS(74%)略高于NACT组(67%)。相比之下,Erdogan等人发现良好的组织学反应(≥90%坏死)
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号