《Hematology》:Application of single nucleotide polymorphism array (SNP array) derived median copy number state for monitoring the clonal burden of the chromosomal aberrations in myelodysplastic neoplasms
摘要
研究目标
本研究整合单核苷酸多态性阵列(SNP array)与中期细胞遗传学(metaphase cytogenetics, MC)技术,旨在解析骨髓增生异常综合征(myelodysplastic syndromes, MDS)及相关疾病中的克隆架构。
研究方法
研究团队回顾性分析了33例经SNP array和MC诊断的MDS及相关疾病患者的染色体异常情况,其中10例通过MC检测到染色体拷贝数变异(copy number variations, CNVs)。研究采用SNP array衍生的中位拷贝数状态(median copy number state)这一指标来量化CNVs的克隆负荷。
研究结果
研究发现,SNP array衍生的中位拷贝数状态与MC检测的异常细胞/总细胞比率相关,表明该指标可用于评估MDS及相关疾病中染色体CNVs的克隆负荷。在研究对象中,携带孤立+8克隆的患者相较于具有复杂核型+8的患者,表现出相对较低的克隆负荷和更稳定的预后。而携带+1/1q+克隆的患者,即使作为唯一病变,也与疾病快速进展相关。在复杂核型和预后不良的患者中,+8克隆负荷更高(表现为中位拷贝数偏差升高),这进一步支持了阶段性演化理论,并为研究骨髓增生异常肿瘤中染色体异常的发展提供了新视角。
研究结论
SNP array可作为一种新型工具,用于骨髓增生异常肿瘤的精准疾病管理,实现高风险克隆的早期识别和预后评估的优化。
引言
骨髓增生异常肿瘤是一类具有异质性遗传背景和不可预测临床进程的克隆性造血系统恶性肿瘤。虽然通过中期细胞遗传学(MC)检测的细胞遗传学异常仍是风险分层的基石,但约50%的患者通过常规方法无法检测到染色体病变,这凸显了MC技术的敏感性和分辨率有限。此外,重现性异常(如+8)的预后影响因其克隆背景不同而差异显著;然而,当前的模型往往未能整合动态的克隆负荷或早期演化模式来阐明潜在机制。
先进基因组学工具从研究向临床实践的转化仍存在关键空白。尽管单核苷酸多态性阵列(SNP array)革命性地检测了隐匿的拷贝中性丢失和小克隆,但其在量化克隆负荷和追踪疾病演化方面的应用仍有待探索。先前的研究主要关注SNP array的诊断和预后能力,而很大程度上忽视了其在追踪染色体异常克隆负荷以及与疾病发病机制相联系方面的潜力。
本研究旨在通过整合SNP array与MC来解决这一空白,重点探讨两个关键问题:1. SNP array衍生的指标是否能补充MC对异常细胞比例的评估,从而阐明致病机制?2. 如何应用SNP array监测常见异常在疾病进展和管理过程中的克隆动态?
方法
患者
回顾性分析纳入了33例在瑞金医院诊断为骨髓增生异常肿瘤的患者。本研究经上海交通大学医学院附属瑞金医院临床试验伦理委员会批准。根据机构审查委员会规定并遵循《赫尔辛基宣言》,知情同意要求被豁免。通讯作者现任职于青岛机构,促成了此项合作研究。所有样本和数据均来源于瑞金医院并获适当内部授权。SNP array数据分析主要由青岛的研究团队完成。所有患者均随访至少3年以观察疾病演化。生存状况根据国际工作组(International Working Group, IWG)2023年骨髓增生异常肿瘤标准进行定义,并分类为以下情况:1. 稳定,随访期间与初诊相比无疾病进展;2. 进展,定义为发生以下事件之一:a. 原始细胞百分比显著增加(例如从MDS-LB进展为MDS-IB2);b. 转化为急性髓系白血病(acute myeloid leukemia, AML)(骨髓原始细胞≥20%);c. 疾病相关死亡。患者根据其个体风险状况、年龄和体能状态接受治疗,或遵循特定研究方案。诊断依据WHO标准进行分类。
中期细胞遗传学分析
在初诊时,对骨髓抽吸物进行24至48小时培养后的常规细胞遗传学分析,采用标准细胞遗传学技术。染色体通过G显带进行评估,并根据人类细胞遗传学国际命名体制(International System for Human Cytogenetic Nomenclature, ISCN)进行描述。计算异常细胞占分析细胞总数的百分比以确定异常/总比率。
DNA提取
在初诊时,将骨髓样本收集到含EDTA的试管中。在采集后24小时内,通过密度梯度离心法使用Ficoll-Paque PLUS从骨髓样本中分离单个核细胞。随后使用QIAamp DNA Mini Kit从分离的单个核细胞中提取基因组DNA。具体而言,按照制造商的"血液或体液离心方案"进行提取,洗脱体积为100 μL AE缓冲液。通过1%琼脂糖凝胶电泳确认DNA完整性,并使用NanoDrop? One分光光度计通过光谱法评估分离DNA的质量和浓度。所有DNA样本的A260/A280比值在1.8至2.0之间,并储存于-80°C直至分析。
SNP阵列分析
将来自骨髓样本的250 ng基因组DNA按照制造商标准方案进行消化、扩增、标记并杂交至CytoScan? HD Array,并整合了标准化研究中的方法学改进。
简要步骤包括:使用NspI进行DNA消化;接头连接后使用通用引物进行PCR扩增;PCR产物的纯化和片段化;使用生物素标记的核苷酸标记片段化DNA;以及在50°C下于GeneChip? Hybridization Oven 645中与芯片杂交16小时。随后在GeneChip? Fluidics Station 450中清洗芯片并用链霉亲和素-藻红蛋白染色,最后使用GeneChip? Scanner 3000 7G扫描生成原始数据文件(.CEL)。
使用Chromosome Analysis Suite(ChAS)软件(版本4.2)进行数据分析。根据制造商的建议和先前的研究应用质量控制阈值:Median Absolute Pairwise Difference <0.25,Waviness SD < 0.12,SNP Quality Control > 1.5。任何质量控制指标不合格的样本均进行重新处理,以最小化低克隆负荷情况下的技术噪音。
使用ChAS中的隐马尔可夫模型(Hidden Markov Model, HMM)分割算法检测拷贝数变异(CNVs),阈值设定为每个片段至少50个标记。应用严格参数以改进小克隆和亚克隆事件的检测,并使用默认设置进行探针水平log2比值平滑。CNV注释整合了针对DECIPHER和ClinVar数据库的查询,以区分可能致病的克隆与良性多态性。
中位拷贝数状态
从阵列衍生的中位拷贝数状态代表某条染色体相对于正常二倍体基线(2.0)的经过校准的log2比值的中位数。任何拷贝数变异都可能导致该值偏离正常的二倍体标准值。在骨髓中,异常细胞比例越高,导致的偏离越大,表明克隆负荷越重。基于此原理,SNP array因此可用于检测特定染色体异常克隆的负荷。此外,计算偏差百分比作为中位拷贝数状态偏差绝对值除以2再乘以100%(|偏差|/2 × 100%),提供了相对于二倍体基线的标准化克隆负荷度量。
结果
患者基线和MC结果
患者中位年龄为56岁(范围29-82岁),其中22例(66.7%)为男性。25例患者诊断为MDS,2例为MDS/骨髓增殖性肿瘤(MDS/MPN),6例为MDS后AML。中性粒细胞绝对计数、血红蛋白水平和血小板计数的中位值分别为1.07×109/L(范围0.2-39.2)、84 g/L(范围51-139)和67×109/L(范围16-522)。骨髓中原始细胞百分比中位数为6.0%(范围0-49)。13例(39.4%)患者发现MC异常。其中7例检测到单条染色体CNV,且均为重复。仅在3例具有复杂核型的患者中检测到缺失。此外,发现3例患者仅有平衡易位,其余10例患者经MC诊断为CNVs。
重现性MC异常结果与预后
10例经MC检测到CNVs的患者生存数据完整。然而,整个队列中3例无CNVs的患者因失访而缺乏完整的随访数据。在异常组中,5例患者表现出特定的染色体异常。这些异常包括15p+(P158)、+8(P001, P021)和1q+(P014, P018)。这些病例的异常/总比率从2/12(16.67%)到11/11(100%)不等,反映了尽管是单一异常,但克隆负荷存在差异。携带孤立+8的患者预后稳定,这与其低原始细胞百分比(分别为1.5%和2%)一致。相比之下,具有复杂核型+8的患者(P097)预后不良。这表明+8的预后影响受到共存细胞遗传学复杂性的调节。此外,无论患者是孤立1q+还是+1合并其他异常,其预后均一致较差。例如,携带孤立1q+的患者(P014和P018)最终死亡,尽管原始细胞百分比不同(分别为1%和21%)。同样,患有+1及其他病变的P006患者,即使原始细胞百分比低(4%),也迅速进展至死亡。这些发现提示,+1/1q+即使作为孤立病变,也可能赋予侵袭性疾病生物学特性。
SNP阵列结果
在10例经MC检测到CNVs的患者中,SNP array与MC结果在9例患者中一致。6例患者有单条染色体异常,而另外3例患者至少有两条染色体存在异常中位拷贝数状态。SNP array结果还揭示了4例患者中MC检测到但先前未明确定义的异常(+M)的来源。它们是P002和P030的22q+,P097的+7,以及P156的8q+。然而,SNP array分析未能证实1例患者(P158)的MC结果,原因是阵列中15p区域缺乏探针,这表明两种技术在发现染色体异常方面具有互补性。同时,MC的异常百分比与SNP array的偏差百分比相关,例如P001(72.73%, 17%)与P021(16.67%, 3.5%)的+8病变,而P002(30%, 18%)与P030(30%, 12%)的22q+病变相似,进一步支持了SNP array检测异常染色体克隆负荷的效用。
SNP阵列衍生的克隆负荷(中位拷贝数状态)与预后
携带+1/1q+异常的患者表现出不同的克隆负荷:携带孤立1q+异常的P014和P018显示出中等的中位拷贝数状态(分别为2.26和2.57),而具有复杂核型的P006则显示出升高的+1中位拷贝数状态(2.84)。尽管存在这些差异,这三名患者最终均死亡。在P006中,+1异常的中位拷贝数状态为2.84(偏差0.84),显著高于二倍体基线,表明其相对于共存亚克隆的优势地位。相比之下,并发的缺失显示出相对较小的偏差(0.02–0.29)。
在对四名+8患者(P001、P021、P097和P156)的分析中,随着染色体核型变得复杂,相应+8的克隆负荷增加。具有孤立+8的患者(P001和P021)比具有复杂核型的患者(P097和P156)预后更好。相比之下,在病例内部比较中,P097(0.84)和P156(0.62)的+8显示出显著的偏差,而共存的缺失则显示出较小的偏差(分别为0.33和0.05–0.41),表明+8在疾病进展过程中积累。结果提示+8可能早期出现,建立克隆优势,随后的异常则放大了克隆不稳定性。
讨论
早期研究强调了SNP array在检测隐匿病变和克隆多样性方面的诊断效用,但尚未有研究系统地将中位拷贝数状态与定量的克隆分数联系起来。重要的是,本研究探索了利用SNP array衍生的中位拷贝数状态推断克隆层级的新用途。该指标的应用不仅将染色体异常的动态监测与髓系肿瘤的阶段性演化理论相结合,还表明SNP array可能有助于识别可干预的早期克隆,为高风险髓系疾病的预防性干预提供了新途径,并阐明了疾病进展的机制。
+8是骨髓增生异常肿瘤中一种重现性细胞遗传学病变。历史上,它在IPSS-R中与中危预后相关,反映了可变的克隆动态和治疗反应。我们的数据与以下观点一致:非复杂背景下的+8可能代表一种具有惰性生物学特性的独特实体。然而,这一发现与复杂核型中的+8形成对比,后者共存的异常可能驱动侵袭性进展。
复杂核型患者中+8异常较高的克隆负荷表明,+8可能作为增殖性亚克隆持续存在,而其他染色体病变可能代表具有有限克隆适应性的继发事件(或暂时如此)。在孤立+8的患者中,该异常赋予异常克隆增殖优势。然而,获得增殖优势的额外染色体异常或突变的出现可以驱动疾病进展,在此期间,作为起始事件的+8的克隆负荷可能积累到高水平。
相比之下,我们队列中的+1/1q+在疾病演化中特征较少,但似乎与侵袭性进展相关,这与血液恶性肿瘤中的研究一致,其中+1q反复与不良预后相关。例如,一项针对48例患有1q+的各种血液癌症患者的单机构研究报告称,1q+经常与复杂核型共存,并且无论疾病亚型如何,均一致与较短的生存期相关。
在我们的研究中,无论通过MC还是SNP array检测到的+1/1q+克隆负荷如何,患者预后均一致较差,强调了其作为高风险标志物的作用。先前的证据表明,1q+需要共突变才能赋予高风险行为。其频繁与其他异常共存可能反映了其作为先于继发事件的起始病变,或作为维持克隆优势的继发病变的作用,如我们队列中的P006所示。
新兴的骨髓增生异常肿瘤模型假定染色体异常以逐步方式出现,早期克隆驱动因素决定疾病轨迹。这种层级式克隆架构反映了多种疾病中的发现,其中单细胞遗传学分析揭示了起始克隆通过发散或平行演化建立系统发育分支。
我们的数据与这一范式一致:在P006中,+1克隆表现出最高的中位拷贝数状态偏差(+0.84),超过了并发的缺失,表明其作为起始事件具有高克隆负荷。类似地,在P097和P156中,+8克隆维持了显著的偏差(分别为0.84和0.62),确立了克隆优势,而较小的病变可能反映了导致疾病进展的后期基因组不稳定性。这种从偏差推断出的层级式克隆架构如图所示。
部分染色体仅长臂显示异常,例如P156中的8q+。对于片段性或隐匿性染色体异常,log2比值可能是更合适的指标。然而,即使8q+仅影响该患者8号染色体的一部分,整个染色体(被正常区域稀释)的偏差程度仍然高于其他染色体病变,这足以说明8q+的克隆负荷重,代表早期或优势事件。
在临床实践中,克隆竞争动力学支持SNP array应用于上述场景。在白血病中,优势克隆通过选择性优势抑制微小亚克隆,反映了白血病 Propagating 细胞的行为。SNP array通过分层早期(高中位拷贝数状态)与晚期基因组事件来解析克隆层级,澄清模糊病例,并使得能够先发制人地靶向可干预克隆。类似地,在一项慢性淋巴细胞白血病(CLL)报告中,SNP array监测到预测Richter转化的克隆演变。将其转化到骨髓增生异常肿瘤,使用SNP array连续追踪中位拷贝数状态偏差可能允许早期检测高风险亚克隆,并促进符合精准肿瘤学原则的实时治疗调整。然而,SNP array的临床采用需要在治疗背景下进行验证。例如,结合SNP array与靶向测序的纵向研究可以阐明来那度胺等疗法对克隆层级的影响,如在非del(5q) MDS中所证明的那样。此类方法将阐明中位拷贝数状态的降低是否与临床反应相关,可能为个性化治疗调整提供生物标志物。
我们的研究最初采用IPSS-R进行风险分层,这在诊断时是标准做法。从研究结果中产生的一个关键问题是,SNP array衍生的克隆负荷测量如何被整合并可能改进IPSS-M。具体而言,在已知异常(例如+8)背景下高的中位拷贝数状态偏差,或发现核型分析未检测到的隐匿病变,是否值得重新分类患者的IPSS-M风险类别,从而改变临床管理,仍有待确定。鉴于我们有限的样本量和专注于验证相关性,本研究并非旨在解决此问题。SNP array在约50%核型正常的MDS患者中发现具有预后意义的隐匿性异常的潜力,是未来研究的一个特别引人注目的领域。因此,SNP array衍生克隆负荷指标的明确临床效用,即其独立改进或修改IPSS-M风险分层的能力,在此并未确立,并构成未来研究的关键目标。在分子特征明确的队列中进行前瞻性研究,将SNP array发现与IPSS-M评分和结局直接比较,对于将这一概念验证转化为临床可操作的知识至关重要。
除了这些技术考虑因素外,相对较小的样本量,特别是具有MC可检测CNVs的亚组(n=10),是一个显著的局限性。这限制了我们生存比较的统计效能和我们结论的普适性。此外,整个队列中3例患者的生存数据不完整。尽管这并未影响对具有CNVs的核心组的分析,但缺乏所有入组患者的完整数据可能引入偏倚并限制我们预后评估的全面性。虽然SNP array衍生的中位拷贝数状态与基于MC的克隆分数之间的相关性在机制上具有信息性,但在更大的独立队列中进行验证对于确认这些指标的预后效用并建立更明确的克隆负荷阈值至关重要。此外,本研究的回顾性性质以及患者治疗的异质性可能引入影响结局的混杂因素。需要进行采用标准化治疗方案的前瞻性研究以加强我们的发现。
必须强调,我们的研究并非旨在确立SNP array相对于中期细胞遗传学的优越性。相反,我们的研究结果提供了概念验证,即SNP array可以产生与常规克隆分数评估相关的定量指标(中位拷贝数状态)。中期细胞遗传学仍然是检测平衡易位和提供染色体完整性全基因组概览的金标准。因此,这两种技术应被视为互补。中位拷贝数状态的连续监测对于预测疾病演化或治疗反应的真正临床效用需要进一步验证。
总之,我们的研究提供了初步证据,表明SNP array衍生的中位拷贝数状态与克隆负荷相关,并可能提供对克隆架构的见解。这些概念验证性发现支持进一步研究SNP array作为一种补充性基因组工具,以改进风险评估并可能追踪骨髓增生异常肿瘤中的克隆动态,值得在更大的前瞻性队列中进行验证。
出版同意
对于此类研究,不需要出版同意。
伦理批准声明
本研究经上海交通大学医学院附属瑞金医院临床试验伦理委员会审查批准。批准文号为2013-CE-001。所有程序均根据机构研究委员会的伦理标准以及1964年《赫尔辛基宣言》及其后续修正案进行。由于研究的回顾性设计,伦理委员会豁免了知情同意要求。
数据可用性
支持本研究结果的数据可根据要求从通讯作者处获得。由于隐私或伦理限制,数据不公开可用。