全基因组重亚硫酸盐测序(WGBS)识别用于肝细胞癌(HCC)检测的血浆循环游离DNA(cfDNA)甲基化生物标志物

《Molecular Carcinogenesis》:Whole-Genome Bisulfite Sequencing Identifies Blood-Based DNA Methylation Biomarker for Hepatocellular Carcinoma

【字体: 时间:2026年03月03日 来源:Molecular Carcinogenesis 3.2

编辑推荐:

  本文综述了一项整合全基因组重亚硫酸盐测序(WGBS)与转录组学(mRNA-seq)数据识别肝细胞癌(HCC)诊断生物标志物的研究。作者通过分析33对HCC与癌旁组织的WGBS和mRNA-seq数据,筛选出启动子区高甲基化且与基因表达呈显著负相关的差异甲基化区域(DMR)。经外部队列验证及外周血单核细胞(PBMC)背景甲基化评估,研究最终聚焦于TSPYL5基因启动子甲基化(meTSPYL5),并通过定量甲基化特异性PCR(qMSP)在血浆循环游离DNA(cfDNA)中验证其诊断性能,结果显示其检测HCC的灵敏度达85.4%,特异性为100%。该研究为HCC的无创早期筛查提供了新的潜在生物标志物。

  
1 引言
肝细胞癌(Hepatocellular Carcinoma, HCC)是全球第六大常见癌症,每年导致约60万人死亡。HCC通常发生在肝硬化患者中,由长期肝脏炎症和修复引起,病因主要包括慢性病毒性(主要是乙型和丙型肝炎病毒)感染或酒精性/非酒精性脂肪肝病。由于早期症状不明显,大多数HCC患者在确诊时已处于晚期,预后极差,中位生存期仅为1-2年,5年生存率低于16%。因此,HCC的早期检测对于及时治疗和降低高死亡率至关重要。
目前的指南建议对HCC高危人群每6个月进行一次超声筛查,但其对早期肝癌的检出率有限(灵敏度约51%,特异性91%)。作为血清标志物的甲胎蛋白(alpha-fetoprotein, AFP)用于HCC筛查的临床价值仍存在争议,因其灵敏度较低。尽管有许多非侵入性生物标志物被研究,但鲜有能在HCC中成为公认的诊断或治疗靶点。因此,迫切需要新的、稳健的非侵入性方法来改善HCC的早期诊断。
DNA甲基化水平的改变是包括HCC在内的许多癌症的主要特征之一。基因启动子区域的超甲基化通常与基因沉默相关,且在CpG岛(CpG island, CGI)中具有一致的修饰状态。血浆循环游离DNA(cell-free DNA, cfDNA)的异常DNA甲基化检测为癌症筛查提供了一种新颖且有前景的策略。基于微阵列的全基因组甲基化研究已经开展,并构建了一些用于HCC检测的诊断模型。然而,甲基化阵列仅覆盖全基因组甲基化组的一小部分,而全基因组重亚硫酸盐测序(whole-genome bisulfite sequencing, WGBS)具有无与伦比的优势,其全面、无偏倚的性质使研究人员能够描绘癌症甲基化组的完整图景。
本研究旨在通过整合WGBS与转录组学分析,识别HCC中异常高甲基化并伴随基因表达显著沉默的基因子集,进而筛选可用于HCC无创检测的血液生物标志物,并评估其临床性能。
2 材料与方法
2.1 研究设计
本研究分为两个阶段。第一阶段,利用WGBS和多个数据集中的基因表达谱筛选候选DNA甲基化标志物。第二阶段,使用来自HCC患者和健康对照的独立血浆样本验证所选标志物。研究流程概览如图1所示。
2.2 研究参与者与样本获取
本分析使用的样本来自四个队列。33名HCC患者被招募为生物标志物发现队列,其配对的HCC和癌旁正常肝组织用于本研究。72名无癌症个体的外周血单核细胞(peripheral blood mononuclear cell, PBMC)样本也用于分析。此外,还从TCGA和NCBI GEO数据库下载了八个公开的甲基化数据集。
用于验证的血浆样本来自树兰(杭州)医院的48名HCC患者和24名健康对照者。所有外周血样本均使用Cell-free DNA BCT管采集,并按照说明书分离血浆。本研究经浙江大学医学院附属第一医院伦理委员会批准,所有参与者均根据机构指南签署书面知情同意书。
2.3 数据处理
为了探索可用于HCC无创诊断的甲基化标志物,研究者通过分析发现队列组织样本的WGBS DNA甲基化谱,识别了所有位于启动子区域的差异甲基化区域(differentially methylated regions, DMR)。所得的beta(β)值用于识别肿瘤和非肿瘤样本之间的DNA甲基化变化(Δβ)。同时,通过对发现队列的mRNA-Seq数据进行差异表达分析,识别差异表达基因(differentially expressed genes, DEGs)。
通过确定pDMRs和DEGs的交集进行甲基化和表达的整合分析,以改善cfDNA甲基化标志物的可靠性。此外,为了分析pDMRs的顺式调控效应,计算了pDMR甲基化水平(β)与匹配基因表达水平之间的斯皮尔曼相关系数。
研究者设定了严格的筛选标准来选择目标DMRs:(1)肿瘤与癌旁组织间的甲基化差异大于0.3(高甲基化DMR,hyper-DMR);(2)DMR位于启动子区域(pDMR),且对应基因在肿瘤和癌旁组织间表达水平存在显著差异;(3)DMR与对应DEG的斯皮尔曼相关系数小于-0.3。满足这些标准的DMR被称为目标高甲基化pDMR。
2.4 候选诊断生物标志物甲基化差异的外部队列评估
八个公开的甲基化数据谱使用R语言“wateRmelon”包中的betaqn函数进行独立归一化。为了验证目标高甲基化pDMR的甲基化差异,使用公共数据集作为测试集,提取并比较位于目标高甲基化pDMR内的CpG位点在肿瘤和非肿瘤组织中的甲基化水平(β)。
此外,作为cfDNA DMR标志物的“背景甲基化”,PBMC DNA在候选区域的甲基化水平应处于低甲基化状态,以确保这些标志物的特异性。同时,考虑到qMSP检测cfDNA甲基化标志物的扩增片段长度限制(通常检测<200 bp的cfDNA),研究者从八个目标高甲基化pDMRs中根据以下标准筛选标志物:(1)CpG位点位于150 bp窗口内;(2)单个窗口内有四个或更多CpG位点,以提高检测的特异性和灵敏度;(3)每个CpG位点在肿瘤组织中持续表现出高甲基化(β > 0.6),而在癌旁组织和PBMC中持续低甲基化(β < 0.2)。
2.5 血浆cfDNA的分离与重亚硫酸盐修饰
使用MagMAX cfDNA Isolation Kit从血浆样本中分离cfDNA,并使用Qubit 3.0荧光计对纯化的cfDNA进行定量。使用EZ DNA甲基化试剂盒对10 ng cfDNA进行重亚硫酸盐处理。
2.6 定量甲基化特异性PCR(qMSP)
采用qMSP检测血浆cfDNA中甲基化的TSPYL5。为靶基因启动子区域设计了特异性引物,并以ACTB基因作为重亚硫酸盐转化cfDNA输入量的内参。PCR在ABI 7500DX仪器上进行。由于91.6%的健康对照参与者的CT值无法通过实时PCR检测到,本研究采用预先设定的CT阈值(= 38)来判断TSPYL5甲基化的阳性与否。当CT值 ≤ 38时,判定测试样本为阳性。
3 结果
3.1 甲基化与表达的差异分析
通过对发现队列的WGBS数据分析发现,约34%的CpG位点在癌组织和癌旁组织之间存在显著的甲基化水平差异。其中,157,320个位点呈高甲基化,9,710,380个位点呈低甲基化。高甲基化位点主要位于基因启动子区域,而低甲基化位点主要位于基因体区域。共识别出608,279个DMRs,其中6,924个在HCC中高甲基化(hyper-DMR),601,355个低甲基化(hypo-DMR)。
对发现队列的mRNA-Seq数据进行差异表达分析,结果显示有11,672个基因的表达水平存在显著差异。其中,6,912个基因高表达,4,760个基因低表达。
3.2 DMR与DEG的整合分析
为了筛选对相应基因表达具有沉默功能效应(顺式调控)的DMRs,研究者对高甲基化pDMRs(Δβ > 0.3)和DEGs进行了交集分析,随后对同一基因的甲基化和表达进行了斯皮尔曼相关分析。结果显示,在29个交集的高甲基化pDMRs中,有8个与相应基因的表达呈负相关,这些被称为目标高甲基化pDMRs。
这八个目标高甲基化pDMRs对应的基因符号分别为TSPYL5、GNA14、LRRC4、CYP26A1、TACSTD2、FAM83F、TBX15和STEAP4。其中,TSPYL5的甲基化差异(Δβ)最大,为0.42,与基因表达的负相关性也最强(相关系数为-0.62)。
3.3 外部队列甲基化差异的验证
为了确认这八个目标高甲基化pDMRs的甲基化差异,研究者利用外部公共数据集分析了位于这些DMR内的CpG位点的甲基化差异。结果显示,在独立数据集中,肿瘤样本可以与正常组织区分开来,表明了研究结果的稳健性。
3.4 生物标志物筛选
八个目标高甲基化pDMRs的基因组组织情况如图所示。研究表明,PBMC DNA在这些区域的甲基化水平较低。其中,chr8:97277329_97278175(匹配TSPYL5基因启动子区)和chr9:77647531_77648367(匹配GNA14基因启动子区)是两个在肿瘤和正常组织间甲基化差异(Δβ)最大的DMR,分别达到0.416和0.400。肿瘤样本中的β值稳定在0.6以上,而正常组织中的β值稳定在0.2以下。
研究者尝试设计GNA14启动子区的qMSP引物,但未能扩增出足够的PCR产物;因此,选择TSPYL5启动子区域甲基化(meTSPYL5)作为进一步血浆cfDNA验证的靶标。
在发现队列中,TSPYL5甲基化水平在年龄、性别、肿瘤直径、巴塞罗那临床肝癌(Barcelona Clinic Liver Cancer, BCLC)分期、乙肝状态和血清AFP状态等临床亚组间均未观察到显著差异。这些结果表明TSPYL5甲基化是一个独立的诊断生物标志物。
泛癌分析显示,TSPYL5在多种癌症类型中甲基化水平升高,表明其可能缺乏癌症类型特异性,但这并不影响其在监测HCC高危人群中的应用价值。
3.5 meTSPYL5 qMSP检测在血浆cfDNA中诊断HCC的临床性能
为了评估meTSPYL5 qMSP检测在利用血浆cfDNA诊断HCC中的性能,研究者测试了72个有效样本,包括48个HCC样本和24个健康对照样本。CT值的受试者工作特征曲线下面积(Area Under ROC Curve, AUC)为0.921。在48名HCC患者中,血浆cfDNA的meTSPYL5 qMSP检测总体灵敏度为85.4%(41/48)。与BCLC A期相比,更早期的BCLC 0期患者的CT值更低,表明甲基化水平更高。在7名检测结果为假阴性的HCC患者中,分别有3、2、1、1名患者处于BCLC 0、A、B、C期。这7名患者中,除1例无AFP检测结果外,其余6例AFP结果均为阳性。这一结果提示,将AFP检测与meTSPYL5甲基化检测结合可以提高诊断灵敏度。24名无癌参与者的特异性为100%(24/24)。因此,meTSPYL5是HCC无创检测的一个良好候选标志物。
在cfDNA验证队列中,44名接受血清AFP检测的HCC患者中,仅有31人被检测为阳性,灵敏度为70.5%。相比之下,meTSPYL5甲基化对HCC检测具有更好的灵敏度。当AFP检测与meTSPYL5甲基化检测结合时,检测灵敏度达到100%。在发现队列中的相关性分析显示,TSPYL5的甲基化水平与AFP的表达水平相关性非常弱(R = 0.28, p = 0.021),进一步证明了TSPYL5甲基化与AFP水平之间的相互独立性。
4 讨论
HCC的表观遗传生物标志物已基于甲基化阵列进行了广泛研究,但至今尚未有商业化产品。本研究首次利用WGBS数据结合转录组学分析,识别用于HCC诊断的生物标志物。整合WGBS和匹配的基因表达数据,识别出八个高甲基化启动子区域,它们与基因表达呈显著负相关。这八个高甲基化DMRs分别位于TSPYL5、GNA14、LRRC4、CYP26A1、TACSTD2、FAM83F、TBX15和STEAP4的启动子区域。其中六个基因先前已被报道存在高甲基化伴随表达沉默。CYP26A1和FAM83F的高甲基化是在HCC患者中的新发现。
这些基因的甲基化差异在外部独立队列中得到了确认。此外,这八个基因在PBMC中均为低甲基化,表明这些基因的甲基化在临床实践中具有作为无创诊断生物标志物的潜力。在这八个标志物中,TSPYL5和GNA14具有最大的Δβ和最强的表达负相关性。由于meGNA14在检测方法开发阶段扩增失败,因此选择meTSPYL5在血浆cfDNA中进行验证。
值得注意的是,在85.4%的HCC血浆样本中检测到meTSPYL5,显著高于HCC患者血清AFP的检出率(70.5%)。这些数据表明,meTSPYL5是HCC患者潜在的有前景的早期预测生物标志物,鼓励在更大规模队列中进行进一步研究。本研究中DNA甲基化与表达的相关性系数对于TSPYL5为-0.62,表明TSPYL5甲基化具有很强的调控作用,并可能驱动癌症发展。
本研究的最终目标是开发一种基于DNA甲基化的检测方法用于HCC早期筛查。先前表观基因组关联研究识别出的大量基因使得难以在基于人群的大规模研究中筛选最有希望的候选标志物。meTSPYL5已被纳入先前的多靶标组合中并显示出有希望的结果。然而,多靶标组合和基于β值的算法面临着获取足够cfDNA体积和血浆中甲基化cfDNA比例稳定性的挑战。因此,本研究使用qMSP来确定meTSPYL5的存在与否,这种方法操作、分析简单,成本低廉且可扩展。
泛癌分析显示,TSPYL5在多种癌症中高甲基化,这与先前关于TSPYL5在胃癌、结直肠癌和胶质瘤中高甲基化和低表达的报道一致。尽管meTSPYL5并非HCC特异性,但其高甲基化差异可以提高检测的灵敏度。未来有必要进一步研究meTSPYL5在鉴别肝脏良恶性疾病中的应用价值。通过在高危人群中检测meTSPYL5,临床医生可能会在HCC更早期、手术切除可行且有效的阶段识别出疾病。使用该检测方法监测HCC术后微小残留病(minimal residual disease, MRD)的临床价值值得进一步研究。此外,由于meTSPYL5在血浆中在所有HCC分期中均被频繁检测到,它也可能成为更早监测复发的一种方式。
然而,本研究仍存在一些局限性。首先,meTSPYL5检测方法需要进一步优化以满足III类体外诊断试剂的注册标准。其次,样本量有限,特别是关于肝炎和肝硬化的病理学数据不足,这降低了对检测方法灵敏度的准确评估以及对这些癌前病变进行进一步协变量分析的能力。需要更大规模的队列研究来验证meTSPYL5标志物用于基于人群的HCC筛查的有效性。第三,需要进行充分和精心设计的进一步研究,以验证其在监测MRD和复发方面的预期应用。
5 结论
异常DNA甲基化在基因表达和HCC癌变中起着至关重要的作用。本研究首次通过整合WGBS和mRNA-Seq数据的分析,识别了全基因组范围的甲基化生物标志物,并通过qMSP验证了meTSPYL5作为HCC检测的潜在血浆生物标志物。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号