基于集合覆盖算法优化循环肿瘤DNA测序面板:结直肠癌早期检测的靶向基因筛选新策略

《Scientific Reports》:A set cover algorithm identifies minimal circulating tumour DNA sequencing targets for colorectal cancer detection

【字体: 时间:2025年11月21日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对循环肿瘤DNA(ctDNA)检测中因测序深度不足导致的早期癌症漏检难题,开发了OPTIC(Oncogene Panel Tester for Identifying Cancers)生物信息学流程。通过集合覆盖算法从2,940例结直肠癌(CRC)样本中筛选出APC、TP53、KRAS等9个核心基因的热点突变区域,构建仅10,975碱基的微型测序面板,覆盖96.3%的病例。该面板可实现超高深度测序(理论深度>72,000×),显著提升ctDNA检测灵敏度,为低成本、高精度的液体活检技术开发提供新范式。

  
结直肠癌(Colorectal Cancer, CRC)是全球范围内高发的恶性肿瘤,尽管在高收入国家老年人群中的发病率有所下降,但在发展中国家和年轻人群(≤50岁)中呈现显著上升趋势。早期诊断是改善预后的关键,然而传统的内镜筛查具有侵入性且成本高昂。循环肿瘤DNA(circulating tumour DNA, ctDNA)检测作为一种非侵入性的液体活检技术,通过血液样本即可捕捉肿瘤释放的DNA片段,为癌症早期诊断带来革命性机遇。但这一技术面临严峻挑战:早期患者ctDNA在血液中的含量极低(常<0.1%),且测序过程中的背景噪音可能掩盖真实突变信号。
为解决上述问题,来自新西兰奥塔哥大学的Kit Moloney-Geany、Michael J. Dunnet等研究人员在《Scientific Reports》发表了题为“A set cover algorithm identifies minimal circulating tumour DNA sequencing targets for colorectal cancer detection”的研究。他们开发了一套名为OPTIC(Oncogene Panel Tester for Identifying Cancers)的生物信息学流程,通过数学建模与大数据分析,旨在设计一款超高效率的ctDNA测序面板,以最低的测序成本实现最大化的肿瘤检出率。
关键技术方法概述
研究团队利用公共数据库(TCGA、DFCI、MSK-IMPACT)获取2,940例CRC样本的体细胞突变数据,采用集合覆盖算法(贪婪算法)筛选关键基因;通过分层聚类区分高突变型(hypermutated)与非高突变型(non-hypermutated)肿瘤;结合COSMIC癌症突变目录过滤非驱动突变,并整合cBioPortal热点突变区域(如BRAF V600E、KRAS codon 12/13)缩小靶区;最终通过外部数据集验证面板覆盖率。
研究结果
1. 结直肠癌突变图谱与分子分型
通过对805例TCGA样本进行分层聚类,成功将结直肠癌分为高突变型(130例,多具微卫星不稳定性MSI)和非高突变型(675例,染色体不稳定性CIN为主)。
2. 集合覆盖算法优化基因选择
贪婪算法分析显示,非高突变型CRC中APC、TP53、KRAS、BRAF、NRAS、ARID1A和PIK3CA这7个基因可覆盖90.1%的样本;高突变型中ACVR2A、BRAF、APC、RNF43和CTNNB1可覆盖全部样本。突变模式分析揭示KRAS/NRAS/BRAF互斥、APC/CTNNB1互斥等典型通路特征。
3. 热点突变区域压缩面板尺寸
针对KRAS、BRAF、NRAS等基因,仅覆盖已知热点区域(如ACVR2A c.1310del、RNF43 c.1976del)即可保留95%以上突变信息。基因大小与覆盖率权衡分析后,剔除ARID1A(靶区过大且贡献率低),最终面板包含APC、TP53、KRAS、BRAF、NRAS、PIK3CA、CTNNB1、RNF43和ACVR2A共9个基因。
4. 多数据集验证面板效能
在DFCI(619例)和MSK-IMPACT(1,516例)数据集中的验证显示,九基因面板覆盖率分别为89.5%和96.3%。深度测序数据(JNCI数据集)进一步证实,测序深度不足是早期数据集覆盖率偏低的主因,优化后面板理论上可实现>72,000×平均测序深度。
5. OPTIC在其他癌种的应用探索
在乳腺癌(BIDC)和肺腺癌(LADC)中应用OPTIC,发现TP53、PIK3CA、ESR1等基因可覆盖80%以上样本,但覆盖率低于CRC,提示部分癌种需结合多组学标志物(如拷贝数变异)提升检测灵敏度。
结论与展望
本研究通过OPTIC流程设计的九基因微型面板,仅用10,975碱基即可覆盖结直肠癌关键驱动突变,为ctDNA检测提供了“小而精”的解决方案。该策略显著降低测序成本,使超高深度测序与分子条形码(Unique Molecular Identifiers, UMI)技术易于实施,从而提升低频突变检测精度。此外,OPTIC的模块化设计可适配多癌种研究,为液体活检技术在临床筛查、疗效监测及预后评估中的广泛应用奠定基础。未来工作需在前瞻性临床试验中验证该面板在早期患者血浆样本中的实际灵敏度,并探索其与甲基化、片段组学等多模态数据的整合潜力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号