
-
生物通官微
陪你抓住生命科技
跳动的脉搏
cfDNAFE:基于多组学特征全面解析循环游离DNA的无创诊断新工具
【字体: 大 中 小 】 时间:2025年06月13日 来源:Methods 4.2
编辑推荐:
研究人员针对循环游离DNA(cfDNA)组织溯源特征提取工具匮乏的现状,开发了集成遗传、表观遗传和片段组学特征的python工具包cfDNAFE。该工具可自动从WGS/WGBS数据提取13类特征谱,包括SBS突变、甲基化标记和OCF值等,在肝癌患者验证中成功识别出片段大小和末端基序的显著差异,为无创诊断模型构建提供一站式解决方案。
在液体活检领域,循环游离DNA(cfDNA)如同血液中的分子"漂流瓶",承载着肿瘤、移植排斥和胎儿发育的关键信息。然而这些碎片化线索的解读面临巨大挑战:尽管全基因组测序(WGS)和全基因组亚硫酸氢盐测序(WGBS)技术能捕获遗传突变、甲基化模式和片段特征等多组学信息,但现有工具如FinaleDB和cfDNApipe功能单一,无法整合最新发现的96-SBS突变谱、肝特异性开放染色质区域OCF值等关键特征。这种技术断层严重阻碍了cfDNA在癌症早筛等场景的临床应用突破。
针对这一瓶颈,中南大学的研究团队在《Methods》发表了创新性研究,开发出目前最全面的cfDNA多组学特征提取工具包cfDNAFE。该工具通过模块化设计整合13类特征分析流程,涵盖遗传变异(CNV、SBS)、表观遗传(77种细胞类型特异性甲基化标记)和片段组学(末端基序、WPS等)三大维度。研究团队利用肝癌患者队列验证显示,cfDNAFE提取的片段大小分布和断裂点基序模式能有效区分肝癌与健康样本,尤其在肝特异性开放区域OCF值差异显著。这项研究为构建高精度无创诊断模型提供了标准化分析框架。
关键技术方法包括:基于比对数据的CNV调用算法、96类单碱基替换(SBS)突变特征分解、Loyfer甲基化图谱标记分析,以及创新性整合片段大小比率(FSR)、窗口保护分数(WPS)等片段组学参数。所有分析均基于EGAS00001003409和EGAS00001001024数据库的肝癌患者WGS/WGBS数据验证。
【设计原理】
cfDNAFE采用三层架构设计:遗传层通过MuTect2检测体细胞突变并分解COSMIC特征谱;表观层量化甲基化片段在特定标记的比例;片段层则创新性融合了方向感知片段化(OCF)分析,能捕捉核小体相位等精细特征。
【验证结果】
肝癌组cfDNA呈现特征性的166bp片段富集和10bp周期性末端基序偏移,与健康组相比,其肝特异性开放染色质区域的OCF值提升2.3倍(P<0.01)。甲基化分析显示肝癌样本在ALB、APOE等标记位点的完全甲基化片段比例异常升高。
【讨论与展望】
该研究首次实现cfDNA多组学特征的"一站式"提取,其模块化架构支持特征组合优化。值得注意的是,个别HCC患者出现甲基化模式异常,提示需结合临床参数解读特征谱。未来通过整合深度学习,cfDNAFE有望推动液体活检进入多模态诊断新时代。
这项获得国家自然科学基金支持的研究,不仅解决了特征提取的技术痛点,更建立了标准化分析范式。其开源特性(https://github.com/Cuiwanxin1998/cfDNAFE)将加速cfDNA在肿瘤早筛、移植监测等场景的转化应用,标志着液体活检技术向系统化、智能化迈出关键一步。
生物通微信公众号
知名企业招聘