
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于图同态的进化约束下转移性癌症与病毒暴发传播历史解析新方法
【字体: 大 中 小 】 时间:2025年08月29日 来源:Nature Communications 15.7
编辑推荐:
本研究针对病毒传播和癌症转移过程中高度变异基因组群体的进化迁移路径重建难题,创新性地应用图同态(graph homomorphism)理论框架,开发了SMITH算法系统。研究揭示了系统发育树与迁移树拓扑关系的数学约束条件,通过采样一致性树构建加权共识图,在HCV暴发和卵巢癌转移数据中实现了传播链路的精准推断,为分子流行病学和肿瘤进化研究提供了通用计算工具。
在生命科学领域,病毒暴发和癌症转移本质上都是高度变异群体在进化压力下的空间扩散过程。尽管高通量测序技术已能捕获单细胞水平的基因组变异,但如何从系统发育树(phylogenetic tree)中准确重建传播或迁移的历史路径,仍是困扰研究者的核心难题。传统方法面临三大挑战:系统发育树不能直接等同迁移树、解空间庞大导致计算困难、生物真实性难以平衡。
这项发表于《Nature Communications》的研究开创性地引入图论中的同态映射概念,将病毒宿主间传播和肿瘤组织间转移统一建模为从系统发育树到迁移树的数学映射问题。通过定义标签特异性(label-distinctive)、凸性(convex)和紧致性(compact)三类约束条件,首次建立了迁移树与系统发育树拓扑结构的严格数学对应关系。
关键技术方法包括:1)基于FAVITES模拟器生成包含5-30个迁移位点的训练数据集;2)开发动态规划算法检测凸同态映射;3)构建整数线性规划(ILP)模型优化紧致性约束;4)采用三种先验树分布(退化分布/无标度树/均匀分布)进行贝叶斯采样;5)对HCV暴发队列和卵巢癌单细胞测序数据验证算法效能。
研究结果呈现四大发现:
结构约束的关键作用:在无约束条件下,84%-100%的候选树与系统发育树兼容,但引入凸性和紧致性约束后,解空间显著缩小。即便真实迁移不完全满足约束,约束条件下的采样仍能提高推断准确性。
算法性能比较:SMITH在模拟数据中f值达0.86-0.94,显著优于MACHINA、Phyloscanner等现有工具(p<10-9)。在逻辑斯蒂模型下性能下降幅度最小,显示更强鲁棒性。
HCV暴发案例验证:针对高度混合的15-19宿主HCV群体,传统Fitch算法产生32%-34%确定性节点但仍含大量假阳性边。SMITH通过无标度树采样获得的共识网络AUC达0.70-0.76,最终解f值提升至0.86-0.94。
癌症转移应用:在卵巢癌患者数据中,SMITH通过5万次采样量化了不同原发部位的迁移数分布。患者1中右侧卵巢(ROv)的迁移数显著低于左侧(p<10-38),患者7中右子宫骶韧带(RUt)的统计证据反驳了先前卵巢起源的假设(p<10-154)。
讨论部分强调,该框架首次将病毒传播与癌症迁移纳入统一的理论体系,其优势体现在:1)突破传统"独立传播"假设,兼容超传播网络;2)无需预先解决多歧分支(polytomy),特别适合癌症数据;3)通过先验分布整合生物学知识。研究建立的图同态数学模型,不仅适用于分子流行病学调查,还可拓展至社交网络信息扩散、马尔可夫模型等更广泛的动态系统逆问题求解。作者指出未来方向包括整合未采样位点处理、循环迁移网络建模,以及开发更高效的非均匀采样算法。这项跨学科研究为理解复杂生物系统的进化动力学提供了全新的数学语言和工具集。
生物通微信公众号
知名企业招聘