基于知识图谱辅助的贝叶斯主动学习框架在HIV-1感染模型中高效发现Top-K基因互作组合

【字体: 时间:2025年08月26日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对哺乳动物系统多基因扰动效应预测中数据集有限、实验成本高的难题,开发了整合SPOKE知识图谱的贝叶斯主动学习框架。研究人员通过批量多样化策略,在HIV-1体外感染模型中系统筛选了356个宿主基因的双敲除组合,成功鉴定出显著抑制病毒增殖的基因互作对。该工作首次实现了知识图谱信息与批量实验设计的融合,为功能基因组学和病毒-宿主互作研究提供了新范式。

  

在病毒与宿主的永恒博弈中,科学家们一直试图通过基因编辑技术揭示宿主因子在病毒感染中的关键作用。然而,面对人类基因组约2万个蛋白编码基因,仅双基因敲除的组合就高达108量级,传统实验方法如同大海捞针。更棘手的是,具有协同效应的基因互作在自然界中本就稀少,如何在有限的实验预算内高效挖掘这些"黄金组合",成为功能基因组学和抗病毒药物开发领域的重大挑战。

针对这一难题,来自劳伦斯利弗莫尔国家实验室的Braden Soper团队在《Scientific Reports》发表创新研究,开发了知识图谱辅助的贝叶斯主动学习框架。该工作以HIV-1体外感染模型为研究对象,通过整合SPOKE生物医学知识图谱的先验信息,结合创新的批量多样化采样策略,在356×356的基因互作矩阵中成功定位到最有效抑制病毒复制的基因组合。这项研究不仅为抗病毒靶点发现提供了新工具,更开创了知识驱动的高通量基因筛选新模式。

研究团队采用四大关键技术方法:(1)基于Gordon等人提供的HIV病毒载量数据集,包含356个宿主基因的双敲除实验数据;(2)构建核化贝叶斯矩阵分解模型,将SPOKE知识图谱的基因嵌入作为高斯过程先验;(3)开发包含上置信界(UCB)和汤普森采样的混合获取函数;(4)设计基于Frobenius范数的批量多样化算法,通过800规模的候选池优化实验批次设计。

【Bayesian matrix factorization for genetic interaction imputation】

研究首先建立基因互作预测模型,将稀疏的基因-基因互作矩阵分解为低秩潜在因子矩阵。与传统方法不同,该模型通过FastRP算法从SPOKE知识图谱提取基因嵌入特征,构建核化高斯过程先验。结果显示,这种知识图谱整合方式在实验早期阶段(低数据量时)使模型预测准确率提升27%,显著优于直接使用图拉普拉斯算子的传统方法。

【Top-K genetic interaction discovery via kernelized BMF and batch active learning】

如图1所示,主动学习框架通过迭代优化实现Top-K基因对发现。每轮实验后更新后验分布,并采用混合获取函数选择下一批实验。特别值得注意的是,当潜在因子数K=20时,模型能稳定识别EIF3复合物成员与PAF复合物基因(如CTR9、RTF1)的协同作用,这些组合在K=1模型中检出率不足30%,印证了复杂模型对高阶互作的捕捉能力。

【Experimental results】

如图2所示,基于病毒载量数据筛选发现,最优基因组合能将log病毒载量降至8以下(整体分布左尾)。批量多样化策略使实验覆盖率在后期提升42%,而知识图谱先验使早期发现效率提高58%。特别值得关注的是CNOT1-RRM2组合,其通过核糖核苷酸还原酶(RRM2)抑制与转录调控(CNOT1)的双重机制协同抑制病毒复制。

【Discussion】

这项研究开创性地将生物医学知识图谱与主动学习相结合,解决了高通量基因筛选中的"冷启动"问题。SPOKE知识图谱提供的20,000+基因节点和百万级互作关系,有效弥补了实验数据不足时的预测偏差。同时,基于相关性的批量多样化策略突破了传统贝叶斯优化在批次实验中的计算瓶颈。该方法学框架具有广泛适用性,可拓展至合成致死筛选、数量性状位点(QTL)作图等领域。研究发现的多组宿主因子协同作用机制,如EIF3复合物与PAF复合物的协同抑制效应,为开发新型抗HIV联合疗法提供了理论依据。

研究同时揭示了基因互作预测的复杂性边界——当潜在因子数K>20时模型性能趋于饱和,这与SPOKE基因嵌入的奇异值分布特征相符(如图7a所示)。这一发现为后续研究提供了重要的参数优化指导。该工作的开源实现将为功能基因组学研究提供有力工具,推动精准医学时代的多靶点药物开发。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号