
-
生物通官微
陪你抓住生命科技
跳动的脉搏
通过使用自动编码器和预测因子的分层集成方法,从临床前扰动筛选中预测基因的必需性和药物反应
《Scientific Reports》:Predicting gene essentiality and drug response from preclinical perturbation screens with layered ensemble of autoencoders and predictors
【字体: 大 中 小 】 时间:2026年06月11日 来源:Scientific Reports 3.9
编辑推荐:
摘要高通量临床前扰动筛选技术通过对疾病模型进行系统的遗传、化学或环境因素扰动测试,因其规模庞大和具有因果关系而展现出在机器学习辅助药物发现方面的巨大潜力。基于此类数据集训练的预测模型可以用于:(i) 推断尚未测试的疾病模型的扰动响应;(ii) 描述影响扰动响应的生物学背景。现有的
高通量临床前扰动筛选技术通过对疾病模型进行系统的遗传、化学或环境因素扰动测试,因其规模庞大和具有因果关系而展现出在机器学习辅助药物发现方面的巨大潜力。基于此类数据集训练的预测模型可以用于:(i) 推断尚未测试的疾病模型的扰动响应;(ii) 描述影响扰动响应的生物学背景。现有的预测模型在可重复性、泛化能力和解释性方面存在不足。为了解决这些问题,我们提出了一种名为“分层自动编码器与预测器集成框架”(Layered Ensemble of Autoencoders and Predictors,简称LEAP)的方法,这是一种通用且灵活的集成策略,能够整合使用多种基因表达表示模型训练得到的预测结果。LEAP在多种建模策略下均显著提升了未筛选细胞系的预测性能(Spearman相关性提升幅度介于1.4%至4.4%之间)。特别是当LEAP应用于针对特定扰动的LASSO回归器(PS-LASSO)时,它在接近最先进性能(基因重要性预测的Spearman相关性为0.321)的同时,还保持了较低的计算时间。我们还提出了一种结合模型精炼和稳定性选择的解释性方法,以识别LEAP中用于扰动响应预测的重要生物学途径。我们的模型有望通过指导临床前实验的优先级排序,并提供关于扰动响应相关生物学机制的见解,从而加速药物发现流程。本研究中使用的代码和数据集均可供公开获取。
生物通微信公众号