
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于毒理基因组学数据的机器学习模型预测药物性脂肪肝发生风险
【字体: 大 中 小 】 时间:2025年07月20日 来源:Toxicology 4.8
编辑推荐:
本研究针对药物性肝损伤(DILI)中的脂肪变性(DIHS)预测难题,创新性地采用支持向量机(SVM)等五种机器学习算法分析Open TG-GATEs数据库的转录组数据,在人类原代肝细胞(PHH)和大鼠模型中分别实现0.820-0.975的ROC-AUC值,鉴定出CYP1A1、PLIN2等关键基因标记,为无动物实验的化学风险评估提供了可解释性工具。
肝脏作为人体最重要的代谢器官,其药物不良反应一直是临床面临的重大挑战。据统计,约27%的药物性肝损伤(DILI)病例伴随脂肪变性(DIHS),这种由药物引发的肝细胞脂肪堆积不仅可能导致肝功能衰竭,更是近年来药物退市的主要原因之一。然而传统诊断依赖侵入性肝活检,动物实验又存在种属差异大、成本高等缺陷,促使科学界寻求更精准的预测方法。
在此背景下,荷兰马斯特里赫特大学毒理学基因组学中心(Florian Caiment团队)联合欧洲ASPIS项目组,在《Toxicology》发表了一项突破性研究。研究人员利用Open TG-GATEs数据库中人类原代肝细胞(PHH)和大鼠模型的转录组数据,系统比较了弹性网络逻辑回归(ENLR)、XGBoost等五种机器学习算法对40种化合物的预测效能。通过1000次自助采样验证,发现支持向量机(SVM)表现最优,在PHH、大鼠离体和在体模型中分别达到0.820、0.975和0.966的ROC曲线下面积(AUC)。
关键技术包括:1)从ASPIS标准化的40种化合物库中筛选TG-GATEs转录组数据;2)采用方差分析和Benjamini-Hochberg校正进行特征选择;3)通过SHAP值解析SVM模型特征重要性;4)使用DAVID数据库进行通路富集分析。
【结果】
数据特征:最终纳入108个样本(人类56个/大鼠52个),涵盖31种致脂肪肝药物和9种阴性对照。
模型性能:SVM在跨物种验证中稳定性最高,其预测准确率比随机森林(RF)平均提升12.3%。
关键基因:
通路分析:
【讨论与结论】
该研究首次证明机器学习模型能捕捉传统差异表达基因(DEGs)分析忽略的转录组特征,如低表达但具有通路协同效应的基因。特别值得注意的是,SVM在人类与大鼠模型间的预测一致性暗示某些脂肪变性机制具有跨物种保守性。
这项成果为欧盟"动物替代安全评估"(ASPIS)计划提供了关键技术支撑,其建立的标准化流程既可扩展至其他毒性终点预测,也能指导制药企业早期筛选潜在致脂肪肝化合物。未来随着单细胞转录组等新数据类型的整合,这类模型有望成为监管毒理学中动物实验替代方案的核心工具。
生物通微信公众号
知名企业招聘