基于基因型-表型差异的药物毒性预测新策略:提升临床前模型到人类的转化能力
《Early Human Development》:Drug toxicity prediction based on genotype-phenotype differences between preclinical models and humans
【字体:
大
中
小
】
时间:2025年11月02日
来源:Early Human Development 2
编辑推荐:
本研究针对药物研发中临床前模型与人类之间存在基因型-表型差异(GPD)导致毒性预测不准的难题,开发了一种整合GPD特征与化学性质的机器学习框架。该模型通过分析药物靶点在基因必需性、组织表达谱和网络连通性等方面的种间差异,显著提升了对人类药物毒性的预测效能(AUPRC=0.63),尤其能有效识别神经毒性和心血管毒性等主要临床失败原因,为降低药物研发损耗提供了新思路。
在药物研发领域,一个长期存在的瓶颈问题是临床前研究结果向临床转化的高失败率。据统计,毒性问题是导致药物临床试验失败和上市后撤市的主要原因之一,这不仅造成巨大的经济损失,更可能给患者带来严重危害。究其根源,临床前模型(如细胞系和小鼠)与人类之间存在显著的生物学差异,特别是基因型与表型关系的种间差异,使得基于动物模型的毒性评估往往无法准确预测人类特有的毒性反应。传统毒性预测方法主要依赖化合物的化学性质,如Lipinski五规则等,但这些方法难以捕捉人类特有的生物学特征。因此,开发能够整合生物学差异的新型预测模型成为当务之急。
为了应对这一挑战,浦项科技大学的研究团队在《Early Human Development》上发表了一项创新性研究,提出了一个基于基因型-表型差异(GPD)的机器学习框架,旨在提高人类药物毒性预测的准确性。该研究的核心假设是:临床前模型与人类在药物靶点基因的扰动效应上存在的差异,是导致毒性预测转化失败的关键因素。
研究人员首先构建了一个包含1224个药物的综合数据集,其中434个被定义为高风险药物(包括临床试验失败、上市后撤市或带有黑框警告的药物),790个为已批准且无严重不良事件报告的对照药物。为确保数据质量,研究团队采用了严格的去重策略,排除化学结构相似的药物,并使用Tanimoto相似系数≥0.85作为阈值进行验证。
在技术方法上,该研究主要运用了几个关键策略:首先,从多个公共数据库(如STITCH、ENCODE、gnomAD等)系统收集药物-靶点相互作用、基因必需性、组织表达谱和蛋白质相互作用网络数据;其次,通过计算生物学方法量化三个核心GPD特征——基因必需性、组织表达广度和网络连通性——在细胞、小鼠和人类中的差异;最后,采用随机森林等机器学习算法,整合GPD特征与化学性质构建预测模型,并通过留一法交叉验证、独立数据集测试和时序验证等多种方式评估模型性能。
研究人员发现GPD特征与人类药物毒性存在显著关联。高风险药物在临床前模型中表现出非严重的扰动效应,而在人类中却显示出严重的扰动效应。具体而言,在基因必需性方面,高风险药物在细胞和小鼠中的中位必需性显著低于随机分布,而在人类中则显著高于随机分布。类似趋势也出现在组织表达广度和网络连通性特征上。这表明药物靶点基因在种间的差异性表达和功能确实影响了毒性反应。
将GPD特征与化学性质整合后,模型的预测性能得到显著提升。GPD+化学模型达到了AUPRC=0.629和AUROC=0.752,明显优于单纯使用化学性质的模型(AUPRC=0.500,AUROC=0.632)。特征重要性分析显示,GPD特征的贡献度显著高于化学性质。更重要的是,GPD特征能够识别出118个仅凭化学性质会被误判为安全的危险药物,包括吲哚美辛、文拉法辛和布比卡因等已知具有严重毒性的药物。
该模型特别擅长识别神经毒性、心血管毒性和胃肠道毒性等导致药物研发失败的主要毒性类型。对于神经毒性和精神毒性药物,GPD+化学模型预测的毒性概率显著高于单纯化学模型。功能富集分析显示,与这些毒性类别相关的GPD基因集显著富集在神经系统功能、心血管发育等生物学过程中,从机制上解释了模型的有效性。
与现有最先进的毒性预测模型相比,GPD模型在多个指标上均表现出优越性能。在独立数据集(SIDER和ADReCS)上的测试进一步证实了模型的泛化能力。特别值得一提的是,时序验证结果显示,模型能够基于1991年之前的药物信息,成功预测之后实际撤市的21种药物中的20种,准确率达95%,证明了其在真实世界场景中的实用价值。
这项研究通过整合临床前模型与人类之间的基因型-表型差异,开发了一个新颖且高效的药物毒性预测框架。研究结果表明,GPD特征能够有效捕捉传统化学性质方法难以发现的人类特异性毒性信号,特别是在神经毒性、心血管毒性等关键领域表现出色。
该研究的创新点在于首次系统性地将种间生物学差异量化为可计算的特征,并证明这些特征对改善药物安全性评估具有重要价值。GPD框架不仅提供了一个实用的预测工具,更重要的是为理解药物毒性发生的生物学机制提供了新视角。
然而,研究也存在一定局限性,其中最主要的是对药物-靶点相互作用数据库完整性的依赖。那些未被GPD模型识别的高风险药物,往往缺乏足够的靶点注释信息。随着人工智能技术在药物-靶点相互作用预测方面的进步,以及多组学数据的不断积累,GPD框架有望得到进一步完善。
从转化医学的角度看,这项研究为药物研发早期阶段的安全性评估提供了有力工具。通过识别具有潜在毒性风险的新药候选物,该模型有助于在进入成本高昂的临床试验前进行更有效的筛选,从而降低研发损耗,提高患者安全性。
研究人员还提供了用户友好的预测脚本,使得药物研发人员能够方便地将该框架应用于实际工作中。这种从基础研究到实际应用的完整闭环,增强了研究成果的实用价值和影响力。
总之,这项研究通过创新的机器学习方法,成功解决了药物毒性预测中的关键挑战,为提升药物研发成功率和保障患者安全做出了重要贡献。随着更多生物学数据的积累和算法的优化,GPD框架有望在个性化医疗和精准药物开发中发挥更大作用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号