
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于跨读预测的FDA标记药物诱导心脏毒性风险分级研究:大规模人类药物参考列表的精细分类
【字体: 大 中 小 】 时间:2025年07月28日 来源:In Silico Research in Biomedicine
编辑推荐:
为解决药物诱导心脏毒性(DICT)导致的药物研发失败问题,研究人员开展了一项结合分子特征与结构相似性特征的机器学习研究。通过开发多种ML模型(包括SVC和LR),利用FDA提供的DICTrank数据集(1318种药物),实现了0.105-0.553的MCC验证结果。该研究创新性地将跨读(RA)衍生的结构相似性特征与传统QSAR结合,为早期药物心脏安全性评估提供了高效可靠的in silico预测工具,对降低药物研发成本及临床风险具有重要意义。
药物研发领域长期面临药物诱导心脏毒性(DICT)导致的高昂失败率,过去40年约10%的药物因心血管安全问题撤市,包括罗格列酮等明星药物。更严峻的是,即使加强检测手段,DICT相关撤市率仍呈上升趋势,这不仅造成巨大经济损失,更威胁患者安全。传统方法依赖生物实验数据,但数据稀缺且机制复杂,亟需发展新型预测策略。
印度医学研究委员会(ICMR)资助的研究团队在《In Silico Research in Biomedicine》发表创新成果。研究人员采用FDA发布的DICTrank数据集(1318种药物),通过PubChem和DrugBank获取分子结构,使用alvaDesc软件计算461种描述符,经冗余筛选后保留120个关键特征。采用随机森林(RF)和最大判别特征(MDF)方法分别选择13个分子特征和3个结构相似性特征,构建支持向量机(SVC)和逻辑回归(LR)等8种机器学习模型。通过20次5折交叉验证和1000次洗牌拆分验证模型稳健性,并应用SHAP分析解读特征贡献。
研究结果显示:
该研究突破性地将跨读原理融入QSAR框架,首次证明仅需3个结构相似性特征即可实现与13个分子特征相当的预测效能。相较于Seal团队此前最高0.47的MCC值,本研究将性能提升至0.553。方法学创新在于:一是建立RA函数量化分子特征协同效应;二是开发gm_class二元描述符消除预测模糊性;三是通过s1m系数识别活性悬崖化合物。这些进展为监管机构提供了可解释性强、数据需求低的评估工具,尤其适用于早期药物筛选。未来可进一步整合生物相似性和作用机制(MoA)特征,构建多维度预测体系,推动心脏毒性评估进入精准化时代。
生物通微信公众号
知名企业招聘