
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于可解释多尺度特征的circRNA-miRNA精细互作预测模型MFERL及其在疾病机制研究中的应用
【字体: 大 中 小 】 时间:2025年05月10日 来源:BMC Biology 4.4
编辑推荐:
本研究针对circRNA-miRNA相互作用(CMI)预测中存在的模型可解释性不足和分子表征不充分等问题,开发了融合多尺度表征学习和可解释性分析的MFERL模型。通过双卷积注意力机制和对比学习增强特征表达,在三个数据集上AUC达0.9669,较现有方法提升1.82%,为揭示ceRNA网络调控机制提供了新工具。
在生命科学领域,环状RNA(circRNA)与微小RNA(miRNA)的相互作用(CMI)通过竞争性内源RNA(ceRNA)机制调控基因表达,与癌症等疾病密切相关。然而传统实验方法成本高昂且效率低下,现有计算方法面临四大瓶颈:特征信息利用不充分、同质信息聚合缺失、异质信息交互不足以及特征冗余问题。湖南科技大学等机构的研究团队在《BMC Biology》发表研究,提出创新解决方案。
研究团队开发的MFERL模型通过五大技术突破实现性能跃升:1)从序列相似性、CTD(组成/转换/分布)特征、K-mer频率、Doc2Vec分布式表征和Role2Vec图结构特征五个维度提取多尺度特征;2)构建同质图聚合相似节点信息;3)采用双卷积注意力模块进行特征增强;4)设计双线性交互机制学习异质信息;5)引入对比学习优化128维嵌入向量。模型在三个独立数据集上验证,关键创新点通过消融实验证实,其中多特征增强模块对性能贡献最大。
研究结果显示,在Dataset1上MFERL的AUC(0.9669)和AUPR(0.9629)显著优于10种对比方法。通过t-SNE降维可视化显示,模型能清晰区分正负样本;MDA(流形判别分析)证实双卷积注意力模块有效保持特征空间几何关系。案例验证中,预测的Top20未知互作有14对获实验证实,如hsa_circ_0001666/hsa-miR-1184(PMID:35284630)等。特别值得注意的是,在1:10的正负样本比下模型仍保持0.9756的AUC,展现强鲁棒性。
讨论部分指出,MFERL的创新性体现在三方面:首次实现同质/异质信息的协同学习、开发多特征动态增强机制、建立可解释性分析框架。局限性在于负样本选择策略和生物上下文整合不足,未来计划整合疾病-药物等多组学数据构建知识图谱。该研究为解析CMI调控网络提供新范式,相关代码已在GitHub开源,对癌症等疾病的生物标志物发现具有重要价值。
生物通微信公众号
知名企业招聘