
-
生物通官微
陪你抓住生命科技
跳动的脉搏
iHofman模型:基于加权注意力机制整合高低阶特征预测环状RNA与微RNA相互作用的新方法
【字体: 大 中 小 】 时间:2025年06月10日 来源:BMC Biology 4.4
编辑推荐:
本研究推荐:研究人员针对circRNA-miRNA相互作用(CMI)预测难题,开发了整合FastText序列特征、GraRep结构特征和堆叠自编码器(SAE)的iHofman模型。通过加权注意力机制动态融合多源特征,在三个基准数据集上实现平均AUC 0.9092,26/30预测结果获实验验证,为疾病机制研究和生物标志物发现提供了高效计算工具。
在非编码RNA研究领域,环状RNA(circRNA)因其独特的闭合环状结构和调控功能日益受到关注。这些没有5'帽和3'poly-A尾的RNA分子,曾被认为是剪接副产物,现已被证实能作为"分子海绵"吸附微RNA(miRNA),在骨质疏松、癌症等疾病中发挥关键作用。然而,传统实验方法鉴定circRNA-miRNA相互作用(CMI)存在耗时长、成本高的瓶颈,而现有计算方法多依赖静态特征,难以捕捉动态调控关系。
针对这一挑战,西京大学联合中国矿业大学等机构的研究团队在《BMC Biology》发表了创新性研究成果。该研究开发了iHofman预测模型,通过整合序列、结构和高低阶特征,结合加权注意力机制,实现了CMI的高精度预测。模型在基准数据集上达到82.49%准确率和0.9092 AUC值,26个top预测获文献验证,显著优于现有方法。
研究采用三大关键技术:1)使用FastText提取circRNA/miRNA序列的k-mer特征,GraRep算法构建CMI网络拓扑特征;2)采用堆叠自编码器(SAE)分层提取256维和128维高低阶特征;3)设计加权注意力机制动态融合三类特征,最终通过多层感知机(MLP)分类器预测相互作用。实验基于CMI-9905等三个数据集,包含9905-20208对已验证相互作用。
研究结果部分:
背景:系统梳理了circRNA作为miRNA海绵在基因调控中的作用,指出现有预测方法对动态特征捕捉不足的缺陷。
方法:创新性地将FastText序列嵌入与GraRep图表示学习结合,SAE提取的特征显示高低阶特征分别捕获局部序列模式和全局调控关系。
特征融合分析:比较实验表明2:2:1静态特征比例效果最佳,但加权注意力机制通过动态分配权重(circRNA序列0.41、miRNA序列0.38、结构0.21)进一步优化性能。
模型比较:五折交叉验证显示iHofman在CMI-9905数据集上Acc达83.59±0.31%,显著优于CNN、DNN等基线模型(p=7.359×10-7
)。
案例验证:预测的hsa_circ_0001955与hsa-miR-145-5p
等26对相互作用获实验证实,涉及骨质疏松和肾损伤等疾病通路。
结论与讨论:
该研究建立的iHofman模型首次实现了多模态RNA特征的动态融合,其创新性体现在:1)通过SAE分层提取的64维瓶颈特征有效保留了序列关键信息;2)注意力权重分布揭示circRNA序列特征贡献度最高(41%),与生物学中circRNA作为主要调控分子的认知一致;3)在lncRNA-miRNA数据集上的迁移实验(AUC 0.9149)证明模型具有跨RNA类别的泛化能力。
这项研究为解析非编码RNA互作网络提供了新范式,其预测结果可直接指导实验验证,加速疾病相关circRNA的发现。特别是模型识别的hsa-miR-181c-5p
等miRNA在癌症中已知的调控作用,暗示这些CMI可能成为新的治疗靶点。未来工作可整合单细胞测序数据,进一步提升模型在特定组织中的预测精度。
生物通微信公众号
知名企业招聘