综述:机器学习方法预测小分子与微小 RNA 关联的全面综述

【字体: 时间:2025年05月21日 来源:Molecular Diversity 3.9

编辑推荐:

  本综述聚焦微小 RNA(miRNAs)与小分子(SMs)关联(SMAs)预测,阐述 SMAs 数据资源、特征提取方法及相似性度量,梳理 32 种基于机器学习(ML)的预测方法(含经典 ML、深度学习等六类),分析算法应用趋势与性能,为相关研究提供方向。

  

微小 RNA 与小分子关联预测的机器学习研究进展


一、微小 RNA(miRNAs)的生物学意义与研究挑战


MicroRNAs(miRNAs)作为进化上保守的小型调控元件,广泛存在于细胞中,在多种人类疾病的发生和发展过程中被发现存在异常表达。因其在疾病诊断和治疗中的潜力,miRNAs 日益成为备受关注的潜在靶点,小分子(small molecules, SMs)对其抑制作用的研究具有重要意义。然而,SM 与 miRNA 关联(SM-miRNA associations, SMAs)的知识较为匮乏,主要原因在于 miRNA 动态且难以预测的三维结构限制了 SMs 的高通量筛选,而实验确定 SM-miRNA 相互作用成本高昂且耗时费力。

二、机器学习在 SMAs 预测中的应用框架


机器学习(machine learning, ML)作为一种经济高效的平台,为 SMAs 预测提供了新途径。本综述围绕 ML 引导的 SMAs 预测展开多方面探讨:

  1. 数据资源:详细介绍了可用于算法训练的 SMA 数据资源,这些数据是开展 ML 建模的基础。
  2. 特征提取与相似性度量:阐述了针对 SMs 和 miRNAs 的各种特征提取方法及相似性度量手段。通过对分子结构、序列等特征的分析,为后续算法建模提供输入依据。

三、基于机器学习的 SMAs 预测方法分类与总结


目前已开发的 32 种基于 ML 的 SMA 预测方法可分为六大类:

  1. 经典机器学习方法:利用传统的 ML 算法如支持向量机、随机森林等构建模型,对 SMAs 进行预测。
  2. 深度学习方法:借助深度神经网络等模型,自动学习数据中的复杂特征,提升预测性能。
  3. 矩阵分解方法:通过对数据矩阵的分解,挖掘潜在的 SM 与 miRNA 关联模式。
  4. 网络传播方法:基于生物网络结构,将关联信息在网络中进行传播,以预测潜在关联。
  5. 图学习方法:将 SM 和 miRNA 视为图结构中的节点,利用图神经网络等技术捕捉节点间的关系。
  6. 集成学习方法:结合多种算法的优势,提高预测的准确性和鲁棒性。

四、算法应用趋势与性能分析


通过趋势分析,探讨了 ML 算法在 SMA 预测中的使用模式及性能表现。不同方法在特征利用、模型复杂度等方面各有特点,其性能受到数据质量、特征选择等多种因素影响。

五、总结与未来研究方向


本综述概述了最新方法的关键原理,并比较了它们的成果,为基于 ML 的 SMA 预测研究的关键领域提供了有价值的见解。未来研究可进一步优化特征提取方法、开发更高效的算法模型,以推动 SMAs 预测的准确性和实用性,为基于 miRNA 的疾病诊断和治疗提供更有力的支持。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号