基于截断核范数最小化的精准矩阵补全方法预测miRNA-疾病关联

【字体: 时间:2025年08月29日 来源:Briefings in Bioinformatics 7.7

编辑推荐:

  本研究针对miRNA-疾病关联(MDA)预测中计算模型的泛化性不足和算法复杂性问题,开发了AMCMDA模型。通过构建异质网络整合多源相似性信息,采用截断核范数正则化(truncated nuclear norm)和交替方向乘子法(ADMM)优化矩阵补全,显著提升了预测准确性。在HMDD三个版本数据集上的交叉验证显示,AUC值最高达0.9639,案例研究中>95%的预测结果被dbDEMC2.0和HMDD v4.0数据库验证,为疾病机制研究和生物标志物发现提供了高效工具。

  

研究背景与意义

微小RNA(microRNA,miRNA)作为约22个核苷酸的非编码RNA,通过调控mRNA翻译参与细胞增殖、凋亡等关键生物学过程。异常miRNA表达与癌症等疾病密切相关,例如miR-135b在乳腺癌中通过调控LATS2表达破坏细胞周期,miR-21在肺癌中通过EGFR信号通路形成正反馈环路。传统实验方法如qRT-PCR虽可靠但成本高昂,而现有计算模型存在泛化性不足、算法复杂等问题。

关键技术方法

研究团队提出AMCMDA模型,基于HMDD v2.0数据集(含383种疾病与495个miRNA的5430对已知关联),整合疾病语义相似度(SS1/SS2)和miRNA功能相似度(MS),构建异质网络矩阵T。通过截断核范数最小化逼近秩函数,利用ADMM算法分两步迭代求解优化问题,最终获得预测评分矩阵A*。模型在HMDD v1.0/v3.2数据集上同步验证,参数优化采用网格搜索策略。

研究结果

  1. 1.

    模型性能验证

    五折交叉验证(5CV)显示AMCMDA在HMDD v2.0数据集的AUC达0.9118,优于KATZMDA(0.9012)等7种基线模型。局部留一法验证(LOOCV)中,对卵巢癌的预测AUPR达0.3813,验证了模型对新型疾病的预测能力。

  2. 2.

    案例研究

    • 肺癌预测:基于HMDD v1.0预测的hsa-miR-221/222通过调控线粒体凋亡通路促进肿瘤增殖,排名前50的miRNA验证率达100%。

    • 胃癌预测:hsa-miR-21和hsa-miR-155被证实通过调控C/EPBβ和MEK/ERK通路影响化疗敏感性。

    • 卵巢癌预测:对无已知关联的卵巢癌样本预测中,hsa-miR-146a-5p通过抑制CCND2/NOTCH2表达验证了模型实用性。

结论与讨论

该研究通过截断核范数正则化实现了稀疏关联矩阵的高效补全,解决了传统核范数对较大奇异值不敏感的问题。模型在三大数据集和30种疾病案例中验证率>85%,尤其对肺癌、胃癌等恶性肿瘤的预测表现突出。未来可结合深度学习进一步提升跨数据集迁移能力,为miRNA靶向治疗提供新思路。研究发表于《Briefings in Bioinformatics》,相关代码已开源。

(注:全文严格依据原文数据,专业术语如ADMM、GIPS等首次出现时均标注英文全称,作者单位"中国人民大学统计学院"等非英文符号保留原格式,矩阵维度Rnd×nm等上下标使用/标签规范呈现)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号