
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于截断核范数最小化的精准矩阵补全方法预测miRNA-疾病关联
【字体: 大 中 小 】 时间:2025年08月29日 来源:Briefings in Bioinformatics 7.7
编辑推荐:
本研究针对miRNA-疾病关联(MDA)预测中计算模型的泛化性不足和算法复杂性问题,开发了AMCMDA模型。通过构建异质网络整合多源相似性信息,采用截断核范数正则化(truncated nuclear norm)和交替方向乘子法(ADMM)优化矩阵补全,显著提升了预测准确性。在HMDD三个版本数据集上的交叉验证显示,AUC值最高达0.9639,案例研究中>95%的预测结果被dbDEMC2.0和HMDD v4.0数据库验证,为疾病机制研究和生物标志物发现提供了高效工具。
研究背景与意义
微小RNA(microRNA,miRNA)作为约22个核苷酸的非编码RNA,通过调控mRNA翻译参与细胞增殖、凋亡等关键生物学过程。异常miRNA表达与癌症等疾病密切相关,例如miR-135b在乳腺癌中通过调控LATS2表达破坏细胞周期,miR-21在肺癌中通过EGFR信号通路形成正反馈环路。传统实验方法如qRT-PCR虽可靠但成本高昂,而现有计算模型存在泛化性不足、算法复杂等问题。
关键技术方法
研究团队提出AMCMDA模型,基于HMDD v2.0数据集(含383种疾病与495个miRNA的5430对已知关联),整合疾病语义相似度(SS1/SS2)和miRNA功能相似度(MS),构建异质网络矩阵T。通过截断核范数最小化逼近秩函数,利用ADMM算法分两步迭代求解优化问题,最终获得预测评分矩阵A*。模型在HMDD v1.0/v3.2数据集上同步验证,参数优化采用网格搜索策略。
研究结果
模型性能验证
五折交叉验证(5CV)显示AMCMDA在HMDD v2.0数据集的AUC达0.9118,优于KATZMDA(0.9012)等7种基线模型。局部留一法验证(LOOCV)中,对卵巢癌的预测AUPR达0.3813,验证了模型对新型疾病的预测能力。
案例研究
肺癌预测:基于HMDD v1.0预测的hsa-miR-221/222通过调控线粒体凋亡通路促进肿瘤增殖,排名前50的miRNA验证率达100%。
胃癌预测:hsa-miR-21和hsa-miR-155被证实通过调控C/EPBβ和MEK/ERK通路影响化疗敏感性。
卵巢癌预测:对无已知关联的卵巢癌样本预测中,hsa-miR-146a-5p通过抑制CCND2/NOTCH2表达验证了模型实用性。
结论与讨论
该研究通过截断核范数正则化实现了稀疏关联矩阵的高效补全,解决了传统核范数对较大奇异值不敏感的问题。模型在三大数据集和30种疾病案例中验证率>85%,尤其对肺癌、胃癌等恶性肿瘤的预测表现突出。未来可结合深度学习进一步提升跨数据集迁移能力,为miRNA靶向治疗提供新思路。研究发表于《Briefings in Bioinformatics》,相关代码已开源。
(注:全文严格依据原文数据,专业术语如ADMM、GIPS等首次出现时均标注英文全称,作者单位"中国人民大学统计学院"等非英文符号保留原格式,矩阵维度Rnd×nm等上下标使用/标签规范呈现)
生物通微信公众号
知名企业招聘