
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多源异质网络相似性优化的lncRNA-疾病关联预测模型OS-LDA研究
【字体: 大 中 小 】 时间:2025年05月07日 来源:Computational Biology and Chemistry 2.6
编辑推荐:
为解决现有lncRNA-疾病关联预测模型网络信息单一、相似性计算稀疏性问题,研究人员提出OS-LDA模型,通过整合疾病-lncRNA-基因-miRNA四维网络,创新性引入惩罚因子改进疾病语义相似性计算,并融合多交互谱优化高斯相似性。该模型在十折交叉验证中平均AUC达0.9876,显著优于现有方法,为疾病机制研究提供新工具。
在生命科学领域,长链非编码RNA(lncRNA)如同基因组中的"暗物质",近年被证实与癌症、神经退行性疾病等复杂疾病密切相关。然而,现有预测模型多局限于疾病-lncRNA二元网络,忽视了基因、miRNA等关键分子的调控作用,且传统疾病语义相似性计算存在数据稀疏性缺陷。这些问题导致预测准确性受限,阻碍了疾病分子机制的深入解析。
安徽省研究团队在《Computational Biology and Chemistry》发表的研究中,构建了名为OS-LDA的创新模型。该研究通过四大技术突破实现精准预测:整合疾病-lncRNA-基因-miRNA四维异构网络;融合疾病本体术语与表型特征的新型语义相似性算法;基于惩罚因子的稀疏矩阵校正方法;整合多交互谱的高斯相似性计算。最终通过随机游走重启算法(RWR)在整合网络上实现关联预测。
数据收集
研究整合5339对已知疾病-lncRNA关联数据(190疾病/814 lncRNA),源自多个权威数据库。通过构建四类分子(疾病/lncRNA/miRNA/基因)的相似性矩阵与六种关联矩阵,形成包含10个子网络的异质网络体系。
异质网络构建
创新点在于:疾病相似性网络采用改进的语义相似性算法,结合DAG(有向无环图)结构与表型相关性,通过惩罚因子λ=0.9校正稀疏值;lncRNA相似性网络融合功能相似性与多源高斯交互谱(ηL=0.1);基因与miRNA网络采用类似策略(ηG/ηM=0.1)。
性能评估
十折交叉验证显示,OS-LDA平均AUC达0.9876±0.0021,AUPR为0.9189,显著优于LRWRHLDA等5种对比模型。参数敏感性测试表明,当转移概率PDM=PDG=PDL=0.1且重启概率b=0.3时模型最优。
方法对比
与单网络模型RWRlncD相比,OS-LDA通过多网络整合使预测精度提升12.7%;与矩阵分解方法MFLDA相比,其AUPR提高23.4%,证实异质网络信息融合的有效性。
该研究开创性地构建了四维分子关联预测框架,其核心价值在于:通过惩罚因子解决疾病语义相似性计算中"语义鸿沟"问题;多交互谱融合策略克服单数据源偏差;网络拓扑结构优化使RWR算法收敛效率提升40%。这些突破不仅为lncRNA功能注释提供新范式,更为复杂疾病的多靶点治疗策略开发奠定理论基础。研究团队特别指出,未来可扩展至circRNA等非编码RNA领域,推动精准医学发展。
生物通微信公众号
知名企业招聘