
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自适应图卷积网络与双特征策略的circRNA-疾病关联预测模型AGDFCDA
【字体: 大 中 小 】 时间:2025年06月06日 来源:Journal of Computational Science 3.1
编辑推荐:
本研究针对circRNA-疾病关联预测中传统实验成本高、现有计算模型特征提取单一的问题,提出AGDFCDA模型,结合全连接神经网络与自适应图卷积网络(AGCN)实现双特征提取,通过五折交叉验证证实其预测性能显著优于现有方法,为疾病机制研究和生物标志物发现提供高效工具。
在生命科学领域,环状RNA(circRNA)因其独特的闭环结构和稳定性成为研究热点。自1976年首次发现以来,科学家们逐渐揭示circRNA作为miRNA海绵、基因调控因子等功能,其异常表达与癌症、阿尔茨海默病等疾病密切相关。然而,传统生物实验的高成本和复杂性严重制约了研究进展。尽管已有基于网络分析(如KATZHCDA、CircWalk)和机器学习(如DMFCNNCD、MAMLCDA)的预测模型,但普遍存在特征提取单一、数据依赖性强的缺陷。
为解决这一难题,中国的研究团队开发了AGDFCDA模型。该研究通过融合circRNA与疾病的多重相似性构建网络,创新性地采用双特征提取策略:先用全连接神经网络降维初提特征,再引入自适应图卷积网络(Adaptive Graph Convolutional Network, AGCN)深度挖掘隐藏信息,最终通过多层感知机实现关联预测。实验基于CircR2Disease数据库的650组人类关联数据(585种circRNA与88种疾病),五折交叉验证显示其AUC等指标显著优于对比模型。案例研究进一步证实,模型预测的circHIPK3、CDR1as等疾病相关circRNA与已有实验证据高度吻合。
关键技术包括:1)基于CircR2Disease数据库构建人类circRNA-疾病关联数据集;2)多相似性融合构建异质网络;3)双特征提取策略(全连接神经网络+AGCN);4)多层感知机分类器优化。
Human circRNA-disease association
研究筛选CircR2Disease数据库中实验验证的650对关联数据,涵盖585种circRNA与88种疾病,为模型训练提供可靠基准。
Evaluation metrics
五折交叉验证显示,AGDFCDA在AUC、AUPR等指标上均超越对比模型,其中AUC达0.987,证实其卓越的预测稳定性。
Conclusion
该模型突破传统单特征提取局限,通过AGCN与神经网络协同挖掘circRNA-疾病关联的深层特征。预测结果可为湿实验提供高置信度候选分子,显著降低研究成本。国家自然科学基金资助(61972226、62472250等)支持的研究成果发表于《Journal of Computational Science》,为疾病机制解析和精准医疗提供新思路。
讨论部分强调,AGDFCDA的创新性在于:1)首次将自适应图卷积应用于circRNA特征学习,增强模型对复杂生物网络的表征能力;2)双特征策略兼顾全局与局部信息,克服单一方法偏差;3)预测结果经多癌症类型验证,展现跨疾病泛化潜力。未来可整合单细胞测序等数据进一步提升预测精度。
生物通微信公众号
知名企业招聘