编辑推荐:
现有代谢物 - 疾病关联预测方法依赖预定义相似性指标和静态网络,难捕复杂相互作用。研究人员提出动态自适应特征学习架构(DAF-LA),经五折交叉验证得 AUC 0.9742 等,为疾病研究提新方向。
在生命科学与医学领域,代谢物与疾病的关联研究一直是热点。代谢物作为参与生物体代谢过程的有机分子或无机离子
[1],其浓度和类型与生物体的生理状态、疾病状况及环境因素密切相关
[2,3]。随着代谢组学的兴起,通过大规模分析代谢物谱来揭示疾病机制成为可能
[4-6]。然而,传统湿实验耗时费力,现有计算方法多依赖静态网络和预定义相似性指标,难以捕捉代谢物和疾病网络中节点邻域的复杂动态相互作用,导致信息丢失和预测性能受限。
为解决这一难题,国内研究人员开展了代谢物 - 疾病关联预测的相关研究。他们提出了一种创新的动态自适应特征学习架构(Dynamic Adaptive Feature Learning Architecture,DAF-LA),相关成果发表在《Computer Methods and Programs in Biomedicine》。该研究旨在通过动态拓扑建模和多尺度协同学习,有效挖掘代谢物与疾病之间的潜在关联,为疾病的预防、早期识别和治疗提供更精准的指导。
研究人员采用了以下关键技术方法:首先构建代谢物相似网络(MN)和疾病相似网络(DN),利用邻接矩阵、疾病 MeSH 数据库和代谢物分子结构等数据;通过局部聚合因子动态调整节点的 k-hop 邻域半径,建立子图生成与节点中心性的拓扑自适应映射;运用边聚合机制获取节点初始特征表示,再将其输入自适应自编码器,通过多头自注意力门控实现局部 - 全局特征的层次融合与细化;最后利用卷积神经网络(CNN)进行预测,生成最终得分矩阵。
结果
- 模型性能评估:通过五折交叉验证对架构进行评估,取得了 AUC 为 0.9742、AUPR 为 0.9734 的优异成绩,同时通过 ROC 和 P-R 曲线进一步验证了模型的有效性。
- 案例研究:案例研究表明,DAF-LA 能够准确预测与阿尔茨海默病、2 型糖尿病和帕金森病相关的代谢物,凸显了该模型在实际疾病研究中的应用价值。
结论与讨论
DAF-LA 通过引入动态子图构建策略和自适应特征增强模块,有效解决了现有方法无法灵活捕捉多尺度结构模式的问题。它能够根据节点的结构特征动态调整邻域范围,在局部和全局信息层面选择性增强关键特征信号,摆脱了对静态图结构的依赖,在处理代谢物 - 疾病网络的稀疏性问题上具有显著优势,更好地反映了潜在的复杂关联模式。此外,模型结合图方法与深度学习方法,既通过邻接关系和相似性关系保留了代谢物和疾病的结构信息,又通过图中节点的非线性映射避免了传统方法可能出现的过度简化问题。该研究为代谢物 - 疾病关联预测提供了新的有效手段,可加快潜在关联的识别,降低传统湿实验中大规模筛选的时间和资源成本,为后续的生物学验证提供更有针对性的指导,在疾病研究领域具有重要的科学意义和应用前景。