
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于图学习与Transformer框架的时序健康事件预测模型GLT-Net研究
【字体: 大 中 小 】 时间:2025年06月06日 来源:Journal of Biomedical Informatics 4.0
编辑推荐:
针对电子健康记录(EHRs)中诊断代码稀疏性、共病关系复杂性及入院记录时序不规则性等问题,研究人员提出融合图学习(GNN)与Transformer框架的GLT-Net模型。通过构建患者关联图与共病关系矩阵增强特征表征,结合时序Transformer捕捉历史入院依赖关系。实验证实该模型在健康事件预测中优于基线方法,为精准医疗提供新范式。
在医疗信息化时代,电子健康记录(EHRs)已成为患者健康数据的核心载体,但其蕴含的时序健康事件预测仍面临三大挑战:诊断代码的稀疏性(超2000种代码出现频次<10次)、共病关系的复杂性(如高血压与心脏病常共存),以及入院记录的不规则时序性(相邻记录间隔36-183天不等)。传统方法如RNN难以捕捉长程依赖,而基于医学知识图谱的方法又存在实体匹配困境。
为破解这些难题,大连理工大学的研究团队开发了GLT-Net模型。该工作创新性地将图学习与Transformer架构结合:首先利用ICD-10编码的层次结构预训练诊断代码嵌入,构建患者关联图生成个体化表征;继而通过共病关系矩阵揭示疾病关联,采用图神经网络(GNN)增强代码表征;最后设计带有时序编码器的Transformer框架处理不规则入院记录,通过自注意力机制量化历史事件影响。研究成果发表于《Journal of Biomedical Informatics》,为疾病进展模式解析提供了新工具。
关键技术包含:1) 基于广东南部精神疾病患者数据库(2016-2022年)构建诊断代码树;2) 无监督学习生成患者初始表征;3) 图卷积网络(GCN)优化共病关系建模;4) 时序Transformer编码器处理变长入院序列。
【研究结果】
结论表明,GLT-Net通过多层次表征学习揭示了疾病进展的时空规律:诊断代码的层次化嵌入(ICD-10)解决了稀疏性问题,GNN构建的共病网络发现高血压与代谢疾病的强关联(相关系数0.68),而时序Transformer突破了传统RNN的长期记忆瓶颈。该框架可扩展至多源医疗数据,其患者轨迹建模方法为慢性病管理提供了新思路。作者Tianci Liu强调,未来将探索跨模态医疗知识图谱与动态图神经网络的结合,以进一步提升预测效能。
生物通微信公众号
知名企业招聘