基于Transformer模型的抗糖尿病药物精准选择系统开发与验证

【字体: 时间:2025年06月30日 来源:JMIR Medical Informatics 3.1

编辑推荐:

  为解决基层医师在糖尿病药物选择中的临床决策困境,东京大学团队开发了基于Transformer架构的机器学习模型,通过分析患者年龄、性别、12项实验室检测指标及用药史的时间序列数据,预测内分泌专家处方模式。该模型在7034例患者数据中实现ROC-AUC 0.993的微平均精度,显著优于LightGBM基准,为改善非专科医师治疗决策提供了智能化工具。

  

糖尿病全球患者数已达5.29亿,其中60%由基层医师管理,但非专科医师常面临药物选择困境——约30%的2型糖尿病(T2D)患者次年出现糖化血红蛋白(HbA1c)≥8%的恶化情况。药物选择需综合考量胰岛素分泌状态、肝肾功能、肥胖程度等复杂因素,而新型药物如SGLT2抑制剂、替尔泊肽(tirzepatide)的不断上市更增加了决策难度。传统临床决策支持系统(CDSS)虽能规避用药禁忌,却难以模拟专科医师的个体化决策过程。

东京大学医院的研究团队在《JMIR Medical Informatics》发表研究,提出基于Transformer的编码器-解码器模型,通过分析2012-2022年间7034例患者的电子健康档案(EHR),包括年龄、性别、12项实验室指标(如HbA1c、肌酐(Cre))和44种药物处方史,将药物选择建模为多标签分类任务。模型采用每周量化的时间序列处理方式,利用自注意力机制捕捉指标间时空关联,并通过微调(fine-tuning)优化预测性能。

主要技术方法
研究采用Transformer架构处理不规则间隔的EHR数据,将实验室数值和药物类别分别嵌入256维向量空间。模型包含4层编码器(含多头自注意力模块)和4层解码器(含交叉注意力模块),以focal loss处理类别不平衡问题。训练数据按时间跨度分为2年(2020-2021)、5年(2017-2021)和10年(2012-2021)三组,测试集仅采用2022年独立数据。性能评估采用宏观/微观ROC-AUC,并与LightGBM基准对比。

预测性能比较
5年训练数据模型表现最优,微观ROC-AUC达0.993(95%CI 0.992-0.994),宏观ROC-AUC 0.988(0.980-0.993),在44种药物中43种达到预设0.95目标。LightGBM的微观ROC-AUC为0.988(0.985-0.990),显示Transformer的显著优势。值得注意的是,10年数据训练反而降低性能,提示近期处方模式更具参考价值。

药物特异性分析
高频药物如盐酸二甲双胍(metformin hydrochloride)预测ROC-AUC达0.992,而2020年新上市的胰岛素类似物"Insulin lispro Biosimilar 1"因数据稀疏性(仅59例)表现最差(ROC-AUC 0.848)。通过UMAP可视化发现,生物类似药在嵌入空间中呈现聚类趋势,反映模型捕捉到药物间的临床使用关联。

讨论与意义
该研究首次将Transformer应用于糖尿病药物选择,其性能超越既往RNN和序列挖掘方法。模型局限性包括:未整合禁忌症等关键临床因素、单中心数据可能引入偏倚、对少数群体适用性待验证。未来需通过多中心验证、纳入禁忌规则库、结合治疗效果预测模块来提升临床实用性。这项成果为缓解内分泌专科医师短缺问题提供了可行方案,通过数字化传承专家经验,有望显著改善基层糖尿病管理质量。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号