基于Transformer模型的抗糖尿病药物精准选择系统开发与验证

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月30日 来源：JMIR Medical Informatics 3.1

编辑推荐：

　　为解决基层医师在糖尿病药物选择中的临床决策困境，东京大学团队开发了基于Transformer架构的机器学习模型，通过分析患者年龄、性别、12项实验室检测指标及用药史的时间序列数据，预测内分泌专家处方模式。该模型在7034例患者数据中实现ROC-AUC 0.993的微平均精度，显著优于LightGBM基准，为改善非专科医师治疗决策提供了智能化工具。

糖尿病全球患者数已达5.29亿，其中60%由基层医师管理，但非专科医师常面临药物选择困境——约30%的2型糖尿病(T2D)患者次年出现糖化血红蛋白(HbA_1c)≥8%的恶化情况。药物选择需综合考量胰岛素分泌状态、肝肾功能、肥胖程度等复杂因素，而新型药物如SGLT2抑制剂、替尔泊肽(tirzepatide)的不断上市更增加了决策难度。传统临床决策支持系统(CDSS)虽能规避用药禁忌，却难以模拟专科医师的个体化决策过程。

东京大学医院的研究团队在《JMIR Medical Informatics》发表研究，提出基于Transformer的编码器-解码器模型，通过分析2012-2022年间7034例患者的电子健康档案(EHR)，包括年龄、性别、12项实验室指标（如HbA_1c、肌酐(Cre)）和44种药物处方史，将药物选择建模为多标签分类任务。模型采用每周量化的时间序列处理方式，利用自注意力机制捕捉指标间时空关联，并通过微调(fine-tuning)优化预测性能。

主要技术方法
研究采用Transformer架构处理不规则间隔的EHR数据，将实验室数值和药物类别分别嵌入256维向量空间。模型包含4层编码器（含多头自注意力模块）和4层解码器（含交叉注意力模块），以focal loss处理类别不平衡问题。训练数据按时间跨度分为2年(2020-2021)、5年(2017-2021)和10年(2012-2021)三组，测试集仅采用2022年独立数据。性能评估采用宏观/微观ROC-AUC，并与LightGBM基准对比。

预测性能比较
5年训练数据模型表现最优，微观ROC-AUC达0.993(95%CI 0.992-0.994)，宏观ROC-AUC 0.988(0.980-0.993)，在44种药物中43种达到预设0.95目标。LightGBM的微观ROC-AUC为0.988(0.985-0.990)，显示Transformer的显著优势。值得注意的是，10年数据训练反而降低性能，提示近期处方模式更具参考价值。

药物特异性分析
高频药物如盐酸二甲双胍(metformin hydrochloride)预测ROC-AUC达0.992，而2020年新上市的胰岛素类似物"Insulin lispro Biosimilar 1"因数据稀疏性(仅59例)表现最差(ROC-AUC 0.848)。通过UMAP可视化发现，生物类似药在嵌入空间中呈现聚类趋势，反映模型捕捉到药物间的临床使用关联。

讨论与意义
该研究首次将Transformer应用于糖尿病药物选择，其性能超越既往RNN和序列挖掘方法。模型局限性包括：未整合禁忌症等关键临床因素、单中心数据可能引入偏倚、对少数群体适用性待验证。未来需通过多中心验证、纳入禁忌规则库、结合治疗效果预测模块来提升临床实用性。这项成果为缓解内分泌专科医师短缺问题提供了可行方案，通过数字化传承专家经验，有望显著改善基层糖尿病管理质量。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号