
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Transformer模型的抗糖尿病药物精准选择系统开发与验证
【字体: 大 中 小 】 时间:2025年06月30日 来源:JMIR Medical Informatics 3.1
编辑推荐:
为解决基层医师在糖尿病药物选择中的临床决策困境,东京大学团队开发了基于Transformer架构的机器学习模型,通过分析患者年龄、性别、12项实验室检测指标及用药史的时间序列数据,预测内分泌专家处方模式。该模型在7034例患者数据中实现ROC-AUC 0.993的微平均精度,显著优于LightGBM基准,为改善非专科医师治疗决策提供了智能化工具。
糖尿病全球患者数已达5.29亿,其中60%由基层医师管理,但非专科医师常面临药物选择困境——约30%的2型糖尿病(T2D)患者次年出现糖化血红蛋白(HbA1c)≥8%的恶化情况。药物选择需综合考量胰岛素分泌状态、肝肾功能、肥胖程度等复杂因素,而新型药物如SGLT2抑制剂、替尔泊肽(tirzepatide)的不断上市更增加了决策难度。传统临床决策支持系统(CDSS)虽能规避用药禁忌,却难以模拟专科医师的个体化决策过程。
东京大学医院的研究团队在《JMIR Medical Informatics》发表研究,提出基于Transformer的编码器-解码器模型,通过分析2012-2022年间7034例患者的电子健康档案(EHR),包括年龄、性别、12项实验室指标(如HbA1c、肌酐(Cre))和44种药物处方史,将药物选择建模为多标签分类任务。模型采用每周量化的时间序列处理方式,利用自注意力机制捕捉指标间时空关联,并通过微调(fine-tuning)优化预测性能。
主要技术方法
研究采用Transformer架构处理不规则间隔的EHR数据,将实验室数值和药物类别分别嵌入256维向量空间。模型包含4层编码器(含多头自注意力模块)和4层解码器(含交叉注意力模块),以focal loss处理类别不平衡问题。训练数据按时间跨度分为2年(2020-2021)、5年(2017-2021)和10年(2012-2021)三组,测试集仅采用2022年独立数据。性能评估采用宏观/微观ROC-AUC,并与LightGBM基准对比。
预测性能比较
5年训练数据模型表现最优,微观ROC-AUC达0.993(95%CI 0.992-0.994),宏观ROC-AUC 0.988(0.980-0.993),在44种药物中43种达到预设0.95目标。LightGBM的微观ROC-AUC为0.988(0.985-0.990),显示Transformer的显著优势。值得注意的是,10年数据训练反而降低性能,提示近期处方模式更具参考价值。
药物特异性分析
高频药物如盐酸二甲双胍(metformin hydrochloride)预测ROC-AUC达0.992,而2020年新上市的胰岛素类似物"Insulin lispro Biosimilar 1"因数据稀疏性(仅59例)表现最差(ROC-AUC 0.848)。通过UMAP可视化发现,生物类似药在嵌入空间中呈现聚类趋势,反映模型捕捉到药物间的临床使用关联。
讨论与意义
该研究首次将Transformer应用于糖尿病药物选择,其性能超越既往RNN和序列挖掘方法。模型局限性包括:未整合禁忌症等关键临床因素、单中心数据可能引入偏倚、对少数群体适用性待验证。未来需通过多中心验证、纳入禁忌规则库、结合治疗效果预测模块来提升临床实用性。这项成果为缓解内分泌专科医师短缺问题提供了可行方案,通过数字化传承专家经验,有望显著改善基层糖尿病管理质量。
生物通微信公众号
知名企业招聘