GLP-1受体激动剂与抑郁症风险:一项针对超重或肥胖2型糖尿病成年患者的新使用者主动对照队列研究
【字体:
大
中
小
】
时间:2025年09月30日
来源:DIABETES OBESITY & METABOLISM 5.7
编辑推荐:
本刊推荐:本研究通过新使用者主动对照设计,比较GLP-1受体激动剂(GLP-1 RAs)与SGLT2抑制剂(SGLT2is)在超重或肥胖2型糖尿病(T2D)患者中的抑郁症发生风险。结果显示,GLP-1 RAs使用与抑郁风险显著增加相关(HR 1.09),绝对风险差异达2.2%,且在≥65岁人群中更为明显(HR 1.15)。值得注意的是,GLP-1 RAs同时显著降低全因死亡率(HR 0.74)。研究强调需在临床实践中权衡代谢获益与精神风险,加强监测与医患共同决策。
胰高血糖素样肽-1受体激动剂(GLP-1 RAs)已成为2型糖尿病(T2D)和肥胖治疗的基石药物,其临床应用正在迅速扩展。然而,其临床成功背后一直伴随着对潜在神经精神副作用的担忧,特别是抑郁和自杀风险。目前的证据存在矛盾,一些病例系列研究和大型研究的结果不一致,导致临床医生在评估风险时存在不确定性。
先前研究的不一致性可能源于关键的方法学问题。一些研究存在适应症混淆,将GLP-1 RA使用者与非使用者进行比较,而这些非使用者本身具有不同的风险特征。其他研究则受限于使用缺乏关键混杂因素(如BMI或实验室数据)的索赔数据,将人群限制在特定年龄组,或使用不一致的精神病学结果定义。尽管抑郁与焦虑具有高度共病性,但本研究选择聚焦于新发抑郁,这背后有特定且生物学上合理的理由。虽然监管讨论通常围绕自杀风险展开,但新出现的快感缺失报告提示了一个更集中的研究方向。快感缺失是重度抑郁的一个核心标准,并且与大脑奖赏回路有直接的神经生物学联系,而这正是所研究的GLP-1受体表达的部位。此外,从临床角度来看,它是一个更明确的终点,因为持续性焦虑通常是抑郁发作的前兆。
为了解决这一临床不确定性,本研究采用了严谨的新使用者、主动对照设计,将GLP-1 RAs的新使用者与开始使用钠-葡萄糖协同转运蛋白2抑制剂(SGLT2is)的患者进行比较。这两种药物类别都适用于相似的2型糖尿病和超重或肥胖成人人群,临床前动物研究表明每种药物都可能影响情绪。此外,即使这些广泛使用的疗法带来的风险增加很小,也可能产生重大的公共卫生影响。因此,本研究的主要目标是严格量化GLP-1 RAs和SGLT2is新使用者之间新发抑郁的比较风险,并将这些发现转化为临床相关的指导。我们旨在提供证据,为监测方法和患者-提供者关于当代心脏代谢护理中风险-获益考虑的讨论提供信息。
这项回顾性队列研究使用TriNetX研究网络进行,这是一个联邦化平台,提供来自广泛医疗机构的去标识化电子健康记录(EHRs)的访问。这些机构主要是美国的医院系统。该数据库的一个关键优势在于其包含全面的实验室数据,这对于详细的协变量调整至关重要。研究方案获得了中山医学大学机构审查委员会的批准(案号:CS2-25111)。我们采用了新使用者、主动对照设计,以尽量减少选择偏倚和适应症混淆。本研究遵循加强流行病学观察性研究报告(STROBE)指南进行。
我们从2016年1月1日至2024年7月1日期间的TriNetX数据库中确定了一个患者队列。研究人群包括患有新发2型糖尿病诊断并同时存在超重或肥胖的成人(年龄≥18岁)。为了最大限度地提高识别潜在病例的敏感性,新发T2D诊断定义为首次出现国际疾病分类第十版临床修改(ICD-10-CM)T2D代码(E11)或糖化血红蛋白(HbA1c)值大于等于6.5%。类似地,超重或肥胖定义为存在肥胖的ICD-10-CM代码(E66)或记录的体重指数(BMI)大于等于25 kg/m2。如果患者有情绪障碍既往史(由ICD-10-CM代码F30–F39定义)或有任何抗抑郁药处方记录,则被排除。
暴露组包括GLP-1受体激动剂(GLP-1 RAs)的新使用者,主动对照组包括钠-葡萄糖协同转运蛋白2抑制剂(SGLT2is)的新使用者。为确保队列由未接受过治疗的患者组成,一个关键的纳入标准是起始处方必须是患者有记录以来首次开具的任何降糖药物处方。该首次处方的日期被定义为索引日期。具体的合格药物包括GLP-1 RA队列中的替尔泊肽、司美格鲁肽或利拉鲁肽,以及SGLT2i队列中的卡格列净、达格列净或恩格列净。该初始处方必须在患者符合资格的T2D诊断后的3个月宽限期内开具。最后,为确保基线时的队列纯净性,执行了相互排除标准:GLP-1 RA队列中的患者在前3个月的随访期内不得接受SGLT2i处方,反之亦然。
为减少混淆并近似随机化效果,我们进行了1:1倾向评分匹配(PSM)。匹配模型中包含了一套在索引日期前一年测量的基线协变量。这些协变量包括人口统计学特征(年龄、性别、种族、民族)、社会地位和药物依从性的代理指标、预先存在的精神和身体合并症(例如,慢性肾脏病、心血管疾病、肝脏疾病)、伴随用药情况(例如,非抗抑郁精神药物、抗心律失常药、皮质类固醇)、医疗保健利用模式以及关键的实验室值,包括分层BMI、HbA1c、甘油三酯和低密度脂蛋白(LDL)胆固醇。协变量和相应代码的详细信息见附表。
主要结局是新发抑郁的复合终点,定义为由特定的ICD-10-CM代码(F32, F33.0, F33.1, F33.2, F33.8,排除缓解期代码)诊断或开始使用新的抗抑郁药物(ATC代码N06A)。选择该复合定义是为了通过捕捉正式诊断的抑郁和那些接受了治疗但未输入正式诊断代码的病例来提高敏感性。结局在索引日期后1个月至1年的随访期内进行评估。设置了一个月的滞后期以降低易感性偏倚的风险,因为DSM-5-TR中重度抑郁发作的诊断标准要求症状至少持续2周。由于在TriNetX平台上无法进行正式的死亡竞争风险分析,全因死亡率被单独分析,并与新发抑郁一起作为复合次要结局进行分析。此外,抑郁诊断和抗抑郁药使用也作为次要结局分别进行分析。
PSM后,比较匹配队列的基线特征以评估平衡性。主要分析比较了两组之间一年内的新发抑郁风险。患者在最后一次记录事实时被删失。我们使用Cox比例风险模型计算风险比(HRs)和95%置信区间(CIs),并使用累积发生率曲线可视化概率,差异使用对数秩检验进行评估。评估了比例风险假设。我们还计算了E值以估计未测量混杂的潜在影响。E值量化了一个未测量混杂因素需要与暴露和结局都具有多强的关联才能完全解释所观察到的效应。为了从汇总的生存数据中获得可解释的效应测量值,我们使用IPDfromKM包从Kaplan-Meier曲线重建了个体患者数据(IPD),从中我们估计了限制性平均生存时间(RMST)并使用RMST差异总结了组间效应。为了可视化与比例风险的偏离,我们拟合了灵活的基于样条的模型(Royston–Parmar)以得出时变风险比(方法部分有详细说明)。缺失数据由TriNetX处理,未进行插补。
进行了一系列预先设定的敏感性分析以评估我们研究结果的稳健性。一项关键的敏感性分析旨在更接近地模拟目标试验,放宽了相互排除要求。在该分析中,患者根据其初始处方被分配到一个队列,并在该队列中进行分析,无论前3个月内随后的药物变化如何。其他敏感性分析包括:使用具有不同随访时间窗的里程碑分析;要求有先前的医疗就诊记录;将队列进入日期改为2014年;将宽限期缩短至2个月;以及纳入不论体重状况的T2D患者。我们还在未匹配的队列中进行了分析,并实施了阴性对照结局分析。最后,我们在2025年9月12日进行了额外分析:一项排除了在我们队列中罕见但公认的禁忌症患者,包括有终末期肾病(ESRD)史、透析或是在T2D和/或肥胖诊断前1年内怀孕(ICD-10-CM代码N18.6, Z99.2, Z49, O00–O9A, Z3A, Z33, Z34, Z36;当前 procedural terminology代码1012740)。另一项分析包括了一个常用且治疗谱与SGLT2抑制剂相似的对照组:起始使用二肽基肽酶-4(DPP-4)抑制剂(ATC代码A10BH)的患者。根据年龄(≥65岁 vs. <65岁)、性别、既往精神病史和特定的GLP-1 RA药物进行了亚组分析,交互作用p值根据汇总数据估计。所有分析均使用R软件及Evalue、survival、rstpm2、survRM2和metafor包进行。
从TriNetX研究网络初始的148,793,412名患者池中,我们识别出在2016年1月1日至2024年7月1日期间新诊断为2型糖尿病且超重或肥胖的5,557,771名成人(年龄≥18岁)。应用排除标准后,包括既往使用糖尿病药物以及有情绪障碍或抗抑郁药使用史,我们识别出31,056名GLP-1 RAs新使用者和50,847名SGLT2is新使用者,他们在符合资格的诊断后3个月内开始治疗。经过1:1倾向评分匹配后,建立了两个各包含25,704名患者的均衡队列用于主要分析。
匹配前,两组之间存在显著差异。GLP-1 RA使用者平均年龄更大(平均年龄60.1岁 vs. 54.6岁),更可能是男性(62.1% vs. 43.4%),并且基线BMI显著更高(37.1 ± 8.12 vs. 32.7 ± 6.71)。此外,他们患有众多心脏代谢合并症的 prevalence 更高。经过倾向评分匹配后,GLP-1 RA和SGLT2i队列的基线人口统计学和临床特征得到了很好的平衡。所有测量协变量的绝对标准化均数差(aSMDs)都远低于常规的0.1阈值。在匹配队列中,平均年龄约为56.8岁,组间性别分布几乎均等(GLP-1 RA中男性占48.6% vs. SGLT2i中49.2%)。随访时间相当,两组的中位随访时间均为365天。平均随访时间也相似,GLP-1 RA队列为291.8天,SGLT2i队列为274.3天。
在一年的随访期内,与使用SGLT2is相比,使用GLP-1 RAs与新发抑郁的复合主要结局风险显著更高相关。GLP-1 RA组的发生率为17.0%(4359起事件),而SGLT2i组为14.8%(3802起事件),风险比(HR)为1.09(95%置信区间[CI],1.04至1.14;p = 0.0001)。1年时的绝对风险差异为2.2%(95% CI, 1.5% 至 2.8%)。点估计的E值为1.40,置信区间下限的E值为1.24。抑郁的累积发生率曲线在大约2个月的随访后开始分化,GLP-1 RA组在剩余的一年中始终显示出更高的累积发生率。通过限制性平均生存时间(RMST)分析量化,在一年的随访中,GLP-1 RA组平均无抑郁天数比SGLT2i组少3.3天(差异的95% CI,1.60至5.02天;p < 0.001)。灵活的样条模型显示,时变HR在随访早期上升,持续增加直至大约6个月(第181天),之后在大约1.12的水平稳定直至随访结束。
当分别检查主要结局的组成部分时,GLP-1 RA的使用与新抑郁诊断风险增加(HR 1.12;95% CI, 1.05 至 1.20)和开始使用新抗抑郁药(HR 1.07;95% CI, 1.02 至 1.12)均相关。作为次要结局,与使用SGLT2i相比,使用GLP-1 RA与全因死亡率风险显著降低相关(HR 0.74;95% CI, 0.63 至 0.88;p = 0.001)。
主要发现在一系列预先设定的敏感性分析中基本保持一致。方法学稳健性分析显示,在目标试验模拟(放宽了相互排除)中,抑郁风险增加仍然显著但略有减弱(HR 1.06;95% CI, 1.02 至 1.10)。阴性对照结局分析不显著。延长随访和人群分析证实了我们结果的稳健性。当将随访延长至3年时(HR 1.10;95% CI, 1.06 至 1.15)以及当限制为仅患有T2D而不论体重状况时(HR 1.11;95% CI, 1.07 至 1.16),风险增加持续存在。然而,当限制为有既往电子健康记录的患者时,关联性减弱且不显著(HR 1.03;95% CI, 0.97 至 1.09)。类似地,对早期(2周至2个月)的里程碑分析显示无显著关联(HR 1.05;95% CI, 0.98 至 1.13)。
在亚组分析中,观察到与年龄存在显著的交互作用(交互作用p = 0.028),在老年人(≥65岁)中风险增加更为明显(HR 1.15;95% CI, 1.08 至 1.24),而年轻人(<65岁)中则不明显。未发现性别或既往精神病史存在显著交互作用。在个体GLP-1 RA药物中,利拉鲁肽(HR 1.17;95% CI, 1.09 至 1.25)和司美格鲁肽(HR 1.07;95% CI, 1.01 至 1.13)的关联具有统计学显著性,但替尔泊肽未达到统计学显著性(HR 1.07;95% CI, 0.96 至 1.12)。
在这项针对患有2型糖尿病和超重或肥胖成人的大型、新使用者、主动对照队列研究中,我们发现起始使用GLP-1受体激动剂与起始使用SGLT2抑制剂相比,新发抑郁的相对比率高出9%。需要对此发现进行背景化解读,因为新兴证据表明SGLT2抑制剂和DPP-4抑制剂可能对情绪有潜在的有益影响。因此,我们的研究结果不应解释为GLP-1 RAs具有导致抑郁的绝对风险。鉴于基线抑郁发生率较高(年发生率14.8%),这转化为2.2%的绝对风险差异,以及一年内需要治疗才能造成一例伤害的人数(NNH)为45。随着GLP-1 RAs的使用继续迅速扩大,这种风险在人群层面上可能影响大量患者。虽然许多大规模随机对照试验(RCTs)并未将抑郁标记为显著的不良事件,但我们的真实世界数据表明这可能源于试验设计固有的局限性。RCTs通常没有为精神病学终点提供足够的检验效能,并且通常招募经过高度筛选的低风险人群。此外,通过使用主动对照设计并整合基于实验室的协变量,我们的分析比先前依赖非使用者对照或缺乏实验室信息的索赔数据的观察性研究更严格地减少了混杂。
虽然我们的主要发现具有统计学显著性,但其稳健性需要仔细考量。E值为1.4,表明一个与暴露和结局均具有1.4的风险比关联的未测量混杂因素有可能解释所观察到的关联。例如,未测量的患者偏好可能造成选择偏倚。更关注体重的个体可能本身就有抑郁倾向,并且也更可能选择注射型GLP-1 RA而非口服替代品。观察到的风险可能部分归因于这些未测量的患者因素,需要谨慎解读。敏感性分析显示,虽然方向一致,但在某些情景下关联性减弱。例如,要求有既往医疗就诊记录才能纳入使得结果不显著,这表明尽管进行了全面的倾向评分匹配,与医疗寻求行为或潜在健康状况相关的未测量混杂可能仍然存在。此外,风险的时间模式提供了重要线索。从2周至2个月的里程碑分析不具有统计学显著性,表明风险差异并非在治疗起始后立即出现。
我们对时变风险比的分析表明,抑郁风险并非恒定。HR持续增加直至约6个月,然后稳定在1.12左右。这种动态变化表明在前6个月内存在一个风险升级期。这种时变模式,即GLP-1 RAs的相对效应随时间变化并可能导致生存曲线交叉,与几项关于类似终点的大型研究结果一致。延迟发作意味着一个复杂的生物心理社会适应的渐进过程,而非急性药物反应。虽然我们无法厘清这些通路,但我们的发现表明这种关联超出了对中枢情绪回路的直接药理作用。
亚组分析提供了进一步的细微差别,揭示了与年龄的显著交互作用。抑郁风险增加在老年人(≥65岁)中更为明显,这是一个脆弱人群,抑郁的临床和功能后果可能尤其严重。这一发现突出表明了一个可能受益于加强临床警惕的特定亚组。该关联在个别药物利拉鲁肽和司美格鲁肽上具有统计学显著性,但在替尔泊肽上未达到显著性。最近一项药物警戒研究也报告了药物特异性对抑郁的影响。尚待确定替尔泊肽的双重肠促胰岛素机制,涉及葡萄糖依赖性促胰岛素多肽(GIP),是否赋予其与纯GLP-1 RAs不同的神经精神效应。然而,由于亚组分析中统计效能降低的可能性,应谨慎解释此观察结果。鉴于其日益增长的临床采用,未来需要针对替尔泊肽的头对头研究来阐明其潜在的差异效应。虽然我们的主要分析表明与抑郁发生率较高相关,但一项次要分析也发现,与使用SGLT2i相比,使用GLP-1 RA与全因死亡率降低26%相关。这一观察结果与心血管结局试验的发现一致。因此,临床医生应考虑GLP-1 RAs在带来已确立的心脏代谢获益的同时,可能存在情绪相关变化的风险。
这些发现对临床实践具有直接意义。遵循不伤害原则,临床医生在处方GLP-1 RAs时应意识到这种潜在的、 albeit 很小的情绪变化风险。这并非建议停止使用这些高效疗法,而是呼吁采取主动的患者护理方法。这包括进行医患共同决策以讨论潜在的获益和风险的完整谱系,以及实施对情绪症状的常规监测,尤其是在治疗开始后头几个月之后,特别是对老年患者。对于出现令人担忧症状的患者,应考虑及时转诊至精神健康专家。
我们研究的优势包括其大型、真实世界人群以及稳健的新使用者、主动对照设计,这最大限度地减少了关键偏倚。此外,我们对时变风险比的分析捕捉了可能被常规方法遗漏的亚急性效应。然而,我们的研究存在回顾性观察研究固有的局限性。首先,尽管进行了广泛的协变量调整,但来自未测量变量的残余混杂总是可能存在的。其次,我们依赖管理和诊断代码进行结局判定,容易受到错误分类偏倚的影响。第三,在受TriNetX平台限制的分析中,我们无法进行更细粒度的按方案或时变分析,这些分析可能受到治疗中止或转换的影响。此外,由于实验室数据不是前瞻性收集的,无法基于此类测量进行分层分析。第四,TriNetX中的病例主要来自美国的医疗中心,并且我们专注于患有共病T2D的超重或肥胖患者。因此,其普适性推广到其他人群或单纯肥胖患者是有限的。另外,因为我们在索引日期排除了其他降糖药物(例如,二甲双胍)的联合起始用药以增强内部有效性,我们研究结果对真实世界实践中典型联合治疗的适用性也可能有限。
在真实世界环境中,与SGLT2i相比,起始使用GLP-1 RA与新发抑郁的风险小幅但统计学显著增加相关,这种效应在亚急性期和老年人中最为明显。必须仔细权衡这一风险与GLP-1 RAs带来的显著死亡率获益。未来的研究应旨在识别其他潜在易感亚组,并通过前瞻性队列研究和实用性随机对照试验探索连接GLP-1 RA治疗与情绪的生物心理社会机制,例如体重减轻的速度和幅度。持续整合真实世界证据,包括独立的荟萃分析,对于完善临床实践指南至关重要。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号