《BMJ Open Diabetes Research & Care》:Clustering patterns in Finnish type 1 diabetes patients: a nationwide register-based study
编辑推荐:
本研究通过芬兰全国性登记数据(1990-2019年),对16,307例儿童1型糖尿病(T1DM)患者进行时空聚类分析,首次利用完整居住史发现显著的时空聚类现象(特别是6岁以上儿童及北部地区),支持环境触发因素(如病毒感染)在T1DM发病中的作用,为探索病因机制提供了重要流行病学证据。
引言
1型糖尿病(T1DM)是一种慢性自身免疫性疾病,其特征是胰腺中产生胰岛素的β细胞被破坏,导致胰岛素绝对缺乏,需要终身外源性胰岛素治疗。2021年,全球T1DM患者达840万人,其中近150万为儿童和青少年。芬兰是全球T1DM发病率最高的国家之一,2000年至2022年间20岁以下人群的发病率为每10万人年56.8例。
T1DM的发病机制复杂,涉及遗传易感性(尤其是HLA区域)和环境触发因素。自身抗体在发病过程中扮演关键角色,包括抗胰岛素抗体(IAA)、抗谷氨酸脱羧酶抗体(GADA)、抗酪氨酸磷酸酶样蛋白IA-2抗体(IA-2A)和抗锌转运蛋白8抗体(ZnT8A)。这些抗体的出现时间不同:IAA通常在9至24月龄出现,GADA约在3岁出现,而IA-2A和ZnT8A出现较晚。
全球T1DM患病率的上升引发了对环境触发因素的广泛研究。营养因素(尤其是维生素D缺乏)、病毒感染(特别是肠道病毒)以及发病率的季节性模式(秋冬季高发)均被认为是潜在影响因素。卫生假说则提出,童年早期暴露于常见病原体可能对T1DM有保护作用。
以往关于儿童T1DM时空聚类的研究多基于单一居住地点。本研究旨在利用芬兰人群的完整居住史,调查儿童T1DM的空间和时空聚类,并特别分析了生命第一年的居住地点,以探索早期生命暴露的可能作用。
研究设计和方法
T1DM病例通过芬兰社会保险机构根据胰岛素药物特殊报销记录确定。纳入标准为1990年至2019年间诊断的0至<18岁个体。每个病例匹配三个同年龄、同性别的对照,对照的参考日期设定为其对应病例诊断时的年龄。
从芬兰数字和人口数据服务局获取病例和对照从出生到诊断日期(或对照参考日期)的完整居住史。每个地址均被地理编码,并关联到ETRS-TM35FIN平面坐标系下的经纬度坐标(代表住宅建筑位置的质心)。最终数据集包含156,113条居住记录(16,272例病例,48,763例对照),其中92.6%的病例和89.8%的对照拥有完整的居住史坐标和日期。
统计分析在芬兰社会与健康数据许可机构管理的安全远程环境中使用R和Spacestat软件进行。聚类分析采用五种特定方法:完整居住史、生命第一年居住史、诊断时地址、诊断前1年地址和出生时地址。显著性水平设定为p<0.05。
空间聚类分析使用Cuzick-Edwards检验,分析k=5个最近邻案例的分布。由于计算环境限制,主要分析采用1:1病例-对照抽样策略。
时空聚类分析使用Knox检验,评估预设距离(0.25, 0.5, 1, 5, 10 km)和时间(2, 6, 12, 18, 24个月)阈值内的病例聚集性。使用Jacquez's Q统计量(分析k=5和k=15个最近邻)来评估基于完整居住史的时空聚类,包括全局Q(整个研究期间的聚类)、局部Q(个体居住水平聚类)、Qi(个体生命周期聚类)、Qt(特定时间点聚类)和Qit(特定个体特定时间聚类)。由于计算限制,显著性检验仅进行99次迭代。
为处理多重比较问题,对Cuzick-Edwards检验和Knox检验应用了Benjamini-Hochberg(BH)校正。数据集按性别和年龄组(0-5.99岁、6-11.99岁、12-17.99岁)进行分层分析。还对诊断期间只有一个居住地的个体以及按诊断时间段(1990-1999年、2000-2009年、2010-2019年)分层的亚组进行了分析。
结果
最终数据集包含16,307例糖尿病病例和48,914例对照。诊断中位年龄为8.9岁(IQR:5.1-12.5),男性占56.1%。病例诊断显示出明显的季节性趋势,秋冬季诊断的病例比例显著高于夏季。参与者平均居住过2.40个地点,病例的居住地数量略少于对照。
Cuzick-Edwards检验仅在男性病例诊断前1年识别到轻微的空间聚类(观察值/期望值[Obs/Exp]=1.02,95% CI 1.01至1.03,BH校正后p=0.004)。出生时的聚类在男性病例中呈边界显著性(Obs/Exp=1.01,95% CI 1.00至1.03,p=0.08)。按年龄组分层的Cuzick-Edwards检验未发现显著聚类。
Knox检验揭示了在所有测试的时间点(诊断时、前一年、出生时)和几乎所有的距离及时间阈值下均存在显著的时空聚类。当空间阈值扩大到20、50和100 km时,出生时的显著聚类消失。女性病例在不同时间段和距离上表现出比男性病例更明显的聚类。年龄分层分析显示,12-17.99岁年龄组仅在出生时出现聚类,而较年轻的亚组在三个时间点均表现出聚类。在特定诊断时期(1990-1999年和2010-2019年)以及诊断前只有一个居住地的个体中也观察到了聚类。
使用完整居住史的Jacquez's Q统计量显示,在所有亚组中(当分析15个最近邻时)均存在显著的时空聚类。女性和男性的全局Q统计量分别为225,263病例年(p=0.01)和320,107病例年(p=0.01)。两性在个体居住水平(局部Q)也表现出显著聚类,最强的聚类出现在1993年。年龄分层分析表明,年龄较大的儿童聚类更明显。未发现最年轻组(<6岁)存在整体聚类(全局q=67,584病例年,p=0.63),但检测到显著的局部聚类(qit)(n=632, p=0.02)。6-11.99岁和12-17.99岁儿童显示出显著聚类(全局Q分别为226,160和251,191病例年,p=0.01)。最年长组观察到一致的局部聚类,该组聚类峰值在1989年,而6-11.99岁组在2008年。
基于纬度将研究人群分为两个有重叠的亚组(横穿芬兰中部),两个亚组均观察到显著聚类(全局Q值分别为292,091和315,626,p=0.01)。按时间段(1972-2000年和1998-2019年)进行的分析也揭示了聚类现象(全局Q值分别为289,350和251,377,p=0.01),早期阶段的聚类峰值在1993-1995年,后期在2006-2008年。
对生命第一年居住地点的分析显示,仅在人口较稀疏的北部地区(纬度6,765,202–7,775,031)观察到显著聚类(全局Q=38,247,p=0.03),并具有显著的Qi和Qit值。按时间段划分数据集未发现显著聚类。
讨论
本研究利用芬兰儿童和青少年T1DM的详细居住史数据,揭示了显著的时空聚类模式,表明环境因素和早期生命暴露可能影响疾病风险。一个合理的解释是传染性病原体(如肠道病毒)在有限时空范围内的社区传播可能导致易感个体发病。
虽然观察到的T1DM发病率季节性模式(秋冬季高发)与既往研究一致,可能反映了与感染动态相关的已知季节性变异,但本研究的新颖之处在于证明了超越这些预期季节性效应的时空聚类模式。
Cuzick-Edwards检验发现的整体空间聚类有限,效应量较小(Obs/Exp=1.02)。相比之下,结合了时空成分的Knox检验和Jacquez's Q统计量显示出更强、更一致的聚类信号,表明时间和地点共同作用比单纯地理因素在疾病聚集中的作用更大。
Knox检验显示,在所有三个检查时间点,在5公里半径和2年时间窗口内,甚至在更短的距离(如500米)和时间(如6个月)尺度上,均存在显著聚类。在短距离和短时间内聚类最明显,这支持了可传播感染可能导致遗传易感个体局部发病的假说。此外,在12岁以后诊断的儿童其出生地点存在聚类,这与早期生命环境暴露可能启动或调节数年后才显现的自身免疫过程的假说一致。
这些发现与以往T1DM聚类研究结果一致。鉴于早期生命阶段在T1DM病因中的关键作用,对生命第一年暴露的研究有助于阐明其潜在环境机制。有趣的是,生命第一年居住地点的聚类仅出现在人口较稀疏的北部地区,这可能反映了紫外线暴露和维生素D合成的纬度差异、感染动态和病毒传播的区域差异,或环境同质性对局部暴露模式的放大效应。
亚组分析显示两性均存在显著聚类,峰值在1993年。基于完整居住史的分析表明,6岁以上儿童聚类最显著。关于时间趋势,未发现聚类随时间变化的一致证据。Knox检验显示在1990-1999年和2010-2019年诊断的病例中存在显著聚类,但中间年份未发现聚类。完整居住史分析显示聚类最突出的时期是1993-1995年和2006-2008年。
本研究的优势包括利用完整居住史识别与T1DM风险相关的特定时期和地点、全国性覆盖的数据集、大样本量以及多种聚类分析方法的应用。局限性包括安全计算环境的限制(导致1:1抽样和较少迭代次数),以及按纬度和时间段划分数据集可能限制了对更细微聚类模式的检测能力。
结论
本研究发现的T1DM诊断时空聚类和季节性变异支持环境因素在疾病发展中的作用。值得注意的是,在生命第一年(尤其是在芬兰北部地区)观察到了聚类现象。这些结果表明早期生命暴露可能在T1DM发病中起关键作用。未来的研究应调查遗传易感性、社会经济条件或环境暴露等潜在影响因素,以理解驱动所观察到的时空聚类的机制。