
-
生物通官微
陪你抓住生命科技
跳动的脉搏
探索炎症生物标志物(SII、SIRI、PLR、NLR、LMR)与年轻及早期中年美国成人偏头痛的关联:基于NHANES 1999–2004与机器学习模型的证据
【字体: 大 中 小 】 时间:2025年09月23日 来源:Brain and Behavior 2.7
编辑推荐:
本研究基于NHANES大样本数据,结合多变量逻辑回归与机器学习模型,首次系统揭示淋巴细胞-单核细胞比值(LMR)与偏头痛风险呈显著正相关(OR=1.51, 95%CI: 1.14–2.00),提示LMR可作为偏头痛早期诊断与个性化干预的潜在炎症标志物,为偏头痛的神经免疫机制提供了新的流行病学证据。
偏头痛是一种常见的神经系统疾病,严重影响生活质量,但其病理生理机制尚不明确。本研究旨在探讨美国年轻及早期中年人群中炎症生物标志物与偏头痛患病率之间的关系,涉及的炎症标志物包括系统性免疫炎症指数(SII)、系统性炎症反应指数(SIRI)、血小板-淋巴细胞比值(PLR)、中性粒细胞-淋巴细胞比值(NLR)和淋巴细胞-单核细胞比值(LMR)。
本研究利用美国国家健康与营养调查(NHANES)1999–2004年的数据,采用亚组分析、平滑曲线拟合和多变量逻辑回归评估关联性,并应用Boruta算法和九种机器学习模型识别关键特征,使用SHapley加性解释(SHAP)值解释模型并突出重要特征。
研究发现,偏头痛患者与非偏头痛患者在SII、SIRI、NLR和PLR方面无显著差异,但偏头痛患者的LMR显著较高(平均差:0.37,p<0.001)。多变量逻辑回归分析显示,LMR与偏头痛风险在多模型中呈显著正相关(OR=1.51,95%CI:1.14–2.00,p=0.009),而其他炎症生物标志物未见显著关联。亚组分析进一步证实,LMR与偏头痛风险的正相关在不同分层中保持一致。阈值效应分析显示,LMR与偏头痛风险在达到1.61之前呈稳定线性关系。在九种机器学习模型中,LightGBM模型的AUROC(0.9198)、召回率(93.3%)、F1分数(0.896)和MCC(0.702)均最高。
LMR可能作为评估偏头痛风险的潜在生物标志物,为早期诊断和个性化干预策略提供支持。
偏头痛是一种神经血管性疾病,以反复发作的中重度头痛为特征,是全球致残的主要原因之一,影响约20%的人口。它是50岁以下人群致残的首要原因,女性患病率(21%)显著高于男性(10.7%)。偏头痛可在任何年龄发病,但其发病率从青春期开始逐渐上升,在20–40岁的成年人中达到高峰。该人群的疾病负担尤为沉重,偏头痛会严重影响日常功能、职业生产力和心理健康。从社会经济角度看,研究表明偏头痛患者每年平均损失13.7个生产日。从病理生理学角度看,约3%的患者会发展为慢性偏头痛(每月头痛天数≥15天),这种进展与白质微结构异常和中枢敏化有关,两者均与发作频率呈正相关。这些发现表明神经炎症可能在偏头痛的慢性化过程中起关键作用。
越来越多的证据表明,三叉神经血管轴的神经免疫激活是偏头痛病理生理的核心驱动因素,包括发作性和慢性形式。急性发作的特征是IL-6和TNF-α升高、小胶质细胞激活以及随后的CGRP释放,共同促进中枢敏化和疼痛过敏。为了捕捉这些复杂的免疫血管动态,从常规血细胞计数中得出的综合指数——SII、NLR和PLR——整合了中性粒细胞、血小板和淋巴细胞参数,以成本效益高、广泛可用的方式反映全身免疫激活、凝血变化和血管炎症。它们的诊断和预后价值已在多种环境中得到证实:SII和NLR追踪骨科创伤中的手术侵入性和全身炎症;NLR和PLR区分假体周围感染和无菌性失败;所有三个指数均预测脑血管风险。这类跨学科证据支持它们应用于偏头痛研究,其中炎症-血管相互作用仍未完全了解。
然而,现有研究存在三个主要局限性:(1)大多数研究关注单一指数,缺乏对多种炎症生物标志物的系统比较。(2)研究样本量通常较小(n<2000),限制了结果的普遍性和代表性。(3)对样本选择偏倚和合并症对炎症生物标志物的混淆效应控制不足。因此,进行大规模、系统设计的研究有助于澄清这些炎症生物标志物在偏头痛发病机制和临床评估中的作用。
本研究利用NHANES的代表性样本,探讨偏头痛与几种炎症生物标志物——SII、SIRI、NLR、PLR和LMR——之间的潜在关联,旨在为偏头痛风险的免疫炎症机制提供新的见解,并为早期诊断、风险评估和个性化治疗策略提供坚实的理论和数据驱动基础。
NHANES是一项连续的、具有全国代表性的横断面调查,评估美国人口的营养状况。作为公共卫生监测的基础,所有参与者均提供了书面知情同意,研究方案得到了国家卫生统计中心伦理审查委员会的批准。NHANES采用分层、多阶段概率抽样设计,确保数据具有统计代表性。调查收集了人口统计学、社会经济状况、饮食习惯和健康相关参数等综合信息。
本研究最初合并了四个连续的NHANES周期(1999–2000、2001–2002和2003–2004)的数据,初始样本量为31,126名参与者。为增强内部有效性,我们应用了以下顺序排除标准:(1)年龄 outside 20–40岁(n=23,957被排除);(2)缺失偏头痛相关数据(n=5被排除);(3)缺乏炎症标志物测量(n=2463被排除)。因此,最终分析队列包括3166名参与者。
采用与既定NHANES协议一致的结构化疼痛问卷来确定偏头痛状态。对过去三个月内经历过严重头痛或偏头痛的参与者被归类为患有该疾病。
本研究采用全血细胞计数中的生物标志物,特别是SII、SIRI、NLR、PLR和LMR,这些指标已在多种病理中作为风险分层和预后评估的预测因子得到充分验证。实验室测量来源于NHANES,并按照NHANES实验室程序手册中严格的质量控制协议进行处理。本研究评估了炎症指数与偏头痛风险之间的关系。使用以下公式:
SII =(血小板计数 × 中性粒细胞计数)/淋巴细胞计数
SIRI =(中性粒细胞计数 × 单核细胞计数)/淋巴细胞计数
NLR = 中性粒细胞计数 / 淋巴细胞计数
PLR = 血小板计数 / 淋巴细胞计数
LMR = 淋巴细胞计数 / 单核细胞计数
通过标准化问卷收集了一系列人口统计学和临床属性,如性别、年龄、种族、教育程度、婚姻状况、体重指数(BMI)、贫困收入比(PIR)、C反应蛋白(CRP)水平和估计肾小球滤过率(eGFR),以确定潜在的混淆因素。通过标准化自填问卷获取教育水平、婚姻状况、吸烟状况、饮酒、糖尿病、高血压、冠心病和中风的信息。饮酒状况和吸烟状况根据问卷回答定义。如果参与者对“一生中至少饮用过12酒精饮料?”回答“是”,则被归类为饮酒状况阳性;如果对“一生中至少吸过100支香烟?”回答“是”,则被归类为吸烟状况阳性。采用CKD-EPI方程确定eGFR,并进行CRP的实验室评估。此外,基于有向无环图(DAG)选择横断面分析的协变量。变量选择后,性别、年龄、种族、教育水平、婚姻状况、BMI、PIR、饮酒状况和吸烟状况最终被保留为横断面分析的关键协变量。相比之下,预测建模中保留了所有可用变量。
分析中考虑了复杂的样本策略和相关权重。分类数据以百分比形式提供,连续变量以均值±标准差表示。组间比较中,连续数据采用加权Student's t检验,分类变量采用加权卡方检验。缺失率超过20%的变量(如饮酒)被排除在分析之外。采用多重插补处理其余缺失数据。使用Shapiro–Francia正态性检验评估连续变量的正态性,该检验适用于大样本量且对偏离正态性敏感。此外,通过视觉检查直方图以确认分布模式。显示偏态分布的变量,包括SII、SIRI、NLR、PLR和LMR,在进行统计分析前进行自然对数转换以近似正态分布。鉴于SII、SIRI、NLR、PLR和LMR的偏态分布,进行了自然对数转换以近似正态性,之后将这些指数分为四分位数(Q1–Q4)。
使用加权逻辑回归模型检查偏头痛风险与炎症生物标志物之间的关联,特别是SII、SIRI、NLR、PLR和LMR。未调整模型(模型1)未使用任何变量。模型2调整了年龄、性别和种族,模型3调整了广泛的混淆因素,如性别、年龄、种族、教育水平、婚姻状况、BMI、PIR和吸烟状况。还进行了交互作用和亚组分析。为探索这些生物标志物与偏头痛风险之间的潜在非线性关联,应用了平滑曲线拟合,并利用似然比检验评估非线性。
随后,应用机器学习评估炎症生物标志物对偏头痛的预测能力。使用Boruta算法进行协变量选择,并采用SMOTE欠采样平衡数据集。九种机器学习算法——包括决策树、梯度提升决策树(GBDT)、AdaBoost、LightGBM、逻辑回归、随机森林、朴素贝叶斯、CatBoost和XGBoost——用于构建偏头痛发生的预测模型。数据集随机分为训练集(70%)和测试集(30%)以确保模型泛化能力。在训练集上执行10折交叉验证以优化超参数并减少过拟合。为增强可解释性,使用SHAP量化每个特征的贡献。
所有统计分析均使用EmpowerStats、R、Python(版本3.9.12)和DecisionLinnc1.0软件进行,双侧p<0.05视为具有统计学意义。
本调查代表了52,454,905名参与者,其中13,836,623人患有偏头痛。表1总结了来自NHANES(1999–2004)的年轻和早期中年成年人的基线特征。非偏头痛组和偏头痛组的平均年龄分别为30.26±6.15和30.72±6.06岁,而非偏头痛组的平均BMI为27.05±6.08 kg/m2,偏头痛组为28.69±7.55 kg/m2。与无偏头痛者相比,偏头痛参与者更常为女性,教育水平更高,超重,PIR较低,CRP和eGFR水平升高,且无高血压、糖尿病或中风(所有p<0.05)。偏头痛组的平均LMR值显著高于非偏头痛组(p<0.05)。然而,组间在SII、SIRI、NLR或PLR方面未发现显著差异(所有p>0.05)。
表2详细介绍了各种炎症生物标志物与偏头痛风险之间的关联。我们构建了三个加权逻辑回归模型,逐步调整潜在混淆因素,以评估SII、SIRI、NLR、PLR和LMR与偏头痛风险的关系。在未调整模型(模型1)中,自然对数转换的LMR与偏头痛患病率呈强正相关(OR=2.01,95%CI:1.54–2.60,p<0.001)。在调整了年龄、性别和种族的模型2中,这种关联仍然具有统计学意义(OR=1.51,95%CI:1.14–2.00,p=0.009),并在模型3中进一步调整其他混淆因素后持续存在(OR=1.40,95%CI:1.04–1.86,p=0.041)。相比之下,Ln(SII)、Ln(SIRI)、Ln(PLR)和Ln(NLR)在模型1中未显示与偏头痛风险的显著关联;在模型2和模型3中观察到类似模式(所有p>0.05)。值得注意的是,在模型2(调整了性别、年龄和种族)中,Ln(PLR)Q4显示偏头痛的几率低于Q1(OR=0.72,95%CI:0.55–0.95)。鉴于这些指数的组成性质(PLR=血小板/淋巴细胞;LMR=淋巴细胞/单核细胞),PLR和LMR之间的相反方向可能出现,因为淋巴细胞计数以相反符号进入两个对数比。
亚组分析表明,LMR与偏头痛风险之间的正相关在各种分层中保持一致,包括性别、种族、教育水平、婚姻状况和吸烟状况(所有交互作用p>0.05)。
为了进一步验证我们发现的稳健性,我们使用平滑曲线拟合调整所有混淆因素,探索了全身炎症生物标志物(SII、SIRI、NLR、PLR和LMR)与偏头痛风险之间的潜在非线性关联。此外,我们专门对LMR进行了分段回归和阈值分析。阈值分析表明,Ln(LMR)的增加与偏头痛风险呈强正相关,直至拐点1.61;超过此阈值,关联失去显著性。然而,似然比检验(LLR>0.05)以及初始模型(模型I,p<0.05)中的显著线性效应表明,线性关系最好地描述了LMR与偏头痛风险之间的关联。
基于Boruta特征选择算法,13个变量被确认为重要预测因子,包括性别、eGFR、CRP、高血压、PIR、冠心病、教育水平、LMR、年龄、BMI、种族、糖尿病和婚姻状况,而两个变量(吸烟状况和中风)因重要性不足被排除。
在测试集中,研究评估了九种机器学习模型在预测早期中年和年轻人偏头痛风险方面的性能。考虑到综合指标包括准确度、AUROC、F1分数、MCC、PR-AUC、校准和净临床效益(DCA),LightGBM模型实现了最佳整体性能。它具有最高的AUROC(0.9198)、召回率(93.3%)、F1分数(0.896)和MCC(0.702),以及最低的假阴性率(6.7%)和假阳性率(25.6%)。XGBoost模型排名第二,AUROC为0.9191,召回率略高(93.5%),但精确度和MCC略低。基于以上指标,LightGBM在测试集中表现最佳,适合作为后续解释分析的核心模型。
为了验证模型的泛化能力,进一步对LightGBM模型进行了10折交叉验证评估。在ROC曲线中,所有LightGBM模型都表现出稳定且高的预测能力,AUC范围从0.907到0.979。交叉验证结果证实LightGBM模型具有良好的稳定性和泛化能力。
为了进一步阐明模型对LMR与偏头痛之间关系的理解,对测试集中表现最佳的模型——LightGBM进行了SHAP分析。SHAP摘要条形图显示,性别、eGFR、教育水平和BMI是最有影响力的特征,LMR排名第五,表明其对模型预测的显著独立贡献。SHAP线图和蜂群图都展示了LMR对模型输出的双向影响——较高的LMR值通常与偏头痛风险增加相关。SHAP瀑布图说明了LMR、性别和eGFR等变量在代表性个体中的正负贡献,清晰可视化了LMR对模型决策的具体影响。SHAP热图和力图进一步证实,较高的LMR值对应较大的正SHAP值,表明LMR可能通过促进促炎状态增加偏头痛风险。
本研究探讨了全身炎症生物标志物(SII、SIRI、NLR、PLR和LMR)与偏头痛风险之间的关系,以阐明炎症在偏头痛发病机制中的潜在作用。研究证明LMR与偏头痛患病率呈显著正相关,并且LMR在早期中年和年轻人群中识别偏头痛表现出强大的预测性能。本研究首次调查了这些偏头痛的炎症生物标志物,为早期诊断和个性化管理策略提供了新的理论见解和实证证据。
此处评估的炎症指数已广泛应用于各种情况的预后评估。例如,反映中性粒细胞、血小板和淋巴细胞之间平衡的SII和SIRI已被证明可预测心血管疾病、癌症和自身免疫性疾病的结果。类似地,通过量化先天免疫细胞(中性粒细胞、血小板)和适应性免疫细胞(淋巴细胞)之间的相互作用,NLR和PLR作为全身炎症状态的稳健指标。临床研究已将升高的NLR和PLR与急性心肌梗死的院内死亡率增加、类风湿关节炎活动性升高以及脓毒症中多器官衰竭的风险增加联系起来。LMR是评估炎症状态和免疫功能的关键生物标志物。在自身免疫性疾病中,升高的LMR与单核细胞驱动的促炎细胞因子过度产生相关,可能表明补偿性抗炎途径的激活。相反,在心血管疾病中,降低的LMR可能反映主要促炎环境中的免疫失调。这些生物标志物为研究偏头痛与全身炎症之间的关系提供了理论基础。我们的研究发现偏头痛风险与这些生物标志物之间存在显著关联,表明需要进一步研究以阐明它们在偏头痛发病机制中的作用。
我们的研究结果表明,较高的LMR与偏头痛患病率增加相关。PLR观察到的相反方向可能反映了两个指数所强调的细胞成分的差异以及对数比的数学特性:随着淋巴细胞计数上升,ln(PLR)降低,而ln(LMR)增加。因此,淋巴细胞驱动的变化可能在这些指数中以相反方向表现。此外,对性别、年龄和种族的调整——这些变量与基线血液学特征相关——可能进一步减弱四分位数对比而不破坏生物学合理性。
在偏头痛患者中观察到的LMR增加可能由几个相互关联的病理生理过程驱动。首先,在急性偏头痛发作期间,三叉神经血管系统的激活导致神经肽如CGRP和P物质的释放。这些介质不仅触发肥大细胞脱颗粒,还促进单核细胞向脑膜的迁移,可能导致循环单核细胞的短暂减少和LMR的补偿性升高。其次,淋巴细胞亚群的改变——特别是在慢性偏头痛中观察到的Th17细胞和调节性T细胞之间的失衡——可能破坏细胞因子稳态,损害血脑屏障完整性,并加剧中枢敏化,从而影响LMR动态。第三,双向神经免疫相互作用被涉及;实验证据表明,皮质扩散性抑郁(CSD)可以激活小胶质细胞并上调TLR4通路,促进外周单核细胞浸润到中枢神经系统,并进一步调节LMR。重要的是,升高的LMR可能不仅信号炎症状态加剧,还反映免疫细胞的重新分布和激活状态。
亚组分析显示了偏头痛风险与不同炎症生物标志物之间关联的不同模式。有趣的是,偏头痛患病率与LMR之间的正相关在各种亚组中保持,包括基于性别、种族、教育水平、婚姻状况和吸烟状况的分层(所有交互作用p>0.05)。这种一致性支持了LMR可能是偏头痛风险可靠且广泛使用的生物标志物的观点,因为它表明这些变量不会显著改变LMR-偏头痛连接。从生物学角度看,LMR反映了抗炎淋巴细胞和促炎单核细胞之间的平衡——这些细胞类型是免疫调节、炎症和组织修复的核心。鉴于偏头痛发病机制可能涉及慢性低度炎症状态导致免疫细胞分布和功能的改变,升高的LMR可能直接反映偏头痛患者中持续的炎症和免疫失调。
本研究将LMR确定为年轻人偏头痛患病率的潜在独立生物标志物,支持偏头痛发病机制的神经免疫假设,该假设涉及全身炎症和免疫失调。作为一种易于获取、成本效益高的标志物,源自常规全血细胞计数,LMR显示出在偏头痛风险分层、治疗监测和个性化治疗中临床应用的潜力:(1)风险分层:LMR可以促进早期识别偏头痛风险升高的个体。低LMR表明促炎状态,与易感性增加相关,特别是在存在其他风险因素的情况下。将LMR纳入初级保健或头痛诊所筛查协议,可以使LMR低于定义阈值(例如最低四分位数)的个体及时进行预防性干预(例如生活方式修改、预防性药物治疗)。将LMR与 established 风险因素(年龄、性别、BMI和家族史)整合可以增强偏头痛风险预测模型,类似于炎症生物标志物在心血管风险评估中的应用。(2)监测治疗反应:LMR作为追踪治疗效果的客观生物标志物具有潜力。连续测量可以反映对抗炎或抗CGRP疗法的实时反应。LMR增加可能表示阳性反应,而尽管症状改善但持续低水平可能表明需要治疗升级(例如剂量调整、药物更换或联合治疗)。这将有助于长期管理决策。(3)个性化干预策略:LMR可以基于个体炎症谱指导靶向治疗方法。低LMR(表明淋巴细胞减少/单核细胞增多)的患者可能优先受益于免疫调节策略(例如细胞因子靶向生物制剂如IL-1β/IL-6抑制剂或小胶质细胞调节剂)。相反,较高LMR的患者可能对神经调节或血管靶向治疗反应更好。个性化生活方式干预也可以通过随访LMR测量进行监测。此外,将LMR与数字健康工具(例如护理点设备)整合可以实现实时炎症分析并及时干预以防止偏头痛进展。总之,LMR在偏头痛管理中显示出作为预测和预后生物标志物的显著潜力。其简单性、可访问性和成本效益使其成为临床使用的宝贵工具。通过改进风险评估、治疗监测和个性化治疗,LMR可以显著优化偏头痛管理策略并增强患者 outcomes。
本研究关注20–40岁的成年人群,因为流行病学研究表明偏头痛的患病率和疾病负担在青春期后迅速增加,在30至44岁之间达到高峰,然后随年龄逐渐下降。选择这个年龄组有助于捕捉“活跃病例”,提高统计效力,并满足公共卫生干预的实际需求。此外,随着个体年龄增长,身体逐渐进入慢性炎症状态,某些炎症生物标志物的基线水平持续上升。在20–40岁期间,成年人的免疫系统和生理状态相对稳定,免疫系统没有显著下降,且严重慢性疾病或免疫失调的影响最小。这使其成为准确评估偏头痛与炎症生物标志物之间关系的理想时期。最后,20–40岁是生育和劳动力生产力的高峰,偏头痛对工作效率和生活质量的影响尤为显著。因此,研究该人群的偏头痛特征对于工作场所健康管理和早期干预策略至关重要。
尽管这些结果令人鼓舞,但必须认识到一些局限性。首先,横断面设计使得无法就LMR升高与偏头痛之间的因果关系得出坚定结论;缺乏时间数据使得难以确定LMR变化是先于还是由偏头痛导致,并限制了对发作频率和持续时间动态模式的理解。尽管进行了内部验证,但仍需要在独立队列中进行外部验证以增强模型的稳健性和普遍性。其次,尽管对几个协变量进行了调整,但协变量选择和测量中的潜在偏倚——以及未测量的生活方式和环境因素(例如空气污染、心理压力)——可能影响了结果。第三,虽然NHANES数据具有全国代表性,但20–40岁成年人中偏头痛病例数量相对较少可能降低了我们统计分析的精确性,并限制了基于种族、性别或偏头痛亚型的亚组评估。最后,依赖自我报告的症状和医疗记录进行偏头痛诊断可能导致较轻或间歇性病例的低估,可能影响我们结论的可靠性。未来研究应旨在扩大更广年龄范围和不同种族背景的样本量,并纳入更严格的临床诊断标准——可能辅以影像或生物标志物评估——以增强诊断准确性。
总之,我们的研究表明,在20–40岁的成年人中,LMR与偏头痛患病率显著正相关,而其他炎症生物标志物(SII、SIRI、NLR和PLR)未表现出显著关联。需要更多的纵向和机制研究来确认这些结果,并研究偏头痛与炎症生物标志物之间关联的致病机制。
生物通微信公众号
知名企业招聘