《Obesity Pillars》:Development and internal validation of a risk score for incident obesity among Peruvian formal workers
编辑推荐:
该研究旨在构建并内部验证一种可解释的风险评分模型,用于预测秘鲁正规就业人群在基线体重指数(BMI)为18.5至<30 kg/m2条件下发生肥胖(incident obesity)的风险。研究采用回顾性队列设计,利用常规职业健康档案数据,通
该研究旨在构建并内部验证一种可解释的风险评分模型,用于预测秘鲁正规就业人群在基线体重指数(BMI)为18.5至<30 kg/m2条件下发生肥胖(incident obesity)的风险。研究采用回顾性队列设计,利用常规职业健康档案数据,通过Cox生存分析建模。结局指标为随访期间首次出现BMI≥30 kg/m2的检测日期。候选模型包含参考模型(年龄、性别、基线BMI)、最小临床模型(加腰围)、职业-临床模型(再加职业类型、夜间工作、吸烟、饮酒及基线高血压)以及扩展心脏代谢模型(加实验室指标)。模型性能通过C指数(C-index)、Brier评分、36个月校准度、500次Bootstrap重抽样内部验证及决策曲线分析(decision curve analysis, DCA)进行评估。最终模型筛选优先考虑区分度、校准度、稳定性、数据完整性与可解释性,而非单一统计学显著性。评分通过将log风险比(log-HR)系数转换为整数点值得出,并以基线生存函数估计绝对36个月风险。缺失数据处理策略为:主要分析采用完整病例分析;腰围缺失的主要敏感性分析为剔除该变量的模型;实验室数据因缺失机制非随机而未纳入主模型。内部验证显示经Bootstrap校正后C指数为0.855,36个月逆概率删失加权(inverse probability of censoring weighted, IPCW)Brier评分为0.091。评分分为低危(0–21分)、中危(22–29分)和高危(30–43分),对应观察到的36个月风险分别为0.91%、5.62%和37.05%。研究强调该评分在应用于源数据库以外的职业人群前,仍需外部验证、局部再校准及实施效果研究。
该研究聚焦于工作场所场景中肥胖早期预防的临床需求,探讨了预测秘鲁正规职业人群从正常体重或超重状态进展为肥胖的风险评分模型构建问题。研究背景在于,成人肥胖已成为全球重大公共卫生优先议题,其患病率自1990年以来已增长超过一倍,2022年全球约25亿成人存在超重,其中890万以上达到肥胖标准。拉丁美洲及加勒比地区成人超重患病率居全球前列,秘鲁成人肥胖患病率约为23.23%。尽管工作场域提供了早期识别与干预的独特契机,但现有证据多集中于人群患病率估计或横断面关联分析,针对拉丁美洲职业人群发生肥胖(incident obesity)的纵向预测模型,尤其是整合人体测量学、临床及职业变量的可解释模型仍显匮乏。此外,理想的职业健康模型应能识别尚未肥胖但具有高进展风险的工人,以实现从孤立BMI测量向风险分层随访的转变,这要求模型具备可解释性、内部验证及临床效用评估。基于此,研究人员旨在开发并内部验证一种用于估计秘鲁正规职业人群肥胖发病风险的预测模型,比较基于基线临床与职业预测因子的候选模型,筛选可解释模型,推导36个月风险评分,并从区分度、校准度、决策曲线分析及预设敏感性分析多维度评估其性能。
该研究的数据来源于秘鲁某职业医疗机构常规职业医学检查的二次档案数据,纳入基线BMI介于18.5至<30 kg/m
2、具有有效基线日期及至少一次后续 dated BMI 测量的工人。主要队列最终包含9390名工人,其中987例在随访期间发生肥胖。研究人员采用的技术路线主要包括:Cox比例风险回归作为核心统计方法,以处理不规则随访间隔和删失数据;候选模型梯度递增复杂度,从参考模型逐步扩展至包含职业变量的职业-临床模型;通过500次Bootstrap重抽样进行内部验证以校正乐观偏差;运用决策曲线分析评估模型在不同风险阈值下的净获益;以及将log-HR系数转换为整数点数以构建手动可应用的评分工具。
研究结果部分按以下小标题展开:
样本选择:源数据库初始包含79660名具有有效基线BMI的工人,经排除基线低体重、基线肥胖、无后续dated BMI测量等条件后,主要分析队列确定为9390人。需特别指出的是,仅15.0%的基线合格工人具有后续随访数据,这意味着模型适用范围应限定于有重复职业复查记录的工人群体,而非单次基线检查的所有工人。
基线特征:队列基线中位年龄34岁,男性占84.1%,基线超重(BMI 25–<30 kg/m
2)者占61.6%。与未发生肥胖者相比,发生肥胖者的基线BMI中位数更高(28.7 vs 25.6 kg/m
2),基线腰围更大(94.0 vs 87.0 cm)。夜间工作在发生肥胖者中占比11.1%,高于未发生者的5.3%。生化检测数据缺失率较高,葡萄糖、胆固醇、甘油三酯缺失率分别为15.7%、50.3%和50.0%。
肥胖发病率:主要队列粗发病率为10.5%,基线正常体重者粗发病率1.3%,基线超重者粗发病率16.3%。36个月Kaplan-Meier估计累积发病率在正常体重组为1.2%,超重组为20.1%。按亚组分析,夜间工作者36个月累积发病率为19.4%,非夜间工作者为12.7%。
预测模型开发与比较:参考模型(年龄+性别+基线BMI)的表观C指数为0.849,36个月IPCW Brier评分为0.086;最小临床模型加腰围后C指数为0.852;最终选定的职业-临床模型(含腰围)在7979名完整数据参与者中C指数达0.857,36个月IPCW Brier评分为0.091,综合Brier评分为0.041,有效预测因子12个,每有效预测因子事件数为69.4。不含腰围的职业-临床模型C指数为0.852,提示腰围缺失时模型区分度损失较小。岭惩罚Cox比较模型经五折交叉验证选定lambda=0.005,其表观C指数与可解释模型基本一致,未显示更优性能。
最终模型与评分:基线BMI每增加1 kg/m
2的风险比(hazard ratio, HR)为1.91(95%置信区间:1.81–2.02);基线腰围每增加10 cm的HR为1.44(1.26–1.65);年龄每增加10年的HR为0.69(0.65–0.74);男性HR为0.66(0.54–0.81);夜间工作HR为1.42(1.14–1.77);与办公室工作相比,体力劳動HR为1.27(1.10–1.48),社会服务HR为0.60(0.43–0.82)。评分以0.25 log-HR单位对应1分进行转换,总分范围0–43分,划分为低危(0–21分)、中危(22–29分)、高危(30–43分)。低危组2679人(33.6%),观察36个月风险0.91%;中危组2735人(34.3%),风险5.62%;高危组2565人(32.1%),风险37.05%。观察预测比(O/E)在各组依次为0.99、0.84和1.06。
内部验证、校准与临床效用:500次成功Bootstrap重抽样的平均C指数乐观度为0.00184,乐观校正后C指数为0.8547,百分位置信区间0.8424–0.8678。36个月校准曲线显示,从低十分位到高十分位,观察风险与预测风险呈渐进递增趋势,最高十分位平均预测风险57.2%,观察发病率59.3%。决策曲线分析显示,在2%至30%的风险阈值范围内,最终模型的净获益优于"全部干预"和"不予干预"策略,相较于基线BMI参考模型亦有小幅一致的净获益提升。
敏感性分析:以检测区间中点重新定义事件时间后,模型C指数维持0.856;固定36个月和60个月视角分析中,已知状态工的AUC分别为0.878和0.880;基线超重亚组(4902人,794事件)C指数为0.799,正常体重亚组因事件过少致矩阵奇异无法估计;剔除6个月内事件后C指数0.856,剔除12个月内事件后0.856;严格定义要求后续确认则将事件减至133例用于模型109例;不同BMI合理性规则未改变队列规模;时序验证以2017年8月26日分割,验证集C指数0.838,36个月Brier评分0.173;比例风险假定检验显示残差与log时间相关性绝对值较低(?0.111至0.078);女性C指数0.879,正常体重亚组0.696,夜间工作组0.796。
讨论部分,研究人员首先总结了主要发现:该基于基线临床与职业变量的Cox评分模型在高内部区分度(Bootstrap校正C指数0.855)基础上,成功将36个月肥胖发病风险分离为低、中、高危三个层次(0.91%、5.62%、37.05%),表明常规职业健康评估数据可用于风险分层而不依赖终末变量或随访后测量。
在与既往研究比较时,研究人员指出该模型性能更接近加拿大OPoORT工具(C统计量≥0.89),而优于欧洲EPIC评分(AUC 0.64/0.57),但直接比较受限,因本研究预测基线无肥胖工人跨越BMI≥30 kg/m
2阈值,而EPIC预测一般人群中≥10%体重增长。高区分度部分源于基线BMI已使部分工人接近肥胖诊断阈值。腰围与BMI的协同预测价值与秘鲁既往系统综述一致,即不同人体测量指标可提供非冗余信息;但剔除腰围后的模型损失较小,提示需权衡操作可行性与测量质量。夜间工作的预测标记角色与轮班工作meta分析中观察到的关联方向一致,但数据库无法区分固定与轮班、累积时长、睡眠、夜间进食等,故不宜作因果推断。与近期机器学习模型相比,本研究强调纵向设计、基线模型分离、校准度及临床效用评估,优先选择可解释模型以满足职业监测需求。
公共卫生与国际层面的启示包括:第一,模型聚焦于从正常体重/超重向肥胖转化的可预防阶段,契合全球及区域疾病负担趋势;第二,展示了常规职业评估数据从单纯适工判定转向心脏代谢风险分层平台的潜力,有助于实现干预强度的差异化配置;第三,主模型不依赖实验室检测,提升了在中等收入国家职业健康系统中的适用性,但外部验证、局部再校准及影响分析仍是实施前的必要步骤。
研究局限性涵盖:基于二次职业档案的不规则随访与区间删失结局;仅15.0%基线合格工人具后续随访,选择偏倚可能影响外推;实验室数据高缺失率且非随机缺失;饮食、体力活动、睡眠、 chronotype、压力、收入、教育及夜间工作累积时长等未测量变量;BMI作为结局指标的固有局限(不区分脂肪与 lean mass、不反映脂肪分布);预测性分析无法排除反向因果;以及仅完成内部验证,缺乏外部验证。
研究结论部分翻译如下:在基线正常体重或超重的秘鲁正规工人中,利用基线临床与职业变量构建可解释的发病肥胖预测模型是可行的。最终模型显示出高内部区分度、可接受的36个月校准度,以及分离风险组的潜在效用。所推导的评分识别出的高危组累积发病率显著高于低危与中危组,支持其作为职业健康预防性监测工具的进一步评估。在源职业健康系统之外进行常规应用之前,仍需外部验证、局部再校准及实施研究。