使用多模态深度学习模型预测消防员的酒精使用障碍风险:一项横断面研究

《Frontiers in Psychiatry》:Predicting alcohol use disorder risk in firefighters using a multimodal deep learning model: a cross-sectional study

【字体: 时间:2025年11月04日 来源:Frontiers in Psychiatry 3.2

编辑推荐:

  针对消防员酒精使用障碍筛查难题,本研究构建了融合T1加权MRI与标准化神经心理评估的多模态深度学习框架。实验表明,该框架准确率达79.88%,显著优于临床或影像单一模式(p<0.001),且模型校准稳定,适用于高危职业群体早期筛查。

  ### 引言

消防员作为一种高风险职业群体,由于长期暴露于生命威胁的紧急事件和累积的心理创伤,如火灾扑救、技术救援、危险材料处理以及大规模伤亡事件,他们面临着显著的心理和生理负担。这种持续的暴露使得消防员在多种心理健康障碍中处于更高的风险,特别是酒精使用障碍(AUD)(1)。流行病学研究表明,消防员的酒精滥用问题发生率高于一般人群,即使在调整了人口统计学和社会经济因素后,这一差异依然存在(24)。

除了酒精相关的具体后果,加拿大公共安全人员(PSP)的大规模证据显示,他们在常见心理健康障碍的筛查率方面显著高于一般人群。一项对5,813名PSP的全国性调查显示,15.1%的参与者至少筛查出一种当前障碍,而26.7%的参与者筛查出两种或更多障碍(5)。这些发现强调了消防员群体在心理健康负担方面的高度和多样性,并有助于解释为什么在这一职业中,以应对为导向的酒精使用常常出现,进一步强化了需要超越自我报告的客观风险评估的必要性。这一模式与证据一致,表明公共安全人员,包括消防员,常常在面对创伤和慢性工作压力时,以酒精作为适应不良的应对策略(69),进一步支持了客观风险评估方法的合理性。

AUD在这一人群中的成因是多方面的,反映了神经生物学易感性、职业压力和心理社会动态之间的相互作用。酒精常被用作管理创伤后反复出现的症状,如高唤醒、侵入性记忆和情绪困扰的适应不良策略(79)。随着时间的推移,这种对酒精的依赖可能导致循环强化,从而演变为习惯性和依赖性的使用(10)。这些临床风险路径进一步受到职业文化的影响。消防工作环境经常将战后饮酒正常化,并推崇坚韧不拔的特质,这种矛盾使得酒精使用在机构内被认可的同时,又在个人层面受到社会污名化(2, 10)。因此,许多消防员为了避免职业后果而回避求助行为,并低估其酒精消费情况。

AUD在消防员群体中的影响不仅限于个人健康,还影响到工作准备状态、在压力下的决策能力以及在紧急响应中的公众安全。在高风险环境中,第一响应者过度饮酒与风险行为之间存在显著关联,如酒后驾驶,这可能导致严重的操作问题,影响团队表现,并对个人安全构成重大威胁(11)。尽管存在这些风险,早期识别酒精滥用仍然具有挑战性。当前的筛查方法主要依赖于自我报告问卷,如酒精使用障碍识别测试(AUDIT),这些方法容易受到社会期望偏差、印象管理以及职业后果的担忧的影响(12)。此外,强调韧性和自力更生的文化规范可能会抑制物质使用披露,并阻碍与支持服务的互动(13)。因此,有必要开发一种客观的、不受社会污名影响的筛查方法,该方法整合生物和行为指标,而不是仅依赖于自我报告。

近年来,神经影像学和机器学习的进展为精神疾病的客观评估开辟了新的途径。结构MRI标志已被证明与各种精神疾病表型相关,包括与物质使用障碍相关的特征(14)。机器学习技术在神经影像数据上的应用已显示出在多种精神疾病中的诊断和预测准确性(15, 16)。然而,这些技术在职业群体中的酒精使用风险预测应用仍然较少。在高风险职业群体如消防员中,整合结构MRI与标准化神经心理评估以客观预测AUD风险的研究仍显稀缺。

为了解决这一空白,本研究提出了一种多模态深度学习方法,将神经影像特征与临床和认知指标相结合,以预测韩国全国消防员群体中的AUD风险。该方法旨在克服传统自我报告工具的局限性,通过生物驱动的数据驱动标记来增强高风险个体的早期识别。通过这种整合,我们希望为高压力应急响应专业人士开发精准的筛查策略。

### 材料与方法

#### 研究设计与参与者

本研究采用横断面设计,旨在开发和评估一种多模态深度学习框架,以预测韩国全国消防员群体中的酒精使用障碍(AUD)风险。参与者从全国多个消防站招募。纳入标准包括:年龄在25至65岁之间,正在从事消防工作,并且具有T1加权结构磁共振成像(MRI)和完整的临床评估数据。排除标准包括:有神经系统疾病(如癫痫、中风、创伤性脑损伤)的病史,有其他重大精神疾病(除AUD外),当前使用精神类药物,MRI检测到结构脑异常,或有MRI扫描禁忌症(如金属植入物、 claustrophobia)。

最初招募了746名消防员,其中35名因影像数据不完整被排除,14名因临床评估缺失被排除,8名因MRI检测到结构异常被排除,最终分析样本为689名参与者(平均年龄43.3 ± 8.8岁;93%为男性)。图1展示了参与者的招募和数据预处理流程。所有参与者均提供了书面知情同意,研究方案已获得Ewha Womans University的机构审查委员会批准。研究遵循《赫尔辛基宣言》的伦理原则。

#### 临床评估

认知和运动功能通过两个标准化神经心理测试进行评估:Grooved Pegboard Test和Trail Making Test(TMT)(17, 18)(19, 20)。Grooved Pegboard Test评估视觉-运动协调和精细运动控制。参与者需要尽可能快地将25个形状独特的针插入相应的沟槽中,记录完成时间(秒)以评估表现,完成时间越长,表现越差(17, 18)。TMT评估处理速度、认知灵活性和执行功能。Part A要求参与者依次连接编号的圆圈,而Part B则涉及交替连接数字和字母的顺序。记录完成时间,完成时间越长,反映认知效率越低(19, 20)。测试由受过培训的人员在标准化条件下进行。

酒精使用风险通过酒精使用障碍识别测试(AUDIT)评估,AUDIT是一项由世界卫生组织开发的10项自我报告问卷,用于评估酒精消费、依赖症状和相关损害(21)。得分范围为0至40,截断值为≥8,表示危险饮酒风险(22)。AUDIT在监督条件下完成,以确保数据完整性。

#### 人口统计学和神经心理特征

为了与标准职业筛查实践进行比较,我们将队列按照已建立的AUDIT截断值(≥8 vs <8)进行分层。表1总结了研究队列的人口统计学和神经心理特征,按AUDIT基于的酒精风险状态分层(≥8:酒精风险,n=392,56.9%;<8:非酒精风险,n=297,43.1%)。酒精风险组的平均年龄为43.16 ± 8.53岁,而非酒精风险组为42.58 ± 8.67岁,两者无显著差异(p=0.380,双尾独立样本t检验)。我们使用双尾独立样本t检验对连续变量进行比较,因为组别在参与者层面不重叠,t检验提供了有效的均值差异测试,且在我们的样本量下,它对中度正态性偏差具有合理的鲁棒性;双侧检验还保护了对任何方向效应的检测。观察到显著的性别差异(p<0.001,双尾皮尔逊卡方检验),酒精风险组男性比例较高(380名男性,12名女性),而非酒精风险组男性比例较低(257名男性,40名女性)。对于分类比较(如性别分布),选择皮尔逊卡方检验是因为它评估了组别归属与分类结果之间的关联,而不需要对分布假设进行超出预期单元计数的限制。

神经心理表现组间差异不显著。对于Grooved Pegboard Test,主导手完成时间为66.27 ± 8.45秒(酒精风险组)与67.27 ± 9.46秒(非酒精风险组;p=0.153),而非主导手时间为72.04 ± 9.49秒与72.48 ± 9.79秒(p=0.546)。对于TMT,Part A完成时间为29.65 ± 7.78秒(酒精风险组)与28.71 ± 7.50秒(非酒精风险组;p=0.110),Part B时间为74.69 ± 27.28秒与73.42 ± 25.25秒(p=0.527)。在这些方法选择的背景下,组间无显著差异表明,按照筛查标准定义的AUD风险可能在该职业队列中早于可测量的神经心理缺陷。

#### MRI采集

结构脑MRI扫描使用3.0特斯拉Philips MRI系统(Philips Healthcare,Best,荷兰)配备32通道头部线圈进行。高分辨率三维T1加权图像通过以下参数获取:重复时间(TR)=7.4毫秒,回波时间(TE)=3.4毫秒,翻转角=8°,体素大小=1 × 1 × 1毫米3,180个矢状切片。所有参与者被指导在整个扫描过程中保持静止和中性头部位置,以确保图像质量。

#### 数据预处理

T1加权MRI数据使用FMRIB软件库(FSL,版本6.0(23)进行预处理,以确保标准化空间归一化和最小化伪影。预处理流程包括每个参与者的结构MRI到蒙特利尔神经学研究所(MNI152)标准空间的线性和非线性注册,随后重新采样到2 × 2 × 2毫米3的体素分辨率。注册后,使用高精度脑提取工具(HD-BET),一种基于深度学习的算法,旨在提高从非脑元素中隔离脑组织的准确性(24)。这一过程提高了关键解剖区域(如灰质、白质和脑室结构)的可视化,同时减少了噪声并增强了分割的精确度。颅骨剥离后,将三维MRI体积分割为每位参与者80个二维轴向切片,以确保标准化的解剖覆盖。轴向切片提供了独特的空间视角和临床相关信息,有助于详细的神经解剖解释,并能精确检测结构异常或病理变化(25, 26)。

为了提高模型的泛化能力,应用了数据增强技术。随机仿射变换引入了±10°的旋转变化和±5%的平移偏移。颜色抖动变换调整了图像亮度和对比度(±20%),随机旋转变换进一步引入了±15°的旋转变化以模拟临床变异性。像素强度归一化通过从大规模神经影像数据集中导出的标准均值和标准差值进行,以标准化输入分布,随后进行模型训练(2729)。

临床评估数据经过系统预处理以确保数据完整性和模型兼容性。对所有临床变量进行了缺失值分析,包括人口统计参数(年龄、性别)、神经心理测试得分(主导手和非主导手的Grooved Pegboard测试完成时间,TMT A和B的完成时间)以及酒精使用风险指标(AUDIT得分)。通过列表删除排除了临床评估不完整的参与者,以维持多模态整合所需的严谨性。这种保守的缺失数据管理方法,虽然可能降低统计功效,但保留了多模态特征关系的效度,这是多模态学习框架的关键。未采用插补策略以避免在神经影像和临床特征之间引入人工相关性。所有连续临床变量均保留其原始尺度以保持可解释性,而归一化则通过深度学习架构内部的批量归一化层进行。分类变量,特别是生物性别,采用二进制编码(0 = 男性,1 = 女性),这与医学机器学习应用的标准做法一致。

#### 多模态深度学习框架

为了预测消防员中的酒精使用障碍(AUD)风险,我们开发了一个多模态深度学习框架,将结构磁共振成像(MRI)与临床和神经心理数据相结合。该框架包含三个并行处理分支:基于ResNet-50的卷积神经网络(CNN)用于从MRI图像中提取局部形态学特征(30),一个Vision Transformer(ViT)模块用于提取神经解剖结构的全局上下文表示(31),以及一个多层感知机(MLP)用于整合临床和神经心理变量(32)。图2提供了该深度学习架构的示意图,展示了通过ResNet-50、Vision Transformer和MLP模块对MRI图像和临床变量的并行处理,随后的特征拼接以及最终的分类层。

对于MRI输入流,每位参与者80个轴向二维切片被输入预训练的ResNet-50模型以提取层次化局部特征。得到的特征图通过平均池化和展平操作生成紧凑表示。同时,相同的MRI切片通过ViT模块的基于补丁的线性嵌入输入。ViT提取了跨脑区的长距离空间依赖性和全局结构上下文(33)。这种双路径设计允许从神经影像数据中同时提取局部和全局表示。

同时,临床和神经心理特征包括年龄、性别、AUDIT得分、Grooved Pegboard测试完成时间(主导手和非主导手)以及TMT A和B的持续时间,这些特征被输入一个由两个全连接层和ReLU激活函数组成的MLP,生成潜在的临床表示。ResNet-50、ViT和MLP分支的输出被拼接成一个统一的特征向量,随后通过一个全连接层和Sigmoid激活函数生成AUD风险的二元预测。模型训练使用Adam优化器,初始学习率0.001,批量大小32,最大训练周期100次。早期停止基于验证损失,耐心阈值为10个周期。为了减轻过拟合并提高泛化能力,对全连接层应用了Dropout正则化(Dropout率=0.5),并在每个卷积块之后引入了批量归一化。

模型评估通过分层的三重交叉验证进行,以确保训练集和验证集之间的独立性。性能基于准确率、接收者操作特征曲线下的面积(AUROC)、灵敏度和特异性进行评估。使用DeLong’s测试(34)对不同模型配置之间的AUROC差异进行统计检验。所有模型均使用PyTorch(v1.10)实现,并在NVIDIA RTX A6000 GPU上进行训练。

#### 模型评估与统计分析

模型性能评估使用分层的三重交叉验证,以确保训练集和验证集之间的独立性。性能指标包括准确率、接收者操作特征曲线下的面积(AUROC)、精确率和召回率。由于AUROC对类别不平衡具有鲁棒性,因此将其作为主要指标。AUROC的置信区间(95% CI)通过自举法(1,000次迭代)进行估计。

比较分析评估了多模态模型与单模态模型(MRI-only、clinical-only)之间的差异。使用DeLong’s方法对AUROC的差异进行统计检验,该方法考虑了在相同案例上评估的配对ROC曲线之间的相关性(34)。校准通过可靠性(校准)曲线评估,以评估预测概率与观察结果之间的协议一致性,决策曲线分析用于量化在与职业筛查相关的阈值概率范围内的净临床效益。所有预处理统计、任何校准拟合和阈值选择均在训练折叠内进行,并应用于相应的验证折叠,以避免信息泄露。特征重要性分析使用集成梯度来提高可解释性,通过识别对预测有影响的神经解剖和临床输入(35)。统计分析使用Python(版本3.9)、Scikit-learn(版本1.0)和SciPy(版本1.7)进行。

#### SHapley Additive exPlanations

临床变量的特征重要性分析使用SHAP方法进行,使用XGBoost分类器(36)训练,输入临床特征包括年龄、性别、AUDIT得分、Grooved Pegboard测试完成时间(主导手和非主导手)以及TMT A和B的持续时间。SHAP值使用TreeExplainer计算,该方法利用树结构进行高效的Shapley值计算(37)。全局特征重要性通过整个队列的平均绝对SHAP值量化,提供了可解释的每个变量对风险预测的贡献度。特征贡献的统计显著性通过基于置换的零假设检验进行评估,并进行了多重比较校正。

#### Gradient-weighted Class Activation Mapping

梯度加权类激活映射(Grad-CAM)被用来阐明对酒精使用障碍风险分类有影响的神经解剖特征的空间定位(38)。该可解释性方法通过计算预测类别得分相对于最终卷积层激活的梯度,从而识别对分类决策有最大影响的脑区。分析针对每个架构的终端卷积层,这些层保留了空间分辨率,同时编码了高级语义特征。每个特征图k相对于目标类别c的重要性权重αkc通过梯度反向传播计算:

$$ a_{kc} = \frac{1}{Z} \sum_{i} \sum_{j} \frac{\partial y^c}{\partial A_{ij}^k} $$

其中yc表示类别得分,Akij表示特征图k中空间位置(i,j)的激活,Z通过空间维度进行归一化。最终的类别区分定位图通过将前向激活图加权组合生成:

$$ L_{Grad-CAM}^c = RELU\left( \sum_{k} a_{kc} A^k \right) $$

生成的粗粒度热图通过双线性插值匹配原始图像分辨率(224×224像素),并以透明度系数0.6叠加在对应的MRI切片上,以促进解剖解释。可视化生成了50名参与者(按风险类别随机选择)的子集,以评估所学特征的空间一致性。Dice相似性系数量化了参与者之间激活模式的空间重叠,而遮挡敏感性分析通过测量在遮挡上五分位数激活强度后的分类信心下降来验证所识别区域的因果重要性。鉴于这些实施细节,我们简要说明了我们选择定位方法的合理性。在考虑替代特征定位技术后,我们选择了Grad-CAM,因为它具有类别区分性、CNN架构无关性,并且在2D多切片MRI中具有计算效率。与普通的显著性相比,Grad-CAM产生了稳定、粗粒度到中粒度的热图,与目标类别对齐。集成梯度需要基线和路径积分,对于T1强度尺度来说,选择基线是非平凡的,并且可能引入基线依赖的伪影,而Grad-CAM避免了基线选择,同时保持了分数-梯度信息的忠实性。遮挡/扰动和LIME/SHAP图像解释方法需要大量的采样,并且设计选择(如补丁大小、超像素)在每位参与者约80个切片的情况下扩展性较差(37, 39)。Transformer注意力图不是固有的类别特异性,可能不会反映决策关键证据,而Grad-CAM则是显式的类别区分性。在医学影像中,Grad-CAM的区域定位与放射学阅读实践一致,使得在轴向切片上进行透明叠加和队列水平聚合成为可能,而无需重新训练。为了解决已知的局限性(分辨率受限于最后一层卷积),我们进行了合理性检查(参数随机化和切片级消融),并报告了代表性和聚合的热图(40)。

### 结果

表2总结了多种预测模型在酒精使用障碍(AUD)风险分类中的比较性能,包括仅临床模型、仅神经影像模型、多尺度图像整合模型以及整合神经影像和临床数据的多模态模型。使用分层的三重交叉验证评估了准确率、接收者操作特征曲线下的面积(AUROC)、精确率和召回率,以确保稳健的估计。

在仅临床模型中,逻辑回归模型表现最佳,准确率为62.53%,AUROC为57.73%,精确率为61.17%,召回率为64.32%。其他临床模型,包括多层感知机(MLP)、随机森林和XGBoost,显示了较低的分类准确率和曲线下面积(AUC),AUC范围从47.95%到54.36%。

在仅神经影像条件下,ResNet-50模型优于其他架构,如EfficientNet-B0、Vision Transformer(ViT)和Data-efficient Image Transformer(DeiT),达到AUROC 57.73%和准确率61.53%。ViT和DeiT模型的AUROC分别为53.95%和52.36%,表明这些基于Transformer的模型在单模态影像任务中未能超越卷积基线。

结合多个图像架构略微提高了性能。ResNet-50 + ViT混合配置在多尺度图像类别中实现了最高的AUROC(61.87%)和准确率(63.54%)。然而,性能仍不如多模态方法。

整合神经影像和临床数据的多模态框架显示了显著的预测性能提升。最佳配置包括一个融合架构,将ResNet-50、ViT和用于临床变量的MLP结合,达到了准确率79.88%,AUROC 79.65%,精确率78.36%,召回率81.24%。这一性能代表了比最佳临床模型(逻辑回归)在准确率上17.35个百分点的提升,在AUROC上21.92个百分点的提升,从而提供了有力的证据支持多模态整合的附加效益。其他多模态变体,如ResNet-50 + DeiT + MLP和ResNet-50 + ViT + 逻辑回归,也显示了优于单模态基线的性能,但未达到最佳模型的水平。

使用DeLong’s测试对AUROC值进行统计比较,确认了多模态ResNet-50 + ViT + MLP模型显著优于临床模型和图像模型(p<0.001)。

图3提供了模型性能在三个互补维度上的可视化表示。ROC曲线(图3A)显示了多模态架构与其他建模方法之间的明显分离,多模态曲线的曲线下面积(AUC)显著更大。多尺度图像模型显示出中间的判别能力,位于多模态框架和单模态方法之间,后者显示出相当但较不稳健的判别性能。

校准曲线(图3B)显示,多模态方法与理想校准线更加一致,相较于其他模型。临床模型和神经影像模型在较低概率区域显示出明显的偏离,特别是在系统性高估方面。

决策曲线分析(图3C)表明,多模态框架在更广泛的阈值概率范围内提供了持续的净临床效益,相较于其他建模策略。相比之下,临床模型和神经影像模型在较高阈值值时显示出临床效用的下降,而多模态模型在整个概率谱中保持其净效益。这些视觉评估进一步支持了表2中呈现的定量发现,进一步支持了通过多模态整合获得的增强预测能力。

图4展示了代表性模型(临床模型使用逻辑回归;图像模型使用ResNet-50;多尺度图像模型结合ResNet-50和Vision Transformer;多模态模型整合ResNet-50、Vision Transformer和临床变量通过MLP)的混淆矩阵。多模态模型产生了TN = 55,FP = 15,FN = 13,TP = 54。临床模型产生了TN = 44,FP = 26,FN = 25,TP = 42。图像模型产生了TN = 43,FP = 27,FN = 25,TP = 42。多尺度图像模型产生了TN = 43,FP = 27,FN = 23,TP = 44。总体而言,多模态配置同时减少了FP和FN,相较于其他方法,显示出更优的错误模式。

为了研究神经影像模型的特征提取模式,我们在ResNet-50和EfficientNet-B0架构上进行了梯度加权类激活映射(Grad-CAM)分析。图1(补充)显示了通过这些卷积神经网络模型处理的随机选择参与者轴向脑切片的代表性Grad-CAM可视化。ResNet-50和EfficientNet-B0的Grad-CAM激活显示出跨切片的显著空间异质性。激活强度在某些区域显示为离散的热点,在更广泛的解剖区域显示为扩散的低强度模式。ResNet-50和EfficientNet-B0均未在特定神经解剖结构中显示出系统性的集中,高强度区域在皮层和皮层下区域中随机分布。峰值激活值在切片和架构之间显著变化,没有与已知的脆弱区域(如前额叶皮层、海马体或小脑结构)的对应关系。

为了进一步证明Grad-CAM相较于其他特征定位方法的适用性,我们还应用了Vanilla Saliency(补充图S2)、Integrated Gradients(补充图S3)和Occlusion Sensitivity(补充图S4)。与Grad-CAM相比,Vanilla Saliency和Integrated Gradients生成了噪声、低对比度的归因图,这与已知的这些梯度方法在结构MRI数据上的应用限制一致。Occlusion Sensitivity生成了由于扰动网格而产生的块状激活模式,但未能以稳定的方式界定具有神经解剖学意义的区域。相比之下,Grad-CAM生成了更平滑和更可解释的叠加,这与之前报告的其在神经影像学中的鲁棒性和临床合理性一致。这些补充比较强调了Grad-CAM作为本研究主要可视化方法的适宜性。

这些可视化输出与神经影像模型的定量性能指标(ResNet-50 AUROC:57.73%,准确率:61.53%;EfficientNet-B0 AUROC:56.54%,准确率:60.82%)相辅相成。在两种架构中,随机抽样案例的激活模式缺乏一致性,提供了对图像仅模型在该AUD风险预测任务中有限特征提取能力的经验证据。

临床变量的特征重要性分析使用SHapley Additive exPlanations(SHAP)进行,以量化多模态模型预测中的个体特征贡献。图2(补充)展示了纳入最佳多模态框架的六个临床特征的SHAP值分布。

SHAP分析显示,临床变量集中的特征贡献存在差异。性别在模型预测中显示出最显著的正向影响,SHAP值范围从约-0.05到+0.45,呈现出明显的右偏分布。非主导手Grooved Pegboard完成时间显示了双向效应,SHAP值分布在-0.30到+0.25之间,表明运动协调能力的下降是风险预测的敏感指标。

年龄显示出SHAP值的平衡分布,范围从-0.25到+0.20,大部分实例集中在零附近。主导手Grooved Pegboard表现(GP_dom_sec_adj)也显示出类似的双向模式,值范围从-0.20到+0.15。TMT Part A完成时间(TrailA_time_adj)显示出适度的特征重要性,SHAP值在-0.15到+0.15之间。TMT Part B完成时间(TrailB_time_adj)显示出最集中的分布,围绕零,有限的异常值延伸到±0.20,这表明在多模态背景下,这些特征对预测结果的直接贡献有限。

这些定量特征归因结果补充了多模态模型的性能指标,提供了在整合预测框架中个体临床变量相对贡献的机制见解。

### 讨论

多模态深度学习框架展示了卓越的分类性能,验证了在消防员中通过结构神经影像与临床评估的协同整合进行AUD风险分层的有效性。主要发现包括:(1)ResNet-50和Vision Transformer架构的协同结合有助于从结构MRI数据中互补提取局部形态学特征和全局空间依赖性,避免了计算密集的功能连接分析;(2)整合标准化神经心理评估,特别是Grooved Pegboard测试和TMT,提供了功能神经影像的替代指标,部分补偿了任务相关或静息态功能MRI数据的缺失;(3)多模态框架在分类准确率上显示了17.35个百分点的显著提升,证实了结构神经影像在适当整合行为指标时的判别价值;(4)特征重要性分析确定性别是主要的临床预测因子,其次是运动协调指标,阐明了该职业群体中潜在的性别特异性脆弱模式;(5)该模型在概率阈值上保持了良好的校准,表明其在风险分层中的临床适用性,而不涉及功能神经影像协议的运营复杂性。

#### 与现有文献的比较分析

表3提供了最近多模态深度学习方法在精神疾病预测中的综合总结,将我们的发现置于更广泛的神经影像学分类研究背景下。当代神经影像学研究一致显示,结合结构MRI、功能任务MRI和静息态功能连接的多模态方法在精神分类任务中表现更优(46)。然而,本研究中提出的多模态框架,通过结构MRI和临床评估的整合,达到了79.88%的准确率(AUROC:0.795),在不使用功能神经影像的情况下,显示出与多模态方法相当的性能。一项最近的三模态整合研究(42)(sMRI + fMRI + SNP)在精神分裂症分类中达到了79.01%的准确率(n=492),其中个体模态贡献不同(sMRI:66.33%,fMRI:75.29%,SNP:57.06%)。从sMRI基线到多模态整合的边际提升(13.68个百分点)必须与显著增加的采集复杂性和计算负担进行对比。一项综合研究利用包含119名酒精依赖患者和97名对照的神经影像学电池,发现尽管多模态整合实现了最佳分类性能,但研究者得出结论,认为“在直接临床适用性方面,目前对于AD的最现实的神经影像学分类器可能是基于结构MRI和灰质密度的单模态方法”(46),由于功能MRI协议的时间需求和分析复杂性。这一经验观察支持了我们选择结构MRI作为主要神经影像学模态的方法论决定。

先前使用静息态功能连接的研究报告了在区分酒精依赖个体与对照组时,分类准确率在61.53%到76.67%之间(43, 44)。与专注于AUD的研究直接比较,我们的框架在方法论的简洁性上表现出竞争力。最近的一项研究(44)报告静息态fMRI的AUROC为0.79(n=102),这与我们的0.795相当,尽管使用了计算密集的功能连接分析。这种等价性挑战了关于功能影像在AUD检测中优越判别能力的假设。同样,另一项研究(46)表明,双神经影像学模态整合(sMRI + fMRI)在AUD分类中达到79.3%的准确率(n=216),仅比单模态(76.6%)提高了2.7个百分点,这表明在职业筛查背景下,功能影像协议的高成本效益可能值得质疑。使用功能连接的随机森林分类器结合神经心理测量,达到了76.67%的准确率(45),需要广泛的预处理管道和网络级分析框架。最近的研究(45)报告了基于fMRI的分类达到76.67%的准确率(AUROC:0.93)在男性专属队列中(n=60)。我们的在多模态框架中的卓越准确率(79.88%)在显著更大的样本(n=689)中,显示出在职业人群中的更大判别能力。这表明,结构改变与行为评估的结合可能比单独使用功能连接在职业人群中提供更强的判别能力。

#### 方法论局限性

本研究存在一些方法论限制,值得全面探讨。首先,横断面设计本质上排除了对结构脑改变与AUD风险之间时间演化的因果推断。纵向研究追踪消防员从招募到职业发展过程,将是确定观察到的结构改变是否代表易感性、职业压力暴露的后果、早期酒精使用标志或这些因素之间复杂相互作用的关键。在缺乏纵向数据的情况下,我们无法确定结构改变是否先于行为表现,或是否与酒精消费的增加同时发生。

此外,仅依赖于T1加权结构MRI,虽然在临床可行性方面是战略性选择,但对神经生物学特征的全面性存在内在限制。静息态功能MRI研究已经识别出特定的功能连接改变,这些改变在奖励、显著性和执行控制网络中区分酒精依赖个体与对照(43, 44, 47)。我们的结构MRI仅方法无法捕捉这些动态网络级的中断,可能遗漏了影响成瘾易感性的关键神经生理标志。未来版本可以结合简化的静息态协议或针对奖励处理的功能MRI,以提高预测准确性,同时保持合理的临床实用性。此外,先进的结构成像技术,如扩散张量成像,可以提供微结构完整性指标,补充体积评估。

此外,样本仅包括韩国消防员,这引入了文化和社会职业特定性,可能限制了在其他人群中的适用性。文化差异在酒精消费模式、寻求帮助的社会污名以及职业压力暴露方面可能影响结构脑改变和模型性能。显著的性别不平衡(93%男性)反映了消防员劳动力的人口统计特征,但也严重限制了对女性消防员的结论,特别是由于性别差异在酒精代谢、神经毒性易感性和成瘾轨迹中的影响。

#### 机制考量

我们多模态方法的有效性需要通过互补的可解释性方法来考察,以阐明神经影像学和临床特征的差异贡献。在多模
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号