
-
生物通官微
陪你抓住生命科技
跳动的脉搏
图神经网络与序列架构在利用眼动生物标志物检测自闭症中的应用:一项多中心研究
《BMC Psychiatry》:Graph Neural Networks and sequential architectures for autism detection from eye-tracking biomarkers: a multi-site study
【字体: 大 中 小 】 时间:2026年06月10日 来源:BMC Psychiatry 3.6
编辑推荐:
摘要背景自闭症谱系障碍(ASD)在全球范围内影响着每100名儿童中的1名,但由于依赖于主观的行为评估以及专业人员的有限可用性,尤其是在资源匮乏的环境中,早期检测仍然具有挑战性。眼动追踪生物标志物提供了视觉注意力模式的客观、定量测量,但现有的神经网络方法缺乏对不同神经网络架构和多站
自闭症谱系障碍(ASD)在全球范围内影响着每100名儿童中的1名,但由于依赖于主观的行为评估以及专业人员的有限可用性,尤其是在资源匮乏的环境中,早期检测仍然具有挑战性。眼动追踪生物标志物提供了视觉注意力模式的客观、定量测量,但现有的神经网络方法缺乏对不同神经网络架构和多站点数据的系统评估。本研究使用多模态眼动追踪特征,对图神经网络(Graph Neural Networks)、长短期记忆网络(Long Short-Term Memory networks)和多层感知器(Multilayer Perceptrons)在ASD检测方面的性能进行了全面比较。
我们结合了两个独立的数据集:CILIA(来自法国的57名参与者,采用结构化观看范式)和Saliency4ASD(来自意大利的27名参与者,采用自由观看范式),创建了一个由84名参与者组成的多样化多站点欧洲队列(40名ASD患者,44名正常发育者)。评估了四种神经网络架构:带有注意力机制的图神经网络(GNNs)、不带注意力机制的GNNs、双向长短期记忆网络(LSTM)和多层感知器(MLP)网络。眼动追踪特征包括注视模式、眼跳动态、瞳孔直径和空间注意力分布。通过留一受试者法进行交叉验证,以确保模型的泛化能力。统计比较使用了DeLong检验来评估ROC曲线下面积的差异,McNemar检验来评估准确性,并采用了自举置信区间(10,000次迭代)。针对每个数据集的性能分析评估了在不同采集协议下的泛化能力。
LSTM获得了最高的AUC值,为0.859(95%置信区间:0.770–0.934),其次是带有注意力机制的GNN(AUC = 0.855,95%置信区间:0.763–0.931)。与预期相反,注意力机制并未显著提高GNN的性能(不带注意力机制的GNN:AUC = 0.823,p = 0.102)。LSTM的表现显著优于MLP(AUC = 0.811,p = 0.002),但与带有注意力机制的GNN相比没有显著差异(p = 0.749)。带有注意力机制的GNN表现出最高的特异性(93.2%)和阳性预测值(90.6%)。在两个数据集上的性能都保持一致(LSTM在CILIA上的AUC为0.840,在Saliency4ASD上的AUC为0.956),这表明尽管观看范式、设备和文化群体不同,模型仍能实现跨数据集的泛化。所有模型在区分ASD患者和正常发育者方面都显示出较大的效应量(Cohen’s d值超过1.0)。
这项系统评估表明,LSTM和基于图的方法在利用眼动追踪生物标志物进行ASD检测方面表现相当,注意力机制并未带来显著优势。这些模型具有高特异性(93.2%)、实时处理能力和跨数据集的泛化能力,使其适用于临床环境中的可扩展、客观的ASD筛查,有可能在资源受限的环境中实现更早的干预。
自闭症谱系障碍(ASD)在全球范围内影响着每100名儿童中的1名,但由于依赖于主观的行为评估以及专业人员的有限可用性,尤其是在资源匮乏的环境中,早期检测仍然具有挑战性。眼动追踪生物标志物提供了视觉注意力模式的客观、定量测量,但现有的神经网络方法缺乏对不同神经网络架构和多站点数据的系统评估。本研究使用多模态眼动追踪特征,对图神经网络(Graph Neural Networks)、长短期记忆网络(Long Short-Term Memory networks)和多层感知器(Multilayer Perceptrons)在ASD检测方面的性能进行了全面比较。
我们结合了两个独立的数据集:CILIA(来自法国的57名参与者,采用结构化观看范式)和Saliency4ASD(来自意大利的27名参与者,采用自由观看范式),创建了一个由84名参与者组成的多样化多站点欧洲队列(40名ASD患者,44名正常发育者)。评估了四种神经网络架构:带有注意力机制的图神经网络(GNNs)、不带注意力机制的GNNs、双向长短期记忆网络(LSTM)和多层感知器(MLP)网络。眼动追踪特征包括注视模式、眼跳动态、瞳孔直径和空间注意力分布。通过留一受试者法进行交叉验证,以确保模型的泛化能力。统计比较使用了DeLong检验来评估ROC曲线下面积的差异,McNemar检验来评估准确性,并采用了自举置信区间(10,000次迭代)。针对每个数据集的性能分析评估了在不同采集协议下的泛化能力。
LSTM获得了最高的AUC值,为0.859(95%置信区间:0.770–0.934),其次是带有注意力机制的GNN(AUC = 0.855,95%置信区间:0.763–0.931)。与预期相反,注意力机制并未显著提高GNN的性能(不带注意力机制的GNN:AUC = 0.823,p = 0.102)。LSTM的表现显著优于MLP(AUC = 0.811,p = 0.002),但与带有注意力机制的GNN相比没有显著差异(p = 0.749)。带有注意力机制的GNN表现出最高的特异性(93.2%)和阳性预测值(90.6%)。在两个数据集上的性能都保持一致(LSTM在CILIA上的AUC为0.840,在Saliency4ASD上的AUC为0.956),这表明尽管观看范式、设备和文化群体不同,模型仍能实现跨数据集的泛化。所有模型在区分ASD患者和正常发育者方面都显示出较大的效应量(Cohen’s d值超过1.0)。
这项系统评估表明,LSTM和基于图的方法在利用眼动追踪生物标志物进行ASD检测方面表现相当,注意力机制并未带来显著优势。这些模型具有高特异性(93.2%)、实时处理能力和跨数据集的泛化能力,使其适用于临床环境中的可扩展、客观的ASD筛查,有可能在资源受限的环境中实现更早的干预。