人工智能辅助追踪社交行为与支持自闭症谱系障碍诊断:系统性综述与荟萃分析
【字体:
大
中
小
】
时间:2025年09月27日
来源:eBioMedicine 10.8
编辑推荐:
本刊推荐:为解决自闭症谱系障碍(ASD)诊断过程耗时费力、主观性强的问题,研究人员开展基于人工智能(AI)算法的社交行为分析研究。通过对38项研究的系统分析发现,AI算法通过提取面部特征和注视模式,在ASD诊断中表现出高准确性(AUC=0.862),支持向量机(SVM)和决策树算法在非结构化游戏环境中表现尤佳。该研究为开发客观、可扩展的ASD数字诊断工具提供了重要证据,对改善临床实践具有重要意义。
在当今社会,自闭症谱系障碍(Autism Spectrum Disorder, ASD)的诊断依然面临着巨大挑战。临床医生需要经过严格培训,使用像自闭症诊断观察量表第二版(ADOS-2)这样的标准化评估工具,通过观察患者的社交互动、眼神交流、情感表达等行为特征来做出判断。这个过程不仅耗时耗力,而且很大程度上依赖于专业人员的主观观察和记忆,不同评估者之间可能存在差异,导致诊断的一致性和可靠性受到影响。更重要的是,随着全球ASD患病率的上升,对诊断服务的需求急剧增加,许多地区的患者需要等待很长时间才能获得评估,错过了早期干预的最佳时机。
传统的诊断方法还存在另一个局限:难以客观量化社交行为的变化。这在长期监测患者发展情况或评估干预效果时尤为明显。例如,在临床 trials 中,缺乏精确的行为测量工具可能影响对治疗效果的准确判断。正是在这样的背景下,人工智能(Artificial Intelligence, AI)技术展现出其独特价值。通过计算机视觉和机器学习算法,AI可以自动分析视频中捕捉的面部表情、眼球运动、头部姿态等细微行为特征,从而提供一种客观、可扩展的辅助诊断手段。
近期发表在《eBioMedicine》上的一项研究,首次系统性地评估了AI技术在ASD社交行为分析和诊断中的应用效果。由悉尼大学大脑与心智中心自闭症与神经发展诊所(CAN)的Carter Sun和Adam J. Guastella等学者组成的团队,对截至2025年2月的40,570篇文献进行了筛选,最终纳入38项符合标准的研究进行系统综述,其中7项提供了足够数据进行荟萃分析。
研究人员采用了系统综述和荟萃分析的方法,遵循诊断试验准确性研究的PRISMA-DTA指南。他们检索了Medline、Embase、Scopus、Web of Science、IEEE Xplore和ACM Digital Library等数据库,纳入使用AI算法进行ASD诊断或社交行为识别的研究。使用QUADAS-2工具评估偏倚风险,采用双变量模型和三水平荟萃回归分析处理数据异质性和依赖性,并通过robust variance estimation验证结果的稳定性。主要技术方法包括:基于面部行为特征(如眼球注视、表情变化)的机器学习算法(支持向量机、决策树、随机森林等);深度学习模型(卷积神经网络CNN、长短时记忆网络LSTM)用于视频分析;多种社交互动场景(人脸互动、人机交互、机器人辅助互动)下的行为数据采集;以及综合荟萃分析技术(双变量模型、三水平回归模型)处理多来源研究数据。
研究结果表明,AI算法在ASD诊断中表现出较高的准确性。荟萃分析显示,AI算法区分ASD与典型发育(TD)个体的诊断比值比(DOR)为15.917(95% CI [4.775-53.059]),综合受试者工作特征曲线下面积(AUC)达到0.862。在敏感性分析中,AI算法的合并敏感性为0.845(95% CI [0.701-0.927]),特异性为0.888(95% CI [0.770-0.950]),表明这些算法能够有效识别ASD相关的行为特征。
研究选择与特征方面,从40,570篇摘要中筛选出38项研究进行系统综述,包含2,347名参与者(1,515名ASD,1,301名TD)。这些研究涵盖了多种实验设计,包括结构化社交互动(如ADOS-2评估)、非结构化游戏互动、人机交互和机器人辅助互动等场景。大多数研究使用金标准诊断工具(如ADOS-2、DSM-5标准)作为参考标准,并报告了详细的人口学特征和实验设置。
自然场景中社交互动评估的系统综述显示,AI技术在不同类型的社交互动场景中都有应用。在结构化人际互动研究中,如Tang等人使用静止面孔范式(Still-Face Paradigm)提取头部运动、面部外观和声音特征,应用K近邻(K-NN)和支持向量机(SVM)算法区分高风险ASD婴儿与TD婴儿。在非结构化互动研究中,如Varma等人利用家庭游戏视频中的注视固定模式,采用LSTM神经网络进行分析。人机交互研究则利用虚拟现实(VR)和眼球追踪技术,如Zhang等人通过视频刺激(眼球注视转移、手势转移)记录参与者反应,使用逻辑回归模型进行分类。机器人辅助互动研究主要侧重于行为检测而非诊断,如Nuovo等人使用软银机器人NAO在模仿任务中捕捉面部图像,评估注意力和训练表现。
行为检测研究的系统综述表明,AI技术能够有效识别多种社交行为特征。面部和注视行为分析方面,Chong等人使用佩戴式眼镜相机捕获儿童面部图像,应用ResNet-50等深度学习模型检测眼神接触时刻。社交参与度分析方面,Javed等人开发深度CNN模型,通过骨骼姿态和面部表情特征检测社交参与行为,包括凝视、微笑、三元互动等行为。多模态方法则整合多种行为数据,如Liu等人结合面部检测、头部姿态估计和响应延迟信息,使用决策树模型预测社会响应性评分。
偏倚风险和适用性评估使用QUADAS-2工具显示,26项研究在患者选择方面具有低偏倚风险,38项研究在流程和时序方面为低风险,37项研究在指数测试方面为低风险。大多数研究(29项)明确报告了参考标准,并被分类为低风险。在适用性方面,36项研究在患者选择方面具有低风险,所有研究在指数测试领域均为低风险,35项研究在参考标准方面为低风险。
诊断准确性的荟萃分析结果显示,AI算法在ASD分类中表现出良好的诊断性能。单变量荟萃分析显示合并敏感性为0.845,特异性为0.888,诊断比值比为58.965。双变量SROC曲线显示合并敏感性和特异性分别为0.769和0.817,AUC为0.862。三水平荟萃分析考虑研究组内多个结果之间的依赖性,总体诊断比值比为15.917(95% CI [4.775, 53.059]),存在显著异质性。调节分析表明,异质性受分类算法、输入特征模态和实验任务的共同影响。面部特征显著驱动诊断准确性,而SVM和基于决策树的算法显示较强的证据基础。鲁棒方差估计和敏感性分析证实了主要分析结果的稳定性。
这项研究的结论部分强调,AI技术在ASD诊断和社交行为分析中展现出显著潜力。基于面部和注视运动特征的AI算法能够有效区分ASD与TD个体,在社交互动评估中达到较高的诊断准确性。非结构化游戏环境中的准确性高于结构化任务,SVM和决策树等机器学习算法在辅助ASD诊断方面显示出较强的证据基础。AI技术还能够检测多种社交行为,包括注视、情绪表达和联合注意,为追踪变化或评估临床干预反应提供了可能性。
讨论部分指出,AI驱动算法有望提高ASD诊断和行为评估的客观性。当前临床诊断过程严重依赖对自然社交反应的主观观察,而眼部和面部运动是关键但难以编码的信息来源。研究成功利用从社交互动任务中提取的面部表情、注视模式和头部姿态训练机器学习算法,在有限临床样本中分析规律模式。这些面部特征可通过现成的摄像记录系统和眼球追踪器检测,在不同环境中具有可扩展性和可及性,支持行为标志物的常规监测,辅助控制、远程或家庭环境中的临床评估。
然而,作者也承认了研究的局限性。尽管荟萃分析结果被认为稳健,但仍需进一步验证。种族和民族是社会文化建构,算法性能的组间差异可能反映未测量的混杂因素,如社会经济地位或技术可及性。此外,缺乏涉及专家(如临床医生)的验证研究,相关临床测量的报告有限,在多样化神经发育、身体和精神诊断人群中的临床应用也较少。并非所有诊断聚焦的研究都包含在分析中,因为缺少进行荟萃分析所需的信息(如敏感性、特异性
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号