
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于智能手机视频与双交叉注意力建模的眼睑痉挛早期诊断系统:融合面部姿态估计的智能辅助技术
【字体: 大 中 小 】 时间:2025年08月07日 来源:npj Digital Medicine 15.1
编辑推荐:
本研究针对眼睑痉挛(BSP)早期诊断困难的问题,开发了DCA-ViViT深度学习框架,通过分析智能手机拍摄的面部视频实现BSP严重程度、频率及诊断的多维度评估。模型在847例患者视频中验证显示:严重程度(准确率0.828)和频率(0.82)评估表现优异,诊断准确率达0.674。SHAP分析揭示了预测关键帧,前瞻性试验证实AI辅助可使初级眼科医生诊断准确率提升18.5%,为BSP的远程筛查提供了可解释性解决方案。
眼睑痉挛(Blepharospasm, BSP)作为一种常见的局灶性肌张力障碍,影响着每10万人中多达732例患者。这种以眼睑不自主收缩为特征的疾病不仅导致功能性失明,还引发社交尴尬和情绪困扰。然而,其细微的临床表现常被误诊为干眼症或重症肌无力,平均诊断延迟达40个月之久。更严峻的是,61%的病例会在发病5年内症状扩散至其他面部区域。传统诊断依赖经验丰富的神经科医生肉眼观察,但短暂且不可预测的症状发作使得临床评估困难重重,甚至肌电图(EMG)也可能出现假阴性结果。
针对这一临床困境,浙江大学医学院附属第二医院的研究团队开发了名为DCA-ViViT的双交叉注意力视频视觉变换器模型。这项发表在《npj Digital Medicine》的研究创新性地利用智能手机拍摄的日常视频,结合468个面部特征点的高精度追踪,实现了BSP的自动化早期筛查。研究人员收集了2016-2023年间847例患者的面部视频构建训练集,通过融合原始视频帧与面部网格坐标的双模态数据,避免了传统子帧采样造成的关键信息丢失。
关键技术包括:(1)采用FaceMesh提取468点面部标志物;(2)构建双交叉注意力机制实现视频时空特征与面部几何特征的动态交互;(3)应用SHAP值可视化模型决策依据;(4)前瞻性验证集(N=179)评估AI辅助诊断效果。模型在保留完整时序信息的同时,通过水平镜像增强解决了单侧症状识别的难题。
【数据特征】
研究纳入847例视频数据,其中单眼BSP占28.1%,双眼BSP占59.0%。年龄分布显示所有20岁以下病例均属非BSP组,患者平均年龄57.9岁(SD 11.7)。严重程度分类中66.7%属重度,频率评估中73.2%为高频发作。前瞻性验证集平均年龄更高(61.4岁),暗示模型在老年人群中的稳健性。
【模型性能】
DCA-ViViT在15项评估指标中10项领先基准模型。特别在严重程度和频率分类中召回率超93%,能有效识别阳性病例。诊断任务表现相对较低(准确率0.674),进一步分析揭示模型对双眼BSP识别准确率达90%,但单眼病例仅25%,反映单侧症状中健眼微妙运动的干扰。年龄分层显示70-79岁组严重程度识别更优,可能因老年性眼睑松弛使症状更易观察。
【模型可视化】
SHAP分析将30fps视频中连续关键帧与临床判断对齐:诊断任务关注异常眨眼片段(约0.5s),严重程度识别依赖多肌群收缩帧,频率评估锁定持续超1s的异常眨眼。专家验证显示95%的SHAP高亮片段与临床关键时段吻合,如

【临床验证】
前瞻性试验中,DCA-ViViT在严重程度和频率评估上达到与资深医师相当的准确率。AI辅助使初级医师诊断准确率最高提升18.5%,

这项研究突破了传统BSP诊断的时空限制,其创新性体现在三方面:首先,首次将双交叉注意力机制应用于运动障碍分析,通过

生物通微信公众号
知名企业招聘