
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于诊断监督对比学习的生成式人工智能在眼底荧光造影解读中的应用与临床评估
【字体: 大 中 小 】 时间:2025年07月03日 来源:npj Digital Medicine 12.4
编辑推荐:
本研究针对眼底荧光造影(FFA)解读对专业知识的依赖性和耗时性问题,开发了诊断监督对比学习框架InterpreFFA。该系统在多中心数据集验证中展现出卓越性能,能显著提升住院医师诊断准确率(85.55%→90.34%)并缩短报告时间(153.93s→108.08s)。六位认证眼科医生的五级量表评估证实,AI辅助生成的报告质量接近人工报告(4.12 vs 4.38),为FFA解读提供了高效可靠的辅助工具。
眼底荧光造影(FFA)作为诊断脉络膜视网膜疾病的"金标准",其解读过程却面临双重挑战:一方面需要资深眼科医生30分钟以上的专业判读,另一方面全球眼科医生缺口高达23万。在糖尿病视网膜病变(DR)等疾病高发的背景下,传统人工解读模式已难以应对日益增长的检查需求。更棘手的是,现有AI辅助系统多聚焦于图像分类,无法生成包含病灶位置、数量、形态等关键临床信息的结构化报告。
浙江大学医学院附属第二医院等机构的研究团队在《npj Digital Medicine》发表的研究,创新性地将诊断监督机制引入对比学习框架,开发出InterpreFFA系统。研究团队收集了来自三家医院的20,052张FFA图像和1,833份报告,涵盖7种主要眼底疾病。技术核心包括:1)采用ResNet101提取图像特征;2)构建记忆驱动Transformer架构;3)设计诊断监督对比损失函数;4)建立包含自然语言生成(NLG)和临床效能(CE)的双重评估体系。
【自动评估】
InterpreFFA在BLEU4(0.321)、ROUGE-L(0.540)等NLG指标上显著优于基线模型,临床关键指标识别灵敏度达82.6%。外部验证显示模型对"动脉瘤"等病灶的识别AUC值达0.831,证明其良好的泛化能力。
【临床有效性评估】
通过模拟临床环境的双盲测试发现:住院医师使用AI辅助模式时,除VKH外所有疾病诊断准确率均显著提升(p<0.05),其中DR诊断准确率从85.55%提升至90.34%。报告撰写时间缩短30%(153.93s→108.08s,p<0.001),且特异性保持稳定(83.7%)。
【眼科医生评价】
六位专家采用五级量表评估显示:纯AI报告得分(4.12)虽低于人工报告(4.38),但AI辅助报告获得最高评分(4.46)。值得注意的是,84.7%的低分报告源于关键病灶识别错误,而AI辅助组此类错误最少。典型案例分析显示,AI能有效提示黄斑受累等关键特征,避免DR分期误判。
该研究突破性地构建了FFA报告生成的临床转化闭环:1)首创诊断监督对比学习框架,使模型能模拟眼科医生的决策逻辑;2)开发支持图像标注的在线诊断平台,实现AI与工作流的无缝衔接;3)建立包含12项指标的多元评估体系。尽管在罕见病(VKH)识别上仍有不足,但InterpreFFA已展现出改变FFA诊断范式的潜力——在保持专业水准的前提下,可使单例检查的医生耗时减少45秒,按年接诊量3000例计算,单个医疗机构每年可节省375小时诊疗时间。这项研究为医学多模态大模型的临床落地提供了重要范式。
生物通微信公众号
知名企业招聘