
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于对象无关提示学习的深度学习模型在糖尿病视网膜病变早期筛查中的开发与验证
【字体: 大 中 小 】 时间:2025年08月28日 来源:BMC Medical Informatics and Decision Making 3.8
编辑推荐:
本研究针对糖尿病视网膜病变(DR)早期筛查中医学标注数据稀缺和患者隐私保护的难题,创新性地提出基于对象无关提示学习(DR_OAPL)的零样本检测系统。通过对比预训练文本-图像编码器架构,结合可学习文本指令模板和局部特征优化技术,在5个内部测试集和智能手机采集的外部测试集上实现了平均89.9%的敏感性和88.8%的特异性,显著优于传统迁移学习方法。该研究为突破医学数据标注瓶颈提供了新范式,尤其在微动脉瘤(MA)早期检测方面达到95.19%的AUROC,对DR的早期干预具有重要临床价值。
糖尿病视网膜病变(DR)作为全球可预防性失明的主要原因,其早期筛查面临双重困境:一方面,传统AI模型依赖大量专家标注数据,而医学图像标注既昂贵又涉及隐私风险;另一方面,早期病变如微动脉瘤(MA)体积微小且特征隐匿,现有筛查系统对其检测灵敏度不足。当患者出现明显症状时,视网膜损伤往往已不可逆。这种"标注依赖"与"早期检测"的矛盾,促使研究者探索不依赖标注数据的智能诊断新路径。
最新发表于《BMC Medical Informatics and Decision Making》的研究突破性地将视觉语言预训练技术引入DR检测领域。Feifei Cao、Xitong Guo等研究者构建的DR_OAPL系统,通过对比预训练双编码器架构(临床文本编码器ClinicalBERT与图像编码器ResNet50),开发可学习文本指令模板实现零样本迁移。关键技术包括:1) 基于MIMIC-CXR和CBIS-DDSM的跨模态对比预训练;2) 对角显著注意力图(DPAM)增强局部特征提取;3) 联合全局-局部优化的异常检测策略。研究采用DRIVE等5个公开数据集和智能手机采集的IDRiD数据集进行验证。
主要研究结果
检测性能评估
系统在内部测试集达到平均AUROC 0.884,外部智能手机图像测试集保持0.874的AUROC。相较于传统迁移学习模型(如DeepDR),在微动脉瘤检测任务中提升11.15%的AUROC值。
病灶类型特异性

ROC曲线分析显示,对MA和硬性渗出物的检测AUROC分别达95.19%和96.25%,证实系统对早期病变的卓越识别能力。
特征可视化分析

定位可视化表明,DR_OAPL能精确圈定MA病灶范围,其定位精度显著优于U-Net等传统模型。
预训练模式比较
t-SNE聚类证明,采用医学数据预训练的模型比ImageNet预训练模型在特征空间形成更紧密的病灶聚类,验证领域适配性的重要性。
研究启示
该研究通过三大创新突破现有技术瓶颈:首先,设计的"照片显示DR伴[病变]"动态文本模板,使模型无需病灶标注即可建立视觉-语义关联;其次,Q-Q/V-V注意力机制革新捕获到MA的细微血管异常;最后,对比学习框架有效缓解医疗数据隐私与标注成本的矛盾。临床转化方面,系统在智能手机图像上的稳定表现,为基层医疗DR筛查提供可能。
未来研究可沿两个方向拓展:一是将文本指令模板扩展至其他视网膜病变(如青光眼);二是探索多模态数据(如OCT+CFP)的联合分析。这项研究不仅为DR早期诊断树立新标准,更为医学图像分析开辟了"少标注依赖"的技术路线,对资源有限地区的慢性病防控具有特殊意义。
生物通微信公众号
知名企业招聘