编辑推荐:
为解决低收入和中等收入国家眼科数据匮乏、现有数据集无法反映现实需求等问题,IPTAN 研究人员开展 mBRSET 数据集相关研究。结果显示该数据集可有效支持临床预测和分析。推荐阅读,助您了解眼科数据新成果。
在眼科疾病的诊断和监测中,视网膜成像检查有着举足轻重的地位。通过视网膜眼底照片,医生能够清晰观察到眼部后段结构,包括视网膜、视盘、黄斑和血管等,为诊断提供关键依据。然而,现实却给眼科疾病的防治带来了诸多难题。
在低收入和中等收入国家(LMICs),眼科数据极度匮乏。传统的视网膜成像技术依赖桌面式眼底相机,遵循早期糖尿病视网膜病变研究(ETDRS)的严格准则。但这种方式存在诸多弊端,设备体积庞大、安装繁琐,对空间要求高,采集过程复杂,而且前期投入成本巨大。这使得它难以在资源有限的地区广泛应用,进一步加剧了眼科数据的稀缺状况 。
与此同时,便携式设备的出现为解决这些问题带来了曙光。它们小巧便携、成本低廉,特别适合在资源受限的偏远地区和医疗条件薄弱的社区使用。借助便携式设备,社区健康筛查和远程医疗咨询等活动得以开展,让更多人能够便捷地接受眼科检查。而且,人工智能(AI)算法与便携式设备的结合,有望彻底改变医疗护理模式,极大地提高疾病筛查、诊断和监测的效率。但目前 AI 算法的准确性和公平性备受质疑,主要原因在于缺乏具有代表性的数据和通用性强的算法。现有的眼科数据集无法充分反映 LMICs 国家的实际情况,也未能跟上便携式视网膜成像技术的发展步伐。
为了攻克这些难题,来自 Instituto de Ensino Superior Presidente Tancredo de Almeida Neves(IPTAN)的研究人员,在《Scientific Data》期刊上发表了题为《mBRSET: a mobile Brazilian retinal dataset for diabetic retinopathy screening and demographic analysis》的论文。研究人员收集了巴西不同种族背景人群的视网膜图像,建立了 mBRSET 数据集,验证了该数据集在糖尿病视网膜病变诊断和人口统计学分析方面的有效性,为眼科疾病的研究和防治提供了重要资源。这一成果意义非凡,它为开发 AI 算法提供了有力支持,有助于在资源受限的环境中提升眼科护理水平,推动了全球眼科医疗事业的进步。
在研究过程中,研究人员运用了多种关键技术方法。数据采集方面,使用 Phelcom Eyer 便携式手持视网膜眼底相机,与运行 Android 11 的三星 Galaxy S10 配合,在药物散瞳后采集视网膜照片。数据集构建时,去除图像中所有可识别的患者信息,确保数据安全,并由两名眼科专家基于国际临床糖尿病视网膜病变(ICDR)分级系统进行标注,遇到分歧时由第三位资深专家裁决。技术验证阶段,将 mBRSET 数据集与其他公开视网膜数据集对比;采用 ConvNeXt V2、DINO V2 和 Swin V2 等先进深度学习模型进行多项预测任务;数据预处理时,将数据集按 70%、10%、20% 的比例划分为训练集、验证集和测试集,调整图像分辨率并归一化处理;训练和评估模型时,使用 ImageNet 预训练权重初始化模型,采用 Adam 优化器,结合焦点损失函数处理类别不平衡问题,通过准确率、F1 值等指标评估模型性能。
研究人员首先对收集的数据进行了多维度的分析。在患者层面,他们从人口统计学、临床和图像三个角度展开研究。
- 人口统计学分析:mBRSET 数据集涵盖了 1291 名患者的 5164 张图像。其中女性占比 65.06%,男性占比 34.93%,平均年龄 61.44 岁,这表明参与研究的人群以老年人为主,这与糖尿病相关眼部疾病的常见发病年龄相符。而且,大部分患者(92.3%)没有健康保险,教育程度参差不齐,其中未完成小学教育的人数最多,占比 42.2%。这些数据充分展示了该数据集患者群体的多样性和代表性。
- 临床分析:研究发现,患者的糖尿病平均病程约为 9.53 年。在治疗方式上,84.61% 的患者接受口服药物治疗,20.79% 的患者使用胰岛素治疗。同时,系统性高血压在患者中较为普遍,占比 71.4%,而酒精摄入、吸烟和肥胖的比例相对较低,分别为 14.0%、6.4% 和 8.0%。此外,17.1% 的患者患有血管疾病,还有部分患者存在急性心肌梗死、肾病、神经病变和糖尿病足等并发症。这些临床特征揭示了糖尿病患者面临的复杂健康问题。
- 图像分析:对 4885 张图像的分析显示,76.79% 的图像未显示糖尿病视网膜病变(DR)迹象,轻度、中度、重度非增殖性 DR 以及增殖性 DR 的图像占比分别为 5.56%、11.64%、1.67% 和 4.33%,8.69% 的图像存在黄斑水肿。在图像质量方面,82.7% 的图像存在某种伪影,但 94.3% 的图像质量良好,不影响评估。而且,评估者之间的一致性较高,ICDR 评分的加权 kappa 值为 0.863,黄斑水肿识别的加权 kappa 值为 0.618。
随后,研究人员进行了技术验证,进一步探究 mBRSET 数据集的实用性。
- 数据集比较:将 mBRSET 与其他公开的视网膜眼底数据集,如 BRSET、EyePACS、Messidor 2 和视网膜眼底多疾病图像数据集(RFMiD)进行对比。结果发现,mBRSET 在视图位置、标签、数据集大小、临床和人口统计信息可用性、糖尿病视网膜病变分类、国籍和相机类型等关键属性上具有独特之处,尤其是它包含了丰富的临床和人口统计信息,且图像由手持相机拍摄,更贴合现实应用场景。
- 预测任务:运用 ConvNeXt V2、DINO V2 和 Swin V2 等先进的深度学习模型,在多个与临床相关的预测任务中进行验证。
- 糖尿病视网膜病变分类:在 3 类分类任务中,模型的 F1 分数在 79.19 - 80.33 之间,ConvNeXt-V2 Large 表现最佳,F1 分数达到 80.33;在二元分类任务中,DINO-V2 Large 的 F1 分数最高,为 87.4。尽管准确率普遍较高,但 F1 分数更能反映模型在处理数据集中类别不平衡问题时的性能。
- 黄斑水肿检测:三种模型在检测黄斑水肿方面都表现出色,F1 分数均超过 82%,其中 ConvNeXt-V2 Large 的 F1 分数最高,为 83.06。这表明 mBRSET 数据集虽然存在图像一致性较低的问题,但模型仍能保持较高的诊断性能。
- 人口统计学预测:在性别预测任务中,模型的 F1 分数在 80.83 - 84.38 之间,ConvNeXt-V2 Large 再次表现最佳;教育程度预测的难度较大,F1 分数在 69.94 - 72.33 之间;保险状态预测的 F1 分数在 71.4 - 76.11 之间,Swin-V2 Large 表现最优。这些结果揭示了深度学习模型从视网膜图像中推断人口统计学和社会经济信息的潜力,为研究人口健康和解决医疗保健不平等问题开辟了新的途径。
综合上述研究,研究人员得出结论:mBRSET 数据集是首个公开的、使用手持视网膜相机在现实高负担场景下采集的糖尿病视网膜病变视网膜数据集。它涵盖了来自不同背景的 1291 名患者的 5164 张图像,包含丰富的元数据,如年龄、性别、糖尿病病程、治疗方法和合并症等。通过与其他数据集的比较以及在多个预测任务中的验证,证明了 mBRSET 数据集在糖尿病视网膜病变诊断和人口统计学分析方面的有效性。尽管手持相机图像存在一些局限性,但先进的深度学习模型在该数据集上仍能取得较高的准确率和稳健的性能指标。
mBRSET 数据集的建立具有重要意义。它填补了 LMICs 国家眼科数据的空白,为研究人员提供了一个宝贵的资源,有助于开发更准确、更公平的 AI 辅助诊断工具。借助这个数据集,研究人员可以深入探究糖尿病视网膜病变与各种因素之间的关系,优化疾病的筛查和诊断流程,为资源受限地区的眼科护理提供有力支持。而且,通过对人口统计学信息的预测研究,能够更好地理解社会经济因素对健康的影响,推动医疗资源的合理分配,朝着更公平的医疗保健目标迈进。这一研究成果为眼科医疗领域带来了新的希望和发展方向,有望改善全球众多糖尿病患者的眼部健康状况。