Macretina数据集:支持深度学习辅助早产儿视网膜病变诊断的专业标注资源

《Scientific Reports》:Macretina: a dataset, to support deep learning assisted retinopathy of prematurity diagnosis

【字体: 时间:2025年12月25日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对早产儿视网膜病变(ROP)诊断中缺乏高质量公开数据集的问题,开发了首个专业标注的多任务ROP数据集Macretina。该数据集包含1,432张视网膜图像,提供脊线/分界线分类、视盘定位和血管分割三种标注,经深度学习模型验证具有较高应用价值,为AI辅助ROP筛查提供了重要资源。

  
在新生儿重症监护领域,早产儿视网膜病变(ROP)犹如一个潜伏的"视力杀手",这种视网膜血管增生性疾病已成为儿童盲的主要原因之一。特别在印度等中等收入国家,超过64%的农村人口面临医疗资源匮乏的困境,ROP的及时诊断往往因专业眼科医生短缺而延误,导致许多婴儿错过最佳治疗窗口。
传统的ROP诊断依赖眼科医生通过视网膜成像进行人工评估,但这种方法存在明显局限性。一方面,不同医生之间的诊断一致性有限;另一方面,ROP的早期征象如脊线(demarcation line)和血管异常变化细微,极易被忽视。更令人担忧的是,一种名为Aggressive ROP(A-ROP)的快速进展型病变近年来在印度发病率上升,其不典型的临床表现更增加了诊断难度。
人工智能(AI)技术为ROP筛查带来了新希望。深度学习模型能够识别人眼难以察觉的细微病变特征,有望实现ROP的自动化筛查。然而,这一领域的进展却因高质量公开数据的缺乏而严重受限。现有ROP数据集往往只针对单一病理特征进行标注,或样本量不足以训练可靠的深度学习模型。这种"数据荒"成为制约AI辅助ROP诊断技术从实验室走向临床的关键瓶颈。
面对这一挑战,印度理工学院印多尔分校的Urvesh Trivedi、Abhishek Srivastava与Macretina医院的Pratik Mahajan医生合作,在《Scientific Reports》上发表了题为"Macretina: a dataset, to support deep learning assisted retinopathy of prematurity diagnosis"的研究论文,推出了一个专业标注的ROP数据集Macretina,旨在为AI辅助ROP诊断研究提供高质量数据资源。
研究人员采用的技术方法主要包括:从Macretina医院收集1,432张早产儿视网膜图像,使用3nethra Neo广角视网膜成像系统获取图像;通过专业眼科医生团队进行多轮质量控制和标注,创建三个子数据集分别用于分类、目标检测和分割任务;采用多种深度学习模型(VGG、MobileNet、DenseNet201、YOLOv5、U-Net等)验证数据集的实用性。
数据集准备
研究团队从Macretina医院收集了112名早产儿的1,432张视网膜图像,所有图像均使用3nethra Neo广角视网膜成像系统拍摄,视野角度为120度。经过严格的质量筛选,排除了303张模糊、有伪影或诊断相关性低的图像,最终973张图像进入标注流程。标注工作由资深ROP专家团队完成,标注者间一致性科恩卡帕值达到0.89,保证了标注质量的高可靠性。
数据集描述
Macretina数据集包含三个专业设计的子集:Macretina-Ridge包含465张图像,用于脊线/分界线的二分类任务;Macretina-OD包含500张带有视盘边界框标注的图像,支持目标检测任务;Macretina-BV包含38张A-ROP病例的血管分割标注,专注于复杂的血管异常分析。数据集涵盖了从正常视网膜到各阶段ROP的完整疾病谱,特别是包含了常规数据集中少见的A-ROP病例。
实验结果
在分类任务中,DenseNet201模型在Macretina-Ridge子集上取得了91.50%的准确率,表明数据集能有效支持脊线检测模型的开发。在视盘检测方面,YOLOv5模型表现优异,mAP@0.5达到0.994, recall为0.993,证明标注质量满足高精度定位需求。血管分割任务中,U-Net和AG U-Net模型在复杂A-ROP病例上仍能达到96%以上的准确率,尽管Dice系数相对较低(0.4442和0.4571),这反映了A-ROP病例血管异常的复杂性。
讨论与结论
Macretina数据集的独特优势在于其多任务标注设计和临床实用性。与现有ROP数据集相比,它同时提供三种关键病理特征的标注,支持完整的ROP诊断流程。专家验证的标注质量确保了数据可靠性,而包含的A-ROP病例增强了临床相关性。数据集的局限性在于未包含晚期ROP病例(4-5期)且血管分割标注数量有限,这些将在未来版本中完善。
研究的创新性体现在首次提供了专门针对印度人群的ROP数据集,采用了在当地广泛使用的3nethra Neo成像系统,这有助于开发更适合中等收入国家医疗环境的AI诊断工具。未来,团队计划扩展数据集规模,纳入多中心数据,并探索AI诊断模型与临床工作流程的整合。
Macretina数据集的发布填补了ROP研究领域高质量公开数据的空白,为开发可靠、可推广的AI辅助ROP筛查系统奠定了重要基础。特别是在医疗资源不均的地区,这一资源有望推动低成本、高效率的ROP筛查方案发展,最终降低早产儿因ROP导致的视力损害风险。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号