
-
生物通官微
陪你抓住生命科技
跳动的脉搏
TN5000:首个面向甲状腺结节检测与分类的开放式超声影像数据集及其诊断价值研究
【字体: 大 中 小 】 时间:2025年08月17日 来源:Scientific Data 6.9
编辑推荐:
针对甲状腺结节超声诊断中标注可靠性不足和数据集单一性问题,中国医学科学院肿瘤医院团队构建了TN5000数据集——包含5000例经FNA活检确认的B超图像,提供专业标注与标准化格式。研究通过统计分析结节特征并建立检测分类基准(mAP达0.810),为AI辅助诊断提供高质量数据支撑,显著降低不必要活检风险。
甲状腺疾病作为最常见的内分泌紊乱,其癌症发病率近30年持续攀升。超声成像虽因无创、实时等优势成为甲状腺结节诊断首选,却面临图像解读高度依赖经验、噪声干扰等挑战。更棘手的是,现有数据集或标注不可靠(仅采用TI-RADS评估)、或未公开,且多局限于单一任务(分类或分割),缺乏统一评估基准。这些问题严重制约了AI辅助诊断系统的开发与应用。
中国医学科学院肿瘤医院的研究团队在《Scientific Data》发表研究,推出目前最大规模的开放式甲状腺结节超声数据集TN5000。该数据集包含5000张经FNA活检病理确认的B超图像,由资深放射科医师完成结节定位(红色框标注)与性质判定(恶性MN/良性BN),数据格式采用PASCAL VOC标准。研究通过统计建模分析结节尺寸分布特征(如
关键技术包括:1)三阶段标注流程(初级标注-专家复核-病理确认);2)多机型超声图像采集(GE Logiq E9/S7,5-15MHz);3)基于ResNet/DETR等架构的基准模型构建;4)交叉验证与F1-score等多维评估。
【数据特性】
统计显示结节尺寸呈双峰分布,恶性结节占比71.4%(3572例),打破"大结节即恶性"的常规认知。

【基准测试】
DETR+ResNet50组合表现最优(mAP 0.810),恶性结节检测准确率(AP 0.849)显著高于良性结节(AP 0.771)。

该研究创建了甲状腺超声诊断的新标准:1)首次实现检测分类双任务协同优化,使不必要活检减少20%以上;2)提供经病理金标准验证的标注,可靠性远超TI-RADS评估;3)数据多样性覆盖不同机型、年龄及结节特性。未来可通过迁移学习将该框架拓展至乳腺结节等超声诊断领域,但需注意Swin Transformer等复杂模型在当前数据规模下表现欠佳的问题。
生物通微信公众号
知名企业招聘