编辑推荐:
拇外翻临床诊断需精准测量 HVA 和 IMA,传统手动法耗时且易受评估者偏倚影响,现有深度学习研究缺乏大样本标注数据集。本研究开发 HVAngleEst 数据集,含 1382 张 X 射线图像及全面标注,可实现全自动角度估计,为相关研究提供重要资源。
在足部疾病的诊疗领域,拇外翻(Hallux Valgus)是一种常见的足部畸形,常伴随显著的功能障碍和足部疼痛,其在女性中的患病率是男性的 2.3 到 4.7 倍
1,2。准确、可靠且可重复地测量拇外翻角度(Hallux Valgus Angle, HVA)和跖间角(Intermetatarsal Angle, IMA)对于拇外翻的诊断和确定合适的临床手术治疗至关重要
3-5。然而,传统的手动测量方法虽经美国骨科足踝学会(AOFAS)特设委员会标准化
6,7,但存在耗时、费力且不同评估者之间可能存在偏倚的问题。近年来,深度学习在医学影像任务如物体检测和分割中取得了显著进展
8-13,也有研究尝试将其应用于拇外翻角度估计,但现有方法通常将其视为分割任务后接线性回归
14-16,且训练这些模型需要大量标注良好的数据集。然而,由于医学数据的敏感性和公开可用性的困难,这在医学领域尤其具有挑战性。此外,现有的 X 射线数据集通常仅限于裁剪的足部区域图像,且只有一个包含极少数样本的数据集是公开可用的。
为了解决这些挑战,西安交通大学红会医院足踝外科的研究人员开展了相关研究,开发了 HVAngleEst 数据集。该研究成果发表在《Scientific Data》上。
研究人员主要采用了以下关键技术方法:首先进行数据收集与清理,数据集包含来自 1150 名患者的 1382 张 X 射线图像,其中 1332 张为西门子设备生成的 DICOM 图像,50 张为用佳能或尼康相机拍摄的打印 X 射线胶片照片,涵盖 130 名男性患者和 1020 名女性患者,左足 825 只,右足 762 只,患者年龄 17 至 83 岁。收集后对图像进行匿名化处理,去除敏感元数据,并对含个人信息的图像进行手动裁剪。然后使用 LabelMe 工具进行图像标注,由四位不同经验的骨科医生完成,包括足定位标注和 HVA、IMA 及线段标注,标注过程有严格的质量控制流程。最后进行技术验证,分别使用 YOLOv11s 和基于 MobileNetV3 的 DeeplabV3 进行足定位和分割任务训练,并使用线性回归模块估计 HVA 和 IMA。
研究结果
定位性能
在测试集上,足部检测的精度为 0.997,召回率为 1.0,在 IoU 阈值为 0.5 时的 mAP(平均精度)为 0.994,表明该数据集在足部位定位任务中具有极高的准确性。
分割性能
在分割任务中,大脚趾、第一跖骨和第二跖骨的线段预测平均 mIoU(平均交并比)为 0.538,像素精度为 0.993。各类别 mIoU 分别为大脚趾 0.393、第一跖骨 0.341、第二跖骨 0.426,显示出对不同部位线段分割的性能差异。
线性回归性能
测试集上,HVA 误差小于 3° 的百分比为 79.4%,小于 5° 的为 94.0%;IMA 误差小于 3° 的百分比为 94.6%,小于 5° 的为 99.3%,说明通过该数据集训练的模型在角度估计方面具有较好的准确性。
数据集结构与可用性
HVAngleEst 数据集可通过科学数据银行公开下载,其根文件夹包含 “images”“annotations”“tools” 子文件夹及 “datasets.csv” 文件。“datasets.csv” 包含图像相关详细信息,“annotations” 文件夹提供不同格式的标注文件,“tools” 文件夹包含用于数据集准备和算法实现的 Python 笔记本,方便研究人员使用。
HVAngleEst 是首个专门为拇外翻角度估计设计的大规模、开放获取数据集,包含全面的注释,如足部定位、拇外翻角度和每个指骨的线段。该数据集能够实现全自动的端到端拇外翻角度估计,减少了人工劳动并消除了评估者偏倚。其纳入多源成像数据(高质量 DICOM 图像和移动拍摄的胶片照片),反映了真实世界的临床实践,使 AI 算法能够稳健地处理不同质量和来源的图像数据。通过严格的标注流程和质量控制,确保了标注数据的准确性和可靠性。技术验证结果表明,基于该数据集训练的模型在足定位、分割和角度估计任务中均表现出较好的性能。该数据集的发布为拇外翻角度估计的深度学习研究提供了重要的资源,有助于推动相关算法的开发和临床应用,有望减少临床诊断中的人工成本和误差,提高诊断效率和准确性。未来研究可进一步比较负重 CT 扫描和 X 射线在评估拇外翻畸形中的准确性,为临床决策提供更多循证指导27-29。