编辑推荐:
为解决新鲜肋骨骨折检测与分级诊断难题,研究人员开展基于深度学习模型的研究,结果显示模型性能优异,有助于提升医疗水平。
在医学影像诊断的领域中,肋骨骨折是胸部钝性创伤患者常见的损伤类型。它不仅影响着患者的健康,还与多种严重并发症相关,如肺挫伤、肺炎和血气胸等。而且,肋骨骨折的数量、位移情况以及是否伴有器官损伤,都与患者的死亡率息息相关。所以,精准识别肋骨骨折的数量和严重程度,对于制定合理的治疗方案、改善患者预后起着关键作用。
然而,当前的诊断方法面临着诸多挑战。虽然胸部多层螺旋 CT 扫描的应用提高了肋骨骨折的检测率,但由于肋骨骨折形状多样、结构复杂,在数百张薄层 CT 图像中准确识别所有骨折并不容易,漏诊现象时有发生。有文献表明,最初胸部 CT 扫描报告中,20.7% 存在肋骨骨折数量或位置的误判;即便经过肋骨重建,仍有 20.9% 的骨折被漏诊。这不仅会导致患者治疗延误,还可能加重病情,对患者生命健康构成威胁。
在此背景下,陆军军医大学等机构的研究人员开展了一项关于基于深度学习的新鲜肋骨骨折智能检测和分级诊断的研究。该研究成果发表在《BMC Medical Imaging》杂志上,为肋骨骨折的诊断带来了新的希望。
研究人员在开展此项研究时,运用了多种关键技术方法。首先,收集了陆军军医大学第一附属医院和重庆垫江人民医院 2021 年 1 月至 2023 年 4 月诊断为肋骨骨折患者的初始胸部 CT 扫描数据,同时纳入了公共 RibFrac 数据集中的 50 例 CT 扫描数据,构建了研究所需的样本队列。然后,基于 YOLOv8 算法,通过设计 C2f_EMA 模块、嵌入高效多尺度注意力(EMA)机制、改进特征金字塔网络(FPN)等方式,对模型进行优化,用于新鲜肋骨骨折的检测和分级。最后,使用平均精度均值(mAP)、精度、召回率和 F1 分数等指标评估模型性能,并通过与不同经验水平的胸外科医生对比,验证模型的有效性。
研究结果如下:
- 患者特征:研究共纳入 383 例肋骨骨折患者的数据,包括 4673 条注释,其中非严重骨折 3043 条,严重骨折 1630 条。训练集和测试集在性别、年龄方面无统计学差异,且两个中心患者的年龄也无显著差异,不过医院 A 的男性患者比例显著高于医院 B。
- 模型性能:在内部测试集中,模型对所有骨折类型的精度为 0.963,召回率为 0.934,mAP50 为 0.972,F1 分数为 0.948;在外部测试集中,精度为 0.880,召回率为 0.796,mAP50 为 0.857,F1 分数为 0.836。通过绘制精度 - 召回(PR)曲线可知,模型在不同类型骨折及内外部测试集中均表现良好,具有较好的泛化能力。此外,与其他模型对比实验显示,该模型在检测小目标方面更具优势。
- 与胸外科医生的性能比较:对比模型和不同经验水平胸外科医生的诊断性能,结果表明模型在精度和召回率上均优于医生,展现出在肋骨骨折检测方面的卓越能力。
研究结论与讨论部分指出,该深度学习模型在新鲜肋骨骨折的检测和分级诊断上表现出色,可作为 “第一读者” 辅助医生快速准确判断患者病情。与以往研究不同,此研究聚焦新鲜肋骨骨折,并对其进行智能分级,更贴合临床实际需求。模型通过优化网络结构,提升了特征提取、融合和检测能力。不过,研究也存在一定局限性,如模型无法提供骨折的具体解剖细节,样本量有待进一步扩大,前瞻性研究相对较少。未来,研究人员计划收集更多数据,开展前瞻性研究,进一步验证和优化模型。
总体而言,这项研究意义重大。它为新鲜肋骨骨折的诊断提供了一种高效、准确的方法,有助于提高诊断准确率,减少医生工作量,节省医疗资源,尤其在医疗资源有限的地区,能够为患者提供更及时、有效的医疗服务,推动了医学影像诊断领域的发展。