开发并验证一种用于三阴性乳腺癌识别和预后预测的人工智能系统:一项多中心回顾性研究
《Eco-Environment & Health》:Development and validation of an artificial intelligence system for triple-negative breast cancer identification and prognosis prediction: a multicentre retrospective study
【字体:
大
中
小
】
时间:2025年10月17日
来源:Eco-Environment & Health 17.6
编辑推荐:
本研究开发并验证了HipSonoNeuNet(HSNN)深度学习模型,通过多中心数据(22家医院,3082例)分析动态和静态超声图像,实现发育髋关节脱位(DDH)的自动诊断。HSNN在内部验证(AUC=0.99)和外部测试(AUC=0.99)中表现优异,敏感性达100%,特异性91%-94%,并显著提升无经验放射科医生的诊断准确性和效率。模型可自动定位关键诊断平面,支持动态视频分析,适用于资源有限地区。
髋关节超声是识别发育性髋关节发育不良(DDH)的主要工具,尤其适用于疑似婴儿群体。然而,尽管其在临床中被广泛应用,但髋关节超声诊断仍面临诸多挑战,包括结果的可重复性差和较高的误诊率。这些问题主要源于超声图像获取过程的主观性强、测量复杂以及对操作者经验的依赖。因此,本研究旨在开发并验证一种基于深度卷积神经网络的算法——髋关节超声神经网络模型(HSNN),以提高DDH的诊断效率和准确性。
### 研究背景与意义
DDH是一种影响新生儿和婴幼儿的髋关节异常疾病,其特征包括髋关节的不稳定、发育不良或脱位。流行病学研究表明,中国新生儿中DDH的患病率在1%至5%之间,而严重脱位的情况则更为罕见,约为0.6‰至3.4‰。如果DDH未能及时发现,尤其是与髋关节脱位相关的情况,可能会导致长期的健康问题,如步态异常、慢性疼痛以及髋关节早期退行性关节炎等。由于早期干预(如Pavlik吊带治疗)在DDH管理中的重要性,提高诊断的准确性和效率显得尤为重要。
传统髋关节超声诊断方法依赖于Graf分类系统,该系统要求操作者能够准确识别标准髋关节切面并进行复杂的测量。然而,这些步骤对操作者经验要求较高,且容易受到主观判断的影响,导致不同操作者之间的诊断结果存在较大差异。此外,髋关节超声图像获取和分析过程耗时较长,限制了其在基层医疗资源有限的地区推广使用。为了克服这些限制,本研究引入了人工智能(AI)技术,特别是深度卷积神经网络(CNN),以实现自动化诊断,提高诊断效率和准确性。
### 方法与研究设计
本研究是一项多中心、横断面研究,涵盖了中国22家医院的数据,时间跨度为2022年9月至2025年1月。研究共纳入3082名参与者,其中包括1718例非DDH病例和1364例DDH病例。研究分为三个阶段:第一阶段用于模型训练和内部验证;第二阶段用于评估模型与不同经验水平的放射科医生在诊断表现上的差异;第三阶段则用于前瞻性验证模型的泛化能力。
在第一阶段,模型使用2431名参与者(非DDH 1092例,DDH 1339例)进行训练,其中包含了大量髋关节超声图像(1429个动态视频,5857张静态图像)。这些图像经过质量控制,排除了不符合诊断标准的图像。模型的开发基于两种不同的深度学习框架:YOLOv11m用于动态视频中的关键切面检测,ResNet-50用于关键切面的分类。在训练过程中,我们采用了交叉熵损失函数和随机梯度下降(SGD)优化器,以确保模型在不同类型的髋关节图像中都能有效工作。
在第二阶段,研究评估了模型在实际诊断中的表现。5名资深放射科医生和7名初级放射科医生分别对500名参与者(其中19例为DDH)进行了独立评估。模型在辅助初级医生诊断时表现出显著的提升,其准确率从0.90提高到0.93,AUC从0.80提升至0.95,敏感度从0.69升至0.97,特异度从0.91升至0.92。同时,模型与专家的诊断一致性(Kappa值)达到了0.77,显示出较强的诊断能力。此外,模型的应用还显著减少了诊断所需的时间,提高了不同放射科医生之间的诊断一致性。
在第三阶段,研究团队在另外4家医院对151名疑似DDH的婴儿进行了前瞻性验证。模型在这一阶段同样表现出良好的诊断性能,准确率达到0.92,AUC为0.99,敏感度为1.00,特异度为0.92,与专家的诊断一致性(Kappa值)为0.76。这一阶段的结果进一步验证了模型在真实临床环境中的可靠性。
### 研究结果与分析
在模型开发和内部验证阶段,HSNN在动态视频中识别关键切面的准确率达到了0.99,召回率0.98,mAP50为0.98,mAP50-95为0.81。这些指标表明,模型在识别标准切面方面表现优异,能够有效地处理不同类型的髋关节图像。在分类方面,模型的敏感度为1.00,特异度为0.91,Kappa值为0.90,与专家的诊断一致性非常高。模型的处理时间仅为0.04秒,远低于放射科医生的平均处理时间(25.30秒),显示出其在诊断效率上的显著优势。
在第二阶段,模型与专家的诊断一致性(Kappa值)达到了0.77,显示出良好的诊断能力。然而,模型在某些情况下也存在误诊,特别是在处理非DDH病例时,由于负性病例的解剖特征相对固定,模型容易受到噪声干扰,误判为阳性。通过对这些误诊案例的深入分析,研究团队发现模型在处理动态视频时表现出更高的敏感度,这有助于减少漏诊的风险。
在第三阶段的前瞻性验证中,模型的诊断表现依然稳定,准确率达到了0.92,敏感度为1.00,特异度为0.92,AUC为0.99。这些结果表明,HSNN在不同医疗机构和不同患者群体中均表现出良好的泛化能力。此外,模型的处理时间仅为0.03秒,显著提高了诊断效率。
### 模型的优势与特点
HSNN的主要优势在于其自动化能力。传统的髋关节超声诊断依赖于人工识别和测量,这不仅耗时,而且容易受到操作者经验的影响。HSNN通过自动识别关键切面和分类,减少了人工干预的必要性,从而提高了诊断的效率和准确性。此外,模型能够处理动态视频,这在实际临床诊断中尤为重要,因为动态视频可以提供更多的信息,帮助识别复杂的髋关节异常。
HSNN的另一个显著特点是其对DDH的高敏感度。模型采用了“OR规则”进行视频级别的诊断,即只要在关键切面中有一个帧被判断为阳性,整个视频就被标记为阳性。这种设计策略使得模型在处理动态视频时能够更全面地识别潜在的异常,从而减少漏诊的可能性。尽管模型在处理动态视频时表现出较高的敏感度,但同时也存在一定的特异度下降,这可能导致一些非DDH病例被误判为阳性。然而,考虑到DDH筛查的临床需求,即更倾向于过度诊断而非漏诊,这种设计是合理的。
### 研究的局限性与未来展望
尽管HSNN在多个方面表现出色,但研究仍存在一些局限性。首先,模型训练和测试的数据主要来自中国境内的医院,这可能影响其在其他地区或不同人群中的适用性。其次,模型在处理某些特定类型的DDH病例时可能存在一定的偏差,尤其是在不同文化背景和遗传因素影响较大的地区。此外,模型的大小和计算需求被有意控制,以确保其在资源有限的临床环境中能够有效部署。
未来的研究方向包括扩大样本量、增加不同类型的DDH病例,以及在更多中心进行验证,以进一步优化算法并提高诊断的可靠性。此外,研究团队还计划探索模型在不同设备和操作条件下的表现,以确保其在实际应用中的广泛适用性。
### 结论与应用前景
综上所述,HSNN模型在髋关节超声诊断中表现出色,能够有效识别DDH,无论是静态图像还是动态视频。模型的高敏感度和快速处理能力使其在资源有限的地区和专家资源紧张的医院中具有重要的应用价值。通过提高诊断效率和准确性,HSNN有望成为DDH筛查的重要工具,帮助基层医疗机构和放射科医生提高诊断水平,减少误诊和漏诊的风险。此外,模型的自动化特性还可以优化临床工作流程,提高诊断的标准化水平,为DDH的早期干预提供有力支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号