编辑推荐:
为验证北美放射学会(RSNA)2023 年腹部创伤 AI 挑战赛获奖机器学习(ML)模型在 CT 检测脾损伤中的性能,研究人员开展单中心回顾性研究。结果显示该模型性能良好,支持其临床应用,凸显 RSNA AI 挑战赛的价值。
本研究旨在使用大型、地理和时间上不同的外部数据集,验证北美放射学会(RSNA)2023 年腹部创伤人工智能(AI)挑战赛中一个获奖的机器学习(ML)模型在 CT 扫描检测脾损伤方面的性能。
研究采用单中心回顾性研究,使用的外部数据集包含 1216 次 CT 扫描(其中 608 次脾损伤阳性,608 次脾损伤阴性)。该 ML 模型在 RSNA 腹部创伤 CT(RATIC)数据集上进行训练,采用多组件流程,包括 2D MaxVit、2.5D CoatNet 和长短期记忆网络(LSTM)进行研究层面的预测。通过灵敏度、特异性、阳性预测值(PPV)、阴性预测值(NPV)、准确率、F1 评分和曲线下面积(AUC)评估模型性能。
结果显示,该 ML 模型对脾损伤的二分类 AUC 为 0.931(95% 置信区间:0.917,0.945),准确率为 0.849(95% 置信区间:0.827,0.868),灵敏度为 0.747(95% 置信区间:0.711,0.780),特异性为 0.951(95% 置信区间:0.930,0.965)。对于高级别脾损伤,模型的 AUC 为 0.950(95% 置信区间:0.932,0.968),准确率为 0.928(95% 置信区间:0.912,0.941),灵敏度为 0.719(95% 置信区间:0.643,0.784),特异性为 0.958(95% 置信区间:0.944,0.968)。
结论表明,该 ML 模型在 CT 扫描检测和分级脾损伤方面表现出强大、可靠的性能和泛化能力。这支持了其潜在的临床应用,特别是对脾创伤患者进行快速准确的诊断,同时也凸显了 RSNA AI 挑战赛在推动医学影像学临床研究和应用方面的价值。