编辑推荐:
为探究人工智能(AI)肺结节检测程序在超低剂量 CT(ULDCT)中的性能及图像重建方法的影响,研究人员用含人工肺结节的胸部模型扫描,结果显示 DLR 在低剂量下检测率高且图像质量好。该研究为肺癌筛查提供参考。
在医学影像学飞速发展的当下,肺癌筛查成为人们关注的焦点。低剂量 CT(LDCT)已广泛应用于肺癌筛查,其平均有效辐射剂量约为 1.5 - 2.0 mSv,是传统胸部 CT 的四分之一到五分之一。然而,为了进一步降低辐射风险,超低剂量 CT(ULDCT)技术应运而生,它能将有效辐射剂量降至 0.13 - 0.44 mSv。与此同时,人工智能(AI)技术也融入到计算机辅助检测(CAD)系统中,帮助放射科医生更高效、准确地识别肺结节。
但目前,CAD 系统在 DLR 重建的 ULDCT 图像中检测肺结节的有效性尚未得到充分验证。虽然之前研究表明 DLR 在低剂量下比传统图像重建方法更具优势,但与 AI - CAD 系统结合时,其是否能提升结节检测性能还不清楚。基于此,日本琉球大学(University of the Ryukyus)的研究人员开展了相关研究,旨在明确先进的图像重建方法在提高 AI 辅助肺癌筛查准确性方面的作用,为更安全、可靠的早期诊断方案提供依据。该研究成果发表在《Japanese Journal of Radiology》上。
研究人员采用了以下关键技术方法:首先,使用含有不同大小(12 mm、8 mm、5 mm 和 3 mm 直径)的实性和磨玻璃样(GGN)人工肺结节的胸部模型进行实验。然后,在 320 排探测器 CT 系统上,设置不同的管电压(120 kV 和 80 kV)和管电流(160 mA、80 mA 和 10 mA)组合对模型进行扫描。最后,利用滤波反投影(FBP)、混合迭代重建(HIR)、基于模型的迭代重建(MBIR)和深度学习重建(DLR)四种方法对扫描数据进行图像重建 。
研究结果
- 图像质量:通过测量不同直径人工结节和肺实质的平均 CT 值、标准差(SD),并计算图像质量指标,结果显示 HIR、MBIR 和 DLR 的图像质量均优于 FBP,其中 MBIR 的图像质量最佳。从重建时间来看,FBP 重建时间最短,MBIR 最长。所有扫描图像的辐射剂量均低于成人胸部 CT 的诊断参考水平。
- 结节检测率:在所有扫描方案和重建方法中,放射科医生的结节检测率均高于 CAD 系统。对于 CAD 和放射科医生而言,随着辐射剂量增加,结节检测率呈上升趋势,FBP 的检测率随剂量增加呈指数上升。在最低辐射剂量(80 kV,10 mA)下,FBP 对所有结节大小的检测率均为 0%;HIR 和 DLR 对≥5 mm 的实性结节和≥8 mm 的 GGN 检测率可达 100%;所有方法对 3 mm 的 GGN 检测率均为 0%。DLR 的 CAD 检测率最高(75.0%) 。
- 假阳性和假阴性:放射科医生的假阴性均出现在小尺寸结节(3 mm 实性结节、3 或 5 mm GGN)。超低剂量方案(80 kV/10 mA)下,HIR、MBIR 和 DLR 的 CAD 假阳性数比 FBP 多,差异有统计学意义;高剂量时,不同重建方法的假阳性数相近。假阴性的原因包括 CAD 系统未识别、结节位于肺野外、放射科医生不可见及未知原因等。
研究结论与讨论
该研究表明,AI - 肺结节检测在 ULDCT 中的性能强烈依赖于图像重建方法的选择。DLR 在最低剂量方案下仍能保持较高的结节检测率和图像质量,优于传统的 FBP 方法。但对于小尺寸结节的检测仍存在局限性。
先进的图像重建技术(如 HIR、MBIR 和 DLR)与 AI - CAD 系统的结合,有望提高肺癌筛查的准确性。在较低辐射剂量下实现准确的结节检测,符合 “合理尽可能低(ALARA)” 原则,有助于减少高风险人群重复筛查时的累积辐射暴露,提高小尺寸结节的检测率也对早期肺癌诊断意义重大。
不过,该研究也存在一定局限性。研究使用的是胸部模型,无法完全模拟体内复杂情况,如运动伪影和患者个体差异;未考虑 CAD 系统检测结节率的左右差异;未考虑 CAD 系统训练数据中成像设备和重建技术的比例;仅评估了单一 AI - CAD 系统,限制了研究结果的普遍性。未来还需开展多中心、多厂商的研究来进一步验证这些结果,推动相关技术在临床中的广泛应用。