编辑推荐:
肺癌筛查(LCS)对无症状患者意义重大,但行政代码易误判。研究人员开发并验证自动识别 LCS 的算法。结果显示,该算法敏感度达 97%、特异性 79%,比行政代码更精准,有助于准确评估 LCS 效果,推动相关研究发展。
在医学领域,肺癌是严重威胁人类健康的 “杀手”。肺癌筛查(Lung Cancer Screening,LCS)使用年度低剂量胸部计算机断层扫描(Low-Dose Computed Tomography,LDCT)能有效降低肺癌死亡率,已被纳入国家指南。然而,在利用常规健康数据进行 LCS 相关研究时,却遇到了难题。以往研究多依靠行政计费代码来衡量 LCS,但这种方式存在严重缺陷。诊断性检查(比如因体重减轻等症状而进行的检查)若未被严格排除,会导致研究结果出现偏差。例如,在国家肺癌筛查试验(National Lung Screening Trial,NLST)中,有症状个体被误计为 “筛查对象”,使得异常扫描、手术及其他危害和肺癌检测的估计率被人为抬高。此外,将用于其他指示(如根据 Fleischner 标准进行的结节监测)的 LDCT 纳入,也会造成分类错误,夸大 LCS 的使用情况。而人工图表审查虽为金标准,却耗时费力。为了解决这些问题,来自美国旧金山退伍军人医疗保健系统(San Francisco VA Health Care System)等机构的研究人员开展了一项研究,旨在开发并验证一种能自动识别用于 LCS 的胸部成像检查的算法。该研究成果发表在《Journal of General Internal Medicine》上,对推动 LCS 研究的发展具有重要意义。
研究人员用到的主要关键技术方法包括:首先,利用退伍军人事务部(Veterans Health Affairs,VHA)的行政代码和文本字段数据,开发了一种四步算法。通过查询特定的当前程序术语(Current Procedural Terminology,CPT)代码确定门诊胸部 CT 成像,并搜索放射学订单中的筛查术语、诊断术语和 Fleischner 相关术语;其次,采用人工图表审查作为金标准,对算法筛选出的 “筛查” 扫描进行 100% 审查,对 “非筛查” 扫描随机抽取超过 10% 进行审查;最后,运用标准的统计分析方法,计算算法的敏感度、特异性、阳性预测值(Positive Predictive Value,PPV)和阴性预测值(Negative Predictive Value,NPV)等指标。
研究结果如下:
- 研究队列特征:研究队列从 320 万 VHA 初级保健人群中抽样,最终纳入 4503 人。其中男性占 82%,白人占 75%,27% 拥有大学学位,19% 符合 LCS 资格。
- 算法性能评估:对 1279 次门诊胸部 CT 扫描进行分析,算法无法分类 22% 的扫描,这些大多为非筛查扫描,被排除分析。在符合 LCS 资格的个体中,算法识别 LCS 胸部成像的敏感度为 97%(95% CI 91–99%),特异性为 79%(95% CI 58–93%)。在所有个体中,算法表现相似,PPV 为 90%,NPV 为 93%。
- 算法与行政代码比较:与行政代码相比,算法准确性更高。行政代码识别为 LCS 的扫描中,实际只有 69% 为真正的筛查,而算法识别为筛查的扫描中,95% 经人工审查确为筛查。
研究结论和讨论部分指出,该新型自动化算法在识别 LCS 成像研究方面表现出色,能准确区分筛查和诊断性胸部成像,这是在非随机环境中对 LCS 进行无偏分析的必要步骤。研究还强调了依赖未经验证的行政代码存在的局限性,准确识别胸部 CT 筛查扫描对高质量的 LCS 健康影响研究至关重要。尽管该研究存在一定局限性,如数据可能无法推广到非 VHA 环境、部分扫描无法分类等,但算法仍具有重要价值,为后续研究奠定了基础,后续还需在非 VHA 健康系统中进一步验证该算法。