
-
生物通官微
陪你抓住生命科技
跳动的脉搏
诊断准确性研究中的估计量框架:提升诊断试验设计与解读的新范式
【字体: 大 中 小 】 时间:2025年09月20日 来源:Statistics in Medicine 1.8
编辑推荐:
本文系统性地将ICH E9(R1)中的估计量(Estimand)框架引入诊断准确性研究领域,创新性地提出针对干扰事件(IE)的六种处理策略(诊断政策策略、指示事件策略、假设策略等),为规范诊断试验设计、减少偏倚和增强结果解读的一致性提供了重要方法论支撑,对推动循证诊断学发展具有里程碑意义。
诊断准确性研究通过评估诊断测试在真实临床环境中识别目标疾病状态的能力,为医疗决策提供关键证据。与传统治疗性研究不同,诊断研究的核心关注点在于测试决策过程的准确性而非患者健康结局。国际人用药品注册技术协调会(ICH)E9(R1)增指南提出的估计量框架为治疗性试验提供了标准化框架,但其在诊断研究中的适用性尚未系统建立。诊断过程中出现的干扰事件(Interfering Events, IE)——如检查中止、图像质量不佳或意外揭盲——可能显著影响测试结果的可靠性和完整性,迫切需要建立专门针对诊断研究的估计量框架来规范处理方案。
诊断研究通常包含指数测试和参考标准(金标准)两个核心组件,通过灵敏度(sensitivity)和特异性(specificity)等指标量化测试性能。研究设计可分为单测试准确性研究和比较准确性研究,受试者招募方式包括横断面抽样和病例对照设计。与治疗性研究中发生在治疗后的 intercurrent events(ICE)不同,诊断中的IE特指在测试执行过程中发生、直接影响测试结果或导致结果缺失的事件,其发生频率往往与疾病状态相关,且观察期通常限于测试执行阶段。
干扰事件被定义为研究入组后、测试执行期间发生的可能影响结果解读或导致结果缺失的事件。常见IE包括:
中间测试结果(无法明确分类为阳性/阴性)
不可解读结果(因图像质量差或样本量不足导致)
意外揭盲
测试方案修改(如追加辅助测试)
测试前已开始治疗
受试者拒绝测试或提前终止
合并症影响(如溶血影响血液检测)
研究提出六种核心处理策略:
诊断政策策略:忽略IE影响,直接使用实际获得的测试结果
指示事件策略:将IE本身作为诊断指标(如将因呼吸急促中止扫描直接判为阳性)
挫折策略:将发生IE的结果视为错误分类(如技术故障导致的结果一律判为错误)
假设策略:估计无IE发生时的理想化准确率(通过基线数据插补缺失值)
监测下策略:仅使用IE发生前获得的有效数据进行评估
主分层策略:按IE发生可能性分层评估(如仅评估能规律呼吸的患者亚组)
每种策略对应不同的临床问题,选择需基于IE与疾病状态的相关性。例如咳嗽导致的图像模糊适用诊断政策策略,而幽闭恐惧症导致的中止则适合采用假设策略。
通过假设的肺癌CT筛查研究(200名受试者,40例肺癌患者)演示不同策略对准确性的影响:
诊断政策策略:灵敏度70%,特异性90%
假设策略:灵敏度75%,特异性92.88%
指示事件策略(中止判为阳性):灵敏度90%,特异性68.75%
主分层策略(无IE亚组):灵敏度75%,特异性91.67%
结果清晰显示策略选择对准确性评估的显著影响,验证了预先明确处理策略的必要性。
诊断估计量由五个核心属性构成:
人群:测试的目标应用人群(如年龄>30岁的肺癌疑似患者)
目标条件:明确定义的疾病状态(如组织学确认的肺癌)
指数测试:测试程序与决策规则的详细规范(如放射科医师评估的CT扫描)
准确性度量:评估指标(如灵敏度/特异性、AUC等)
IE处理策略:针对每种IE的预设处理方案
以CT肺癌筛查为例的完整估计量规范显示,该框架通过明确每个属性之间的内在联系,确保临床问题与统计估计的一致性。
估计量作为理想化概念,在实际研究中面临多重挑战:参考标准无法完美反映真实疾病状态、研究人群与目标人群差异、测试执行条件变异等。解决方案包括使用复合参考标准、明确参考标准执行时间窗、以及针对参考标准本身问题的处理方案。实施过程中需特别注意部分验证偏倚(partial verification bias)和疾病进展对时间一致性的影响。
在比较性研究中,估计量需定义测试间准确性差异(如差异值、比值比)。需特别注意不同测试对IE的敏感性可能不同,且配对设计与非配对设计中IE的处理存在差异。当同一受试者接受多种测试时,可能出现测试间IE发生不一致的情况,此时需要采用更复杂的分层策略。
诊断估计量框架通过标准化研究目标定义、IE处理策略和准确性度量,显著提升研究设计的透明度和结果的可解释性。该框架促进临床医生与统计学家间的跨学科交流,提高研究结果向真实世界应用的转化效率。未来研究需重点探索不同策略对准确性估计的量化影响,以及开发适用于各种策略的统计估计方法。
框架的局限性在于其理想化特性,部分估计量可能缺乏临床实用性。此外,参考标准相关问题的处理仍需进一步规范。建议在诊断研究设计阶段系统采用该框架,以确保研究问题与分析方法的高度一致。
生物通微信公众号
知名企业招聘