编辑推荐:
为解决 HES 数据中 ICD - 10 诊断代码识别大出血事件性能未知的问题,相关研究人员开展此研究。结果显示多数代码 PPV 差,颅内出血代码表现相对较好。该研究为心血管研究中出血事件判定提供新思路,值得科研读者一读。
在医学研究的广阔天地里,临床结局的评估一直是个至关重要的话题。以往,临床试验的随访常常需要直接与患者接触,仔细查阅大量医疗文件,才能确定是否发生了特定的临床事件。这就好比大海捞针,既耗费时间,又花费不菲。于是,越来越多的研究者将目光投向了常规收集的电子医疗数据,就像发现了一座有待挖掘的宝藏。
在英国,NHS 数字数据中的医院事件统计(HES)数据集备受关注,它包含了丰富的信息,就像一个装满宝贝的百宝箱,里面有患者的各种人口统计学信息、临床资料以及行政记录。在 HES 的 admitted patient care dataset(APC,住院患者护理数据集)里,20 个诊断代码字段记录着国际疾病分类第 10 版(ICD - 10)代码,这些代码可是患者就医期间诊断情况的重要标识。
不过,用 HES 数据来确定心血管结局事件,在科学界引发了不少争议。有人怀疑它的准确性,担心数据是否完整、编码是否正确、分析方法是否靠谱,以及和传统的结局确定方法相比有没有经过验证。虽然已经有一些数据支持 HES 在检测某些心血管结局(比如心肌梗死(MI))方面的准确性,但用它来判断大出血事件,可就复杂多了。
心肌梗死或中风,就像 “大反派”,不管具体情况如何,在大多数临床试验中都被归为重大事件。可出血事件就像一群性格各异的 “小精灵”,严重程度各不相同,从微不足道到危及生命都有。心血管研究通常只关注 “重大” 出血事件,这得按照公认的定义,比如出血学术研究联盟标准(BARC)来判断。要确定一个出血事件是否重大,需要考虑很多临床参数,所以光靠出血代码来判断,可不像判断心肌梗死那么简单。
之前的研究发现,HES 检测出血事件的敏感性可能比基层医疗来源高,但对于真正 “重要” 的出血事件,它的阳性预测值(PPV)可能不太理想。而且,目前还没有研究评估过 HES 记录中单个 ICD - 10 代码识别重大出血事件的性能。在这样的背景下,一项研究应运而生。
英国的研究人员在《BMC Medical Research Methodology》期刊上发表了名为《Performance of ICD - 10 diagnostic codes in Hospital Episode Statistics (HES) data for identifying major bleeding events: a secondary analysis of the ROBOT - ACS study》的论文。这项研究利用 ROBOT - ACS 研究的数据,评估 HES 中出血代码检测重大出血事件的性能,看看这些代码到底靠不靠谱。研究得出结论:HES 中诊断 ICD - 10 代码在判断重大出血事件方面表现不佳,若不进一步深入探究,很难准确判断。可以采用混合方法,先用 HES 筛查,再查看记录;或者利用 HES 中更易获取的数据,创建新的重大出血定义。这一结论为后续研究指明了方向,让大家知道了 HES 数据在判断大出血事件上的不足,也给出了改进的思路,对心血管研究意义重大。
为了开展这项研究,研究人员使用了一些关键技术方法。他们从 ROBOT - ACS 研究的 5116 名参与者那里获取了 HES 数据,这些数据涵盖了参与者入组后 12 个月的住院信息。研究人员预先准备了一份详细的 ICD - 10 诊断代码列表,用它来筛选可能的出血事件。一旦 HES 记录中出现列表里的代码,就会触发对相关医疗病历的审查。之后,研究人员分析每个代码出现时,对应的 HES 记录最终是否被判定为重大出血事件(依据 PLATO 或 BARC 标准),通过计算得出每个代码检测重大出血事件的阳性预测值,并给出 95% 的置信区间。他们还比较了不同代码组的性能,并且研究了只考虑 HES 记录中第一个诊断位置代码时,代码性能的变化情况。
下面来看看具体的研究结果。
研究结果
- 数据概况:在 ROBOT - ACS 随访结果数据中,一共有 1172 条 HES 记录包含出血或贫血代码,随访完成率达到 100%。出现次数最多的代码是 T81?(手术相关的出血和血肿,未在其他地方分类),高达 502 次,这可能和很多患者接受了心脏导管插入术有关。另外,D50、K92 和 R04 出现的次数也超过了 100 次。经过判定,研究中有 213 例符合 BARC 或 PLATO 定义的重大出血事件,这些事件就成了后续分析的 “金标准”。
- 单个代码的阳性预测值:研究人员分析了每个代码检测重大出血事件的阳性预测值。结果发现,很少有出现频率较高的代码,其阳性预测值能超过 50%。这说明大部分代码在判断重大出血事件时,准确性不太理想。
- 代码组的阳性预测值:按照出血部位或类型对代码进行分组后发现,颅内出血代码的阳性预测值最高,达到 60%。如果排除 I62 代码,这个比例能上升到 76.9%。而与手术相关的出血代码出现频率最高,但阳性预测值却很低,只有 12.1%。这表明这类代码很难单独用来区分重大手术相关出血事件。
- 贫血代码的作用:贫血代码在检测重大出血方面的表现,和其他一些专门的出血诊断代码差不多。在 213 例判定的重大出血事件中,有 26 例(12.8%)是因为贫血代码才被发现的,这些病例没有其他伴随的特定出血代码。这说明在 HES 初始筛查时,如果不考虑贫血代码,可能会大大低估出血事件的发生率。
研究结论与讨论
综合来看,这项研究的结果表明,用 HES 里的单个诊断出血代码来判断重大出血事件,按照传统标准,准确性不够高。有些代码表现相对较好,比如颅内出血代码,这很好理解,因为不管其他情况如何,颅内出血在 BARC 或 PLATO 定义里肯定属于重大事件。而手术相关的出血代码阳性预测值最低,这是因为在临床中,手术或血管穿刺部位的轻微出血很常见,这些代码虽然出现频率高,但很难区分是否是重大出血。
只考虑第一个诊断位置的代码也不太可行,因为大多数出血代码的阳性预测值还是很低,而且这样做会大大降低检测事件的敏感性。值得注意的是,贫血代码在检测重大出血方面可不能被小看,它和很多专门的出血诊断代码表现相当。
不过,这项研究也有一些局限性。首先,这只是针对一个特定人群的研究,它的结论能不能推广到其他人群还不好说。特别是手术相关出血的编码数据,都来自一个三级心胸外科中心,那里的编码做法和标准可能不能代表英国的平均水平。其次,虽然研究中出血代码的总数比较多,但有些单个代码出现的频率很低,很难判断这些代码在检测重大出血方面的相对性能,这就需要更多的 HES 数据和大量的临床判定,而这是否现实还不好说。最后,由于 ROBOT - ACS 研究没有采用其他检测和随访方法,所以无法确定这些代码检测出血事件的敏感性。要评估敏感性,就得用多种随访方法,比如和传统的试验随访方法(直接与患者接触或访谈)对比,或者参考基层医疗等其他医疗数据库。
这项研究意义非凡,它首次评估了 HES 中单个 ICD - 10 出血代码识别重大出血事件的性能。研究结果告诉我们,光靠 HES 数据准确识别重大出血事件不太可行,因为确定出血事件的严重程度需要很多 HES 里没有的临床数据。未来,也许可以从两个方向改进。一是采用混合方法,就像 ROBOT - ACS 研究那样,先用 HES 数据进行初步筛查,保证检测的敏感性,再通过病历审查和判定来确保特异性。二是创建一个新的 “重大” 出血定义,这个定义要能利用 HES 数据实现,并且在科学界被认可。不过,要实现这个目标,还需要做大量的工作。
这项研究就像一盏明灯,为心血管研究中利用 HES 数据判断出血事件照亮了前行的道路,虽然还有很长的路要走,但它已经为后续研究打下了坚实的基础。