一种基于索赔的算法,用于识别化脓性汗腺炎的严重程度
《Clinical Epidemiology》:A Claims-Based Algorithm for Identifying Hidradenitis Suppurativa Severity
【字体:
大
中
小
】
时间:2025年11月09日
来源:Clinical Epidemiology 3.2
编辑推荐:
HS疾病严重程度基于保险索赔数据的算法开发与验证。通过分析350名HS患者(中重度210例,轻度/不确定140例)的电子健康记录与Medicaid数据,构建LASSO回归模型筛选出影响严重程度的30个候选变量。结果显示,单独使用ICD-10编码L73.2的PPV达89%,结合系统药物使用可将严重HS的PPV提升至100%。模型在中重度分类中表现较好(PPV67%-71%),但轻度/不确定HS的PPV仅20%,主要因样本中此类患者较少(20.6%)。研究证实保险数据可支持HS患者识别与严重程度分层,但需结合EHR数据优化分类模型。
本研究聚焦于一种慢性炎症性皮肤病——隐匿性化脓性汗腺炎(Hidradenitis Suppurativa, HS)在医疗索赔数据中的分类与识别。HS是一种以毛囊阻塞为特征的疾病,通常表现为丘疹、脓肿、窦道形成及瘢痕,严重时会影响患者的生活质量。尽管该疾病具有较高的临床和流行病学研究价值,但现有的医疗索赔数据通常无法直接反映HS的严重程度,因此开发一种基于索赔数据的算法来准确识别HS患者的严重程度具有重要意义。
研究团队采用了一种结合电子健康记录(EHR)与美国医疗保障局(Medicaid)索赔数据的方法,以识别出具有HS诊断代码(ICD-10 L73.1)的患者群体。通过对350名年龄在10岁以上的患者进行详细回顾,研究人员能够根据临床信息确定HS的严重程度,并构建了一个基于索赔数据的算法来预测不同严重程度的HS患者。算法的开发过程采用了多变量LASSO回归模型,以筛选出最能预测HS严重程度的变量,如年龄、种族、就诊次数、使用药物的类型及手术记录等。通过训练集(70%)与测试集(30%)的划分,研究团队评估了该算法的准确性,并计算了不同严重程度下的阳性预测值(PPV)。
研究结果显示,该算法在识别严重HS方面表现良好,PPV达到了67%,而在识别中度HS时的PPV为54%,识别轻度HS的PPV仅为20%。这表明,尽管算法在某些严重程度上具有较高的准确性,但在区分轻度与中度HS时存在一定的局限性。此外,当将轻度与中度HS合并为一个类别,与严重HS进行对比时,PPV提升至71%,显示出该算法在区分总体严重程度方面具有较高的效能。这种分类方式对于研究人员在没有EHR数据的情况下,准确识别HS患者群体具有重要的参考价值。
在算法的验证过程中,研究人员发现,仅凭单一的HS诊断代码,PPV为89%,但若同时要求患者在诊断时使用系统性药物治疗,则PPV进一步提升至100%。这一发现强调了系统性药物使用在HS严重程度判断中的重要性,也表明在实际应用中,结合临床用药记录可以显著提高诊断的准确性。此外,研究团队还分析了不同严重程度患者的治疗方式和伴随疾病,发现严重HS患者更可能接受生物制剂治疗,且更频繁地接受特定的手术干预。相比之下,轻度HS患者则更倾向于使用外用药物,而中度HS患者则可能涉及更多的皮肤科就诊。
为了确保研究的科学性和代表性,研究团队对数据来源进行了严格的筛选。他们选取了从2016年10月至2019年12月期间的Medicaid索赔数据,并将其与Mass General Brigham(MGB)的EHR数据进行了确定性链接,确保数据的完整性和一致性。MGB是一个涵盖多个医疗中心的医疗网络,包括两家三级医院、三家社区医院以及超过35家初级保健中心。这种多元化的数据来源有助于更全面地反映HS患者在不同医疗环境下的特征,同时也为研究提供了更丰富的临床信息。
在研究过程中,研究人员对患者的HS诊断代码进行了验证,并通过EHR回顾确认了实际的HS病例。结果显示,350名患者中有312人被确认患有HS,其余38人则因信息不足或不明确而被归类为“不确定HS”。这一分类进一步表明,基于索赔数据的HS识别仍存在一定的局限性,特别是在缺乏详细临床信息的情况下,容易出现误诊或漏诊的情况。因此,结合EHR数据对于提高HS识别的准确性至关重要。
研究团队还进行了多种敏感性分析,以评估算法在不同条件下的表现。当将HS严重程度分为“轻度/不确定”与“中度”或“重度”时,算法的PPV分别为20%、54%和67%。然而,当将“轻度/不确定”与“中度/重度”合并时,PPV提升至71%,说明这种分类方式在实际应用中可能更具操作性。此外,研究还发现,当仅依据EHR中记录的Hurley分期进行分类时,各严重程度的PPV分别为60%、53%和50%。这表明,Hurley分期在临床实践中虽然是一种广泛使用的评估标准,但其在EHR中的记录率较低,可能影响算法的准确性。
值得注意的是,研究团队在开发算法时,采用了多变量LASSO回归模型,这是一种在高维数据中选择关键预测变量的统计方法。通过这种方法,研究人员能够筛选出最相关的变量,从而提高模型的预测能力。模型结果显示,严重HS的预测变量包括使用异维甲酸或阿西他滨、接受特定手术、使用生物制剂、伴有痤疮等。而中度HS的预测变量则包括皮肤科医生的诊断和多次皮肤科就诊。轻度HS的预测变量主要涉及年轻年龄(10-17岁)和无HS诊断记录。这些变量的选择与临床观察结果相吻合,说明该算法在一定程度上能够反映HS的实际临床特征。
尽管该算法在识别严重HS方面表现良好,但在区分轻度和中度HS时仍存在一定挑战。这一问题可能源于轻度HS病例数量较少,导致算法难以准确识别。此外,轻度HS在临床实践中往往被误诊或初步记录为其他皮肤疾病,如毛囊炎、严重痤疮或皮脂腺囊肿,这也可能影响算法的准确性。因此,对于研究者而言,在没有EHR数据的情况下,使用单一的HS诊断代码仍然是一种可行的识别方法,但若能结合其他临床信息,如药物使用记录或就诊次数,将有助于提高识别的准确性。
研究团队还对算法的其他性能指标进行了评估,包括特异性(Specificity)和阴性预测值(NPV)。结果显示,轻度/不确定HS的特异性为96%,而中度HS的特异性仅为31%。这表明,该算法在识别轻度HS时具有较高的特异性,但在中度HS的识别上存在一定的误判风险。同样,当将轻度/不确定HS与中度/重度HS进行对比时,NPV达到了80%,说明该算法在识别非严重HS患者时具有较高的可靠性。然而,对于轻度HS的识别,NPV较低,可能与该类别病例数量较少有关。
此外,研究团队还发现,HS患者的疾病负担与生活质量密切相关,尤其是对于重度复发性HS患者。因此,准确识别HS患者的严重程度对于评估治疗效果、优化医疗资源分配以及制定个体化治疗方案具有重要意义。然而,目前的医疗索赔数据通常缺乏对HS严重程度的直接记录,这使得基于索赔数据的算法成为一种可行的替代方案。
本研究的发现为未来的HS研究提供了重要的参考价值。首先,该算法能够在缺乏EHR数据的情况下,有效识别HS患者,特别是在识别重度HS时表现良好。其次,将轻度与中度HS合并为一个类别可以提高算法的准确性,这对于研究人员在分析治疗效果时具有一定的优势。最后,研究团队强调,随着更多HS患者数据的积累,特别是轻度HS病例的增加,未来可以进一步优化该算法,以提高其在所有严重程度上的预测能力。
研究团队还对算法的局限性进行了讨论。他们指出,由于HS的发病率较低,研究样本规模较小,这可能影响算法的泛化能力。此外,轻度HS病例的缺乏也使得算法在区分轻度与中度HS时存在一定的困难。因此,未来的验证研究应关注更多轻度HS患者的数据,以提高算法的准确性。同时,研究团队还提到,尽管Hurley分期是评估HS严重程度的标准,但在实际临床实践中,该分期的记录率较低,这可能影响算法的性能。
综上所述,本研究开发并验证了一种基于医疗索赔数据的算法,用于识别HS患者的严重程度。该算法在识别重度HS时表现良好,但在区分轻度与中度HS时存在一定局限性。研究团队建议,对于研究人员而言,结合多种临床信息(如药物使用、就诊记录等)可以提高HS识别的准确性,特别是在缺乏EHR数据的情况下。此外,该算法在实际应用中可以作为一种有效的工具,帮助研究人员在大规模医疗数据中快速识别HS患者群体,并进一步分析其严重程度与治疗效果之间的关系。然而,未来的研究仍需关注更多轻度HS患者的数据,以进一步完善该算法,提高其在所有严重程度上的预测能力。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号