基于常规血液检测的人工智能模型在肝细胞癌筛查中的创新研究——一项全港范围的大规模研究
《ESMO Gastrointestinal Oncology》:Development of a novel routine blood-based AI model for HCC screening—a territory-wide study
【字体:
大
中
小
】
时间:2025年10月15日
来源:ESMO Gastrointestinal Oncology
编辑推荐:
本研究针对当前肝细胞癌(HCC)筛查方法(超声和甲胎蛋白AFP)灵敏度不足的临床难题,开发了一种仅基于常规血液检测指标的人工智能(AI)模型。该研究利用香港医院管理局2000-2018年的大数据,结果显示该AI模型在测试集中曲线下面积(AUROC)达0.894,灵敏度80%、特异性81%,在早期HCC检测中显著优于AFP,为HCC早期诊断提供了便捷、高效的新策略。
肝细胞癌(HCC)是全球范围内常见的恶性肿瘤,尤其在慢性肝病(如病毒性肝炎、肝硬化)患者中高发。然而,HCC的早期诊断一直是个巨大挑战。目前,临床指南推荐高风险人群每6个月进行一次腹部超声检查和/或甲胎蛋白(AFP)检测。但遗憾的是,这两种方法都存在明显的局限性:超声检查的结果很大程度上依赖于操作者的经验,并且在肝硬化结节背景下敏感性会降低;而AFP作为一种血清标志物,其在早期HCC中的敏感性仅为39%-64%,约有40%-50%的HCC患者AFP水平并不升高。这种诊断能力的不足直接导致了超过半数的HCC患者在确诊时已处于晚期,错过了最佳治疗时机,使得HCC成为香港地区癌症相关死亡的第三大原因。尽管一些新的评分系统(如GALAD评分,结合了性别、年龄、AFP-L3、AFP和DCP)显示出更好的准确性,但它们所依赖的特定肿瘤标志物(如AFP-L3和DCP)检测成本高昂且未普及,限制了其广泛应用。相比之下,常规血液检测项目,如全血细胞计数(CBC)、肝功能测试(LFTs)、肾功能测试(RFTs)和凝血功能谱,在临床中应用极为广泛,成本低廉,易于标准化。这些常规指标的变化可能潜在地反映了肝脏功能异常、炎症反应以及癌症相关的生理变化,但其相互关系复杂,传统统计模型难以有效挖掘其深层价值。因此,迫切需要开发一种基于易获取、低成本临床数据的高精度HCC筛查新方法。
为了突破HCC早期诊断的瓶颈,一项发表在《ESMO Gastrointestinal Oncology》上的研究开展了一项大规模、全港范围的回顾性研究,旨在开发并验证一种仅基于常规血液检测指标的人工智能模型,用于区分慢性肝病(CLD)患者和HCC患者。
研究人员为开展此项研究,主要应用了以下几个关键技术方法:首先,研究数据来源于香港医院管理局数据协作实验室(HADCL)这一覆盖全港范围的医疗大数据平台,纳入了2000年至2018年间的电子医疗记录。其次,通过国际疾病分类(ICD-9)代码、抗病毒药物史、病毒学检测和影像学报告,识别出伴有和不伴有HCC的慢性肝病(包括慢性病毒性肝炎和肝硬化)患者,并排除了失代偿期病例。最后,研究采用了多种机器学习算法(包括LightGBM、逻辑回归等)对提取到的常规血液检测数据(诊断前1个月内)进行模型构建和性能比较,并将最佳模型与传统的AFP检测进行了对比。
本研究最终纳入75,096名个体,其中19,670名(26.2%)被诊断为HCC。61,393名患者(占总队列的81.8%)被随机分配至训练集和测试集(8:2比例),13,703名来自2016年至2018年的患者作为验证集。
Primary analysis of model performance
在六种机器学习方法中,LightGBM(LGBM)分类器的性能显著优于其他模型,其在测试队列中的曲线下面积(AUROC)为0.894,在验证队列中为0.871。因此,后续分析均基于LGBM模型。
Secondary analysis for threshold optimization
研究进一步优化了模型的临床应用阈值。结果显示,在cut-off值为0.43时,模型实现了80%的敏感性和81%的特异性(AUROC=0.894)。此外,研究比较了双cut-off(设定90%敏感性和特异性)和单cut-off风险分层系统。双cut-off三层系统(高风险、中风险、低风险)能识别88.7%的HCC阳性病例,而单cut-off两层系统能排除78.5%的HCC阴性病例,表明双cut-off系统更严格,单cut-off系统更宽松。
Age-standardized analysis
年龄标准化分析显示,模型在所有年龄组(从<40岁到>80岁)均保持了较高的性能(AUROC中位数超过0.8),且在 youngest age group of <40 years 中性能最佳,表明该模型能有效排除年轻CLD患者的HCC风险。
合并症分析表明,使用包含肝炎和肝硬化患者的全队列数据训练的模型,其预测准确性优于仅针对单一病因(仅肝炎或仅肝硬化)训练的模型。全模型在验证队列中的AUROC为0.8785,而仅肝硬化模型和仅慢性病毒性肝炎模型的AUROC分别下降至0.7945和0.8345。这表明全模型可用于不同病因CLD患者的HCC筛查,无需额外影像学确认病因,提高了临床依从性。
Performance comparison with existing tools
与现有筛查工具的比较显示,该AI模型在不同巴塞罗那临床肝癌(BCLC)分期(A、B、C期)中均保持了稳定的高敏感性(约0.78),而AFP的敏感性从BCLC C期的72.08%显著下降至A期的45.87%。该模型的性能与包含特异性肿瘤标志物的GALAD评分相当。
Performance comparison with other risk scores
与文献中其他风险评分(如HCC-RS, CU-HCC, GAG-HCC等)相比,该AI模型在AUROC(0.898)和阳性预测值(PPV)方面表现更优。
Explainable AI model analysis
通过可解释性AI(Shapley Additive Explanations, SHAP)分析,揭示了影响模型预测最重要的10个常规血液参数及其作用方向。对HCC预测有正向影响的参数包括天冬氨酸氨基转移酶(AST)、年龄、胆红素、碱性磷酸酶(ALP)和凝血酶原时间(PT)的升高;而有负向影响的参数包括肌酐、丙氨酸氨基转移酶(ALT)和白蛋白的升高。这些发现与HCC的临床病理生理机制相符,例如AST升高超过ALT、低白蛋白血症、高胆红素血症等均提示肝脏功能严重受损和恶性肿瘤的存在,增强了模型的可信度。
本研究成功开发并验证了一个基于常规血液检测的AI模型,用于HCC的筛查。该模型仅使用临床常规、易获取的实验室指标,在大型真实世界队列中表现出优异的诊断性能,尤其在对早期HCC的检测上显著优于传统的AFP检测。其优势在于数据来源广泛、成本低廉、标准化程度高,易于在各级医疗机构(包括基层和资源有限地区)推广实施。模型的可调节cut-off值使其能够适应不同的临床场景需求(如高敏感性筛查或高特异性确认)。通过可解释性AI分析,证实了模型决策依据与已知的HCC病理生理学密切相关,提升了其临床可接受度。
尽管研究存在一些局限性,如回顾性设计可能受编码完整性影响,以及模型在合并其他恶性肿瘤患者中的普适性有待验证,但这项研究无疑为HCC的早期发现提供了强有力的新工具。未来需要通过多中心前瞻性研究进一步验证其效用。总之,这项AI赋能的常规血液检测模型为弥补当前HCC筛查方案的不足带来了巨大希望,有望通过实现更早的诊断来最终降低HCC的死亡率。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号