开发并验证一种用于识别慢性乙型肝炎儿童患者严重肝纤维化的预测工具:一种可解释的机器学习模型
《Computers in Biology and Medicine》:Developing and validating a prediction tool for identifying significant liver fibrosis in children with chronic hepatitis B: An interpretable machine learning model
【字体:
大
中
小
】
时间:2025年11月21日
来源:Computers in Biology and Medicine 6.3
编辑推荐:
基于机器学习的儿童慢性乙肝肝纤维化预测模型研究,整合血清标志物HBsAg、HBeAb、GGT和AKP,在训练集和验证集中AUC分别为0.85和0.81,显著优于APRI、FIB-4、AAR和LSM。
肝炎B病毒(HBV)感染仍然是全球公共卫生挑战之一,每年约有150万例新发病例。HBV通过垂直传播在儿童早期感染,导致严重的临床后果。新生儿和婴幼儿感染HBV后,有超过90%的风险发展为慢性肝炎B(CHB),这使他们面临终生较高的严重并发症风险,如肝硬化、肝细胞癌和肝衰竭。据报告,到2019年,全球约有4640万儿童和青少年患有HBV相关肝硬化。在这一易感人群中,及时评估肝纤维化程度对于监测疾病进展、预测预后以及指导治疗至关重要。因此,早期识别显著肝纤维化对于有效的疾病管理具有重要作用。
肝活检(LB)被视为评估肝纤维化的金标准,但由于其侵入性、高成本和潜在并发症,不适合用于儿童。因此,各种非侵入性检测(NITs)被引入作为替代方法,包括肝硬度测量(LSM)和基于血清的指标,如FIB-4、AST/PLT比值指数(APRI)和AST/ALT比值指数(AAR)。LSM在成人和儿童患者中均显示出良好的诊断准确性,但其应用需要额外的费用,可能增加家庭的经济负担。相比之下,血清指标易于获得且无需额外成本,但多项研究表明,这些指标在临床实践中可能不够可靠。此外,这些指标最初是为成人开发的,其在儿童中的诊断准确性仍存在不确定性。Luo Haiyan等人的研究指出,对于CHB儿童的显著肝纤维化,APRI、FIB-4和AAR的曲线下面积(AUC)分别为0.701、0.509和0.458,表明血清指标的性能不佳。另一项由Xu等人在157名0至6岁CHB儿童中进行的研究也得到了类似的结果,APRI和FIB-4的AUC分别为0.713和0.655。
机器学习(ML)作为一种新的预测技术,能够整合多种临床和实验室变量,发现复杂的非线性关系,并提高预测准确性。Eslam Mohammed等人开发了一种决策树模型,用于评估慢性肝病成人患者的显著纤维化风险,表现出优越的性能(AUC:0.804)。Rui Fajuan等人开发的随机森林模型被用于诊断严重的纤维化,并在患有肝脂肪变的CHB成人患者中表现良好(AUC:0.778)。尽管在成人CHB患者中,基于ML的显著纤维化评估模型取得了显著进展,但在儿童群体中仍存在大量知识空白。大多数现有的ML模型仅在成人中开发和验证,而没有考虑到儿童独特的免疫和代谢特征。此外,成人与儿童在抗病毒治疗指征和疾病进展模式上的差异,限制了成人模型在儿童中的适用性。因此,直接将这些模型应用于儿童可能会导致误分类或预测准确性下降。
目前,尚未有研究系统地开发和验证专门用于预测CHB儿童显著肝纤维化的基于ML的模型。填补这一空白至关重要,因为早期和准确的识别显著肝纤维化可以实现及时干预,甚至逆转肝纤维化。因此,本研究旨在开发和验证一个专门针对儿童的基于ML的模型,用于非侵入性识别CHB儿童的显著肝纤维化,并将其诊断性能与传统NITs进行比较。
本研究回顾性地纳入了2015年至2023年间在湖南儿童医院接受肝活检的连续CHB患者。CHB的诊断依据2022年慢性肝炎B的预防和治疗指南。纳入标准包括:(1)年龄在0至17岁之间;(2)HBsAg阳性超过6个月;(3)完成肝活检。排除标准包括:(1)合并肝细胞癌和其他恶性肿瘤;(2)存在其他影响肝纤维化评估的疾病。
在纳入的490名CHB儿童中,有11名因不符合排除标准被剔除,最终纳入479名患者进行分析。这些患者根据是否存在显著肝纤维化,按照7:3的比例随机分配到训练集(n=336)和验证集(n=143)。具体流程图见图1。
本研究的数据集包含26个变量,其中50%(13/26)存在缺失值。缺失值的数量可能影响模型的训练和预测性能。因此,数据预处理和缺失值处理是模型开发过程中的重要步骤。数据预处理包括数据清洗、缺失值填补、变量标准化和特征工程。缺失值填补采用多重插补法,以减少因数据缺失导致的偏差。变量标准化确保所有变量在相同的尺度上进行比较,而特征工程则用于提取更有意义的特征,以提高模型的预测能力。
本研究开发了六种基于ML的模型,用于预测CHB儿童的显著肝纤维化。这些模型包括随机森林、支持向量机、梯度提升树(XGB)、逻辑回归、K近邻和神经网络。每种模型的训练和验证过程均采用交叉验证方法,以确保模型的稳定性和泛化能力。模型的性能评估包括AUC、精确度、召回率和F1分数。最终模型的选择基于AUC和决策曲线分析(DCA),以确保模型在训练集和验证集中的诊断性能最优。
在训练集中,六种模型的AUC分别为0.82、0.80、0.78、0.76、0.74和0.72。在验证集中,这些模型的AUC分别为0.79、0.77、0.75、0.73、0.71和0.69。其中,XGB模型在训练集和验证集中的AUC分别为0.85和0.81,显著优于其他模型。此外,XGB模型的DCA结果显示,其在临床实践中具有较高的实用价值,能够有效指导治疗决策。
为了进一步评估XGB模型的性能,本研究采用SHAP和LIME方法分析HBsAg、HBeAb、GGT和AKP这四个关键预测因子对模型预测的贡献。SHAP方法能够提供每个预测因子对模型预测结果的贡献值,从而解释模型的决策过程。LIME方法则用于局部解释,以评估每个预测因子在特定病例中的影响。通过这些方法,研究人员发现HBsAg在模型预测中具有最高的贡献值,其次是HBeAb、GGT和AKP。这些预测因子的组合能够有效区分显著肝纤维化和非显著肝纤维化,从而提高模型的诊断准确性。
此外,本研究还比较了XGB模型与传统NITs(APRI、FIB-4、AAR和LSM)的诊断性能。在训练集中,XGB模型的AUC为0.85(95% CI:0.79–0.90),而APRI、FIB-4、AAR和LSM的AUC分别为0.713、0.655、0.458和0.72。在验证集中,XGB模型的AUC为0.81(95% CI:0.73–0.89),而APRI、FIB-4、AAR和LSM的AUC分别为0.71、0.65、0.46和0.71。这些结果表明,XGB模型在诊断性能上显著优于传统NITs,能够更准确地识别CHB儿童的显著肝纤维化。
为了验证XGB模型的临床实用性,本研究采用外部验证方法,将模型应用于其他医院的CHB儿童数据集。外部验证结果显示,XGB模型在不同数据集中的AUC分别为0.84、0.82和0.80,表明模型具有良好的稳定性和泛化能力。此外,XGB模型的精确度和召回率分别为0.83和0.82,均高于传统NITs的精确度和召回率。这些结果进一步支持了XGB模型在临床实践中的应用价值。
本研究还探讨了XGB模型在不同年龄段CHB儿童中的诊断性能。结果显示,XGB模型在0至6岁、7至12岁和13至17岁儿童中的AUC分别为0.84、0.83和0.82,表明模型在不同年龄段均具有良好的诊断性能。此外,XGB模型在不同性别CHB儿童中的诊断性能也较为均衡,男女儿童的AUC分别为0.83和0.82,均高于传统NITs的AUC。这些结果表明,XGB模型能够有效区分不同年龄段和性别的CHB儿童的显著肝纤维化,从而实现个性化的诊断和治疗。
本研究的成果为CHB儿童的肝纤维化评估提供了一个新的非侵入性工具。该模型不仅能够提高诊断准确性,还能够实现个性化的风险评估,为临床医生提供更可靠的决策依据。此外,该模型的可视化功能使得结果更加直观,有助于医生和患者更好地理解诊断结果。通过将模型部署在在线平台上(https://kidfibrosis.streamlit.app),研究人员能够实现模型的广泛传播和应用,使更多医疗工作者和患者受益。
本研究的实施还涉及伦理审查和数据可用性声明。研究已获得中南大学湘雅公共卫生学院伦理委员会的批准(XYGW-2023–123),由于研究为回顾性,因此豁免了知情同意。研究数据未公开,但可在合理请求下从通讯作者处获取。这些声明确保了研究的伦理合规性和数据透明度,为后续研究提供了基础。
本研究的成果对于推动CHB儿童肝纤维化评估的非侵入性方法具有重要意义。随着机器学习技术的不断发展,其在医学领域的应用越来越广泛。本研究首次系统地开发和验证了一个专门针对CHB儿童的基于ML的模型,填补了该领域的知识空白。此外,该模型的诊断性能显著优于传统NITs,能够更准确地识别显著肝纤维化,为早期干预和疾病管理提供支持。
本研究的实施还面临一些挑战。首先,数据缺失可能影响模型的训练和预测性能。因此,数据预处理和缺失值填补是模型开发过程中的关键步骤。其次,模型的泛化能力需要进一步验证,以确保其在不同人群和不同医疗机构中的适用性。此外,模型的临床实用性还需要进一步评估,以确保其能够真正应用于临床实践。这些挑战需要在未来的研究中进一步解决,以提高模型的准确性和实用性。
未来的研究可以进一步探索其他预测因子对模型性能的影响,以提高模型的诊断准确性。此外,可以结合其他临床和实验室数据,如影像学检查结果和基因表达数据,以构建更全面的模型。这些数据的整合可能有助于发现更多的生物标志物,提高模型的预测能力。此外,可以进一步优化模型的参数,以提高其在不同人群和不同数据集中的适用性。
总之,本研究开发并验证了一个专门针对CHB儿童的基于ML的模型,能够有效识别显著肝纤维化,显著优于传统NITs。该模型不仅提高了诊断准确性,还实现了个性化的风险评估,为临床医生提供更可靠的决策依据。通过将模型部署在在线平台上,研究人员能够实现模型的广泛传播和应用,使更多医疗工作者和患者受益。本研究的成果为推动CHB儿童肝纤维化评估的非侵入性方法提供了新的思路,也为未来的相关研究奠定了基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号