打开图形查看器
摘要
肝细胞癌(HCC)是一种致命性极高的肿瘤,对其进行风险分层非常重要,但目前仍然具有挑战性。在这项研究中,我们基于常规收集的临床数据构建了一个可解释的机器学习框架用于HCC风险分层。我们使用了来自两个大规模队列的90多万人和983例HCC病例的前瞻性多模态数据:即“英国生物银行研究”(开发阶段)和“我们所有人研究计划”(外部测试阶段)。我们评估了包括人口统计学、生活方式、健康记录、血液检测、基因组学和代谢组学在内的各种数据类型的个体和累积贡献。最终基于随机森林的模型在内部和外部测试集中均显著优于所有公开发布的最先进的风险评分方法。该模型在不同种族亚组中表现出强大的泛化能力,同时具有高度的可解释性,并提供了全部代码、模型权重以及一个用于外部验证和应用的在线计算工具。我们的研究提出了PRE-Screen-HCC,这是一个用于HCC风险分层和早期检测的强大且易于理解的机器学习框架。


