基于多参数预测模型与血液标志物的癌症早期诊断算法开发及验证研究

【字体: 时间:2025年05月08日 来源:Nature Communications 14.7

编辑推荐:

  为解决英国癌症早期诊断率低的问题,Julia Hippisley-Cox团队开发了两种整合临床症状与血液检测指标(全血细胞计数和肝功能)的多参数预测模型(Model A/B),通过724万英国成年人数据验证显示,新算法对15种癌症类型的判别能力(AUROC 0.694-0.939)、校准度和净收益均优于现有QCancer模型,为临床决策提供更精准的癌症概率评估工具。

  

癌症早期诊断一直是全球公共卫生领域的重大挑战,英国作为发达国家中癌症生存率较低的国家,其75%的癌症患者在确诊时已进展至中晚期。这种困境主要源于就诊延迟、检查滞后和转诊效率低下等多重因素。尽管英国国民医疗服务体系(NHS)早在2011年就提出通过预测算法提升初级诊疗中的癌症识别率,但现有QCancer模型仅基于临床症状和基础病史,对血液等生物标志物的整合不足。更棘手的是,肝癌等恶性肿瘤发病率十年间激增50%,但缺乏针对性的早期预测工具。这些现实问题催生了对更精准、更全面的癌症预测算法的迫切需求。

为突破这一瓶颈,Julia Hippisley-Cox与Carol Coupland团队开展了一项大规模队列研究。他们利用QResearch和CPRD Gold两大电子健康记录数据库,纳入英格兰724万18-84岁成年人作为开发队列,并在264万英格兰人群及274万苏格兰、威尔士和北爱尔兰人群中完成外部验证。研究创新性地开发了两种多参数模型:Model A整合年龄、性别、社会经济 deprivation(贫困指数)、吸烟饮酒史、家族史、临床症状等120项指标;Model B进一步纳入全血细胞计数(FBC)和肝功能测试(LFT)六项血液指标。通过多变量多项逻辑回归和多重插补处理缺失数据,最终构建了可预测15种癌症类型(新增肝癌和口咽癌)的性别特异性算法。

关键技术方法包括:1) 基于QResearch/CPRD Gold数据库的724万患者队列开发模型;2) 采用多变量多项逻辑回归分析临床指标与癌症类型的关联;3) 通过多重插补处理BMI、血液指标等连续变量的缺失数据;4) 使用AUROC和polytomous discrimination index(PDI)评估判别力;5) 在5个独立验证队列中测试模型性能。

研究结果揭示多项重要发现:

研究人群
开发队列中确诊129,715例癌症,验证队列分别检出44,984例(英格兰)和32,328例(其他地区)。基线分析显示,英格兰队列的吸烟、饮酒等生活方式数据完整性显著优于其他地区。

癌症概率相关因素
首次发现HIV/AIDS与男性结直肠癌、胰腺癌及血液癌风险显著相关(OR 1.2-3.5)。新增7种症状标志(如瘙痒、淤青、背痛)与多种癌症关联,其中黑尿对肝癌的预测价值最高(ORmax=4.8)。血液指标呈现特异性模式:血红蛋白下降与肺癌、结直肠癌风险正相关;淋巴细胞减少联合血小板升高对卵巢癌的预测效能最显著(AUROC 0.903)。

判别性能
Model B在英格兰验证队列中表现优异:总体AUROC男性0.876、女性0.844,其中肝癌判别力提升最显著(男性0.903 vs Model A 0.892)。血液指标使7种癌症的敏感性提高3-8%,尤其对肝癌的早期识别率提升12%。值得注意的是,模型对Ⅰ-Ⅱ期癌症的识别效能与总体相当(敏感性男性81.3%、女性75.2%)。

校准与临床效用
校准斜率接近1(0.96-1.03),显示预测概率与实际发病率高度吻合。决策曲线分析证实,在3%风险阈值下,Model B的净临床收益比QCancer模型提高15%,相当于每万人可多识别出432例早期癌症患者。

讨论部分强调,这是首个整合FBC/LFT的初级诊疗癌症预测工具,其创新性体现在三方面:1) 首次建立肝癌预测模型,填补了该高死亡率癌种的评估空白;2) 发现血小板计数与8种女性癌症的新型关联,拓展了血液指标的临床应用;3) 通过多中心验证证实算法在英国不同地区的稳定性。尽管存在症状记录不全等局限,但研究团队指出,当模型嵌入EMIS等电子病历系统时,实时数据提取可缓解信息缺失问题。

这项发表于《Nature Communications》的研究具有重要临床转化价值:新算法已通过canpredict.org开源,其高达82.6%的敏感性(QCancer仅78.1%)意味着可显著减少漏诊。尤其对于非特异性症状患者,模型提供的15种癌症概率分布能精准指导定向检查——例如碱性磷酸酶(ALP)升高伴血小板增多者,可优先考虑肝脏影像学检查。随着英国推行Faster Diagnosis Framework,该成果将为实现2028年75%早期诊断目标提供关键技术支撑。未来研究需在非英国人群中验证模型的普适性,并探索将肿瘤标志物(如AFP)纳入下一代算法。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号