
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于54种生物标志物的多癌种风险预测模型开发与验证:一项42,666人前瞻性研究指导精准筛查策略
【字体: 大 中 小 】 时间:2025年08月13日 来源:Biomarker Research 11.5
编辑推荐:
本研究针对多癌种早期筛查中高风险人群识别困难的问题,开发了整合54种血液生物标志物和26种流行病学因素的PRIME模型。通过机器学习方法在42,666人队列中验证显示,该模型AUROC达0.767,可识别出占人群17.19%的高危群体(癌症检出率提升5.02倍),为精准医疗资源分配提供了重要工具。
癌症早期筛查领域长期面临两大困境:一方面现有单癌种筛查模型效率低下,另一方面新兴多组学检测技术成本高昂难以普及。在中国每年456万新发癌症病例中,75%集中于肺癌、食管癌等五种恶性肿瘤,但传统筛查方法如LDCT(低剂量CT)和胃镜存在灵敏度不足、依从性差等问题。针对这一临床痛点,复旦大学泰州健康科学研究院联合多家机构开展了一项突破性研究。
研究人员基于泰州纵向研究(TZL)队列,分两阶段纳入42,666名40-75岁参与者,整合54种血液标志物(如CYFRA-211、CEA)和26种流行病学指标,采用LASSO回归等机器学习方法开发了PRIME(Penta-cancer Risk Identification Model)多癌种风险预测模型。关键技术包括:1)建立16,340人的发现队列和26,308人验证队列;2)通过KNN算法处理缺失值;3)应用LASSO-Cox进行变量筛选;4)前瞻性随访2,863名高危个体进行LDCT/内镜验证。
研究结果显示:
【模型开发与性能】最终模型包含年龄、性别、吸烟包年、AFP、CEA、CYFRA-211和HBsAg 7个变量,在测试集AUROC达0.767(95%CI:0.723-0.814)。高危组(占17.19%)集中了50.42%的预期病例,风险较对照组升高15.19倍(P<0.001)。
【外部验证】在独立验证队列中,高危组癌症检出率为9.64%,较对照组(1.92%)提升5.02倍。其中食管癌差异最显著(16.84倍),肝癌预测效能最佳(AUROC=0.870)。
【前瞻性随访】对完成全套筛查的4,137人分析显示,五年粗发病率达5,074.92/10万,高危组升至8,683.73/10万。值得注意的是,仅筛查17%的高危人群即可覆盖50%的病例。
讨论部分指出,PRIME模型首次在人群队列中实现多癌种风险分层,其创新性体现在:1)将传统标志物(如CEA)与新指标(CYFRA-211)智能整合;2)开发配套的在线计算器(https://fdu-renjiazhao.github.io/FuSion-Calculator/);3)通过简化评分系统保持临床实用性(原始模型与简化版预测效能相当,P=0.888)。尽管存在样本存储时间差异等局限,该研究为优化筛查资源配置提供了重要循证依据,特别是对食管癌(风险分层16.84倍)和肝癌等高发肿瘤的精准防控具有突出价值。
(注:全文数据均来自原文,CYFRA-211为细胞角蛋白19片段,LDCT指低剂量计算机断层扫描)
生物通微信公众号
知名企业招聘