
-
生物通官微
陪你抓住生命科技
跳动的脉搏
牛津-FIT数据集外部验证COLOFIT结直肠癌风险预测模型:人群特征与临床相关评估指标的重要性
【字体: 大 中 小 】 时间:2025年08月29日 来源:BMC Medicine 8.3
编辑推荐:
本研究针对英国初级保健中FIT≥10 μg/g阈值转诊结直肠癌(CRC)患者阳性预测值低的问题,通过牛津大学医院51,477例GP申请FIT检测数据,验证了整合FIT结果与人口统计学、血常规指标(PLT、MCV)的COLOFIT模型。研究发现该模型总体可减少8%转诊量且不遗漏癌症病例,但效果随FIT检测率(11.7%升至18.8%)和人群症状谱变化而波动(转诊减少幅度23%至增加2%),强调本地化验证对优化诊断路径的关键价值。
在结直肠癌(CRC)筛查领域,粪便免疫化学检测(FIT)作为初级保健分流工具虽被英国NICE指南推荐,但面临"高假阳性"困境——每11例FIT≥10 μg/g转诊患者中仅1例确诊癌症,造成结肠镜检查资源浪费。这一矛盾在COVID-19疫情期间加剧,随着Thames Valley癌症联盟将FIT应用扩展到包含直肠出血等高风险症状人群,检测阳性率从2021年的11.7%跃升至2024年的18.8%,如何精准识别真正需要内镜检查的患者成为临床痛点。
牛津大学团队在《BMC Medicine》发表的研究给出了创新解决方案。他们利用牛津大学医院(OUH)2017-2024年间51,477例GP申请的FIT检测数据,对诺丁汉团队开发的COLOFIT模型进行外部验证。该模型突破性地整合FIT数值与年龄、性别、血小板计数(PLT)、平均红细胞体积(MCV)等常规指标,通过Cox回归算法生成个体化癌症风险评分。
研究采用三大关键技术:1) 从OUH临床数据仓库提取GP申请的FIT检测数据,建立含659例CRC患者的牛津-FIT队列;2) 通过正则表达式算法从病理报告提取癌症分期(TNM)和症状关键词,验证显示CRC识别敏感度达97%;3) 采用bootstrap法计算核心指标——在保持与FIT≥10 μg/g相同敏感度(87.6%)前提下,比较COLOFIT风险阈值(0.47-1.28%)带来的转诊量变化。
人群特征动态影响模型性能
通过划分6个时期(包括COVID前后阶段)发现:2022年上半年采用1.28%风险阈值时转诊减少23%,而2023年上半年阈值降至0.47%后转诊反增2%。这种波动与FIT检测量从每月<411次增至>1400次、直肠出血症状报告比例上升显著相关。
校准优化揭示设备差异
COLOFIT整体存在预测低估(O/E=1.52),但2023年校准改善(O/E=1.09)。研究发现HM-JACKarc分析仪与模型开发所用OC-Sensor的检测上限差异(400 vs 69,000 μg/g)导致高风险患者评分被低估,但临床影响有限——即使FIT=5000 μg/g患者经截断处理后风险评分仍达26%。
诊断效能超越单一指标
模型c-statistic(94.04 vs FIT 92.36)和平均精度(27.12% vs 16.81%)均显著优于单独FIT检测。特别在2022年数据中,模型在保持90%敏感度时阳性预测值(PPV)提升17%,对应每千例检测减少28例不必要转诊。
这项研究为CRC筛查提供了重要范式转变:首先证实人口统计学和常规血液指标可增强FIT的预测效能,但强调模型实施需考虑三点——本地验证确定风险阈值、持续监测人群特征变化、关注FIT检测方法差异。作者开发的Python分析管道(https://github.com/tammandres/fitval)为医疗机构开展本地化验证提供工具支持,而17%的FIT阳性率与1.3-1.6%癌症检出率可作为模型有效应用的参考基准。这些发现对缓解全球内镜检查资源紧张具有重要实践意义,也为其他癌症的初级保健分流策略树立了方法学标杆。
生物通微信公众号
知名企业招聘