《Nature Communications》:A noninvasive machine learning model using a complete blood count for screening of primary vitreoretinal lymphoma
编辑推荐:
为解决PVRL缺乏早期无创筛查工具、常被误诊为葡萄膜炎而致治疗延误的临床痛点,作者整合多中心255例PVRL与292例对照的CBC数据,开发并外部验证六特征随机森林模型,AUC达0.85,前瞻性队列灵敏度95.0%、特异度99.97%,显著优于房水IL-10/IL-6比值,为基层快速风险分层提供可扩展方案。
研究背景
原发性玻璃体视网膜淋巴瘤(PVRL)是侵袭性极高的眼内B细胞恶性肿瘤,年发病仅约50例,却能在21个月内“偷走”视力并潜行扩散至中枢神经系统(CNS)。由于早期表现为漂浮物、视力模糊等非特异症状,常被当作葡萄膜炎反复治疗,待确诊时视神经已不可逆损伤。传统诊断依赖玻璃体活检,存在细胞量少、活性差、操作侵入性高且等待周期长等瓶颈,临床上亟需一种像血常规一样简单、可重复、能在基层推广的早筛工具。
面对这一空白,Li Shengjie等四院团队设想:能否利用人人都会做的血常规(CBC)捕捉PVRL的系统性免疫足迹?他们推测,肿瘤细胞与宿主免疫的微妙互动会外周化,表现为血小板分布宽度(PDW)、单核细胞百分比(Monocyte%)等参数的细微偏移,而机器学习恰能从高维数据中提取弱信号。于是,一项跨越2016-2024年的多中心病例-对照研究启动,旨在开发并验证基于CBC的PVRL无创筛查模型。
关键技术方法
研究纳入4家医院共255例经玻璃体活检确诊的PVRL及292例年龄性别匹配对照,采集30项CBC参数;采用SHAP值排序与DeLong检验进行特征选择;以随机森林(RF)为核心,联合XGBoost、TabNet等11种算法比较;通过5折交叉验证与网格搜索优化超参数;最终模型在10万余人前瞻性队列及51万余社区人群中验证,并与房水/玻璃体IL-10/IL-6比值进行头对头比较。
研究结果
模型构建与特征筛选
在发现队列中,30项CBC参数近半数在PVRL与对照间差异显著。经SHAP排序,六特征组合(PDW、Monocyte%、PLCR、Monocyte计数、Hb、Basophil计数)即可达AUC 0.85,优于完整30特征模型,且显著优于IL-10/IL-6比值(AUC 0.65-0.78)。
多中心外部验证
验证队列1(n=102)、队列2(n=78)、合并CNS受累队列3(n=150)及PVRL-葡萄膜炎鉴别队列(n=313)均显示RF模型AUC稳定在0.80-0.83,灵敏度0.60-0.80,特异度0.75-0.80,显著领先传统生物标志物(DeLong检验P<0.05)。
治疗动态监测
对29例PVRL患者6个月随访发现,治疗无效组PDW、Hb、PLCR显著下降,单核及嗜碱指标上升;有效组则呈相反趋势,提示六特征可实时反映肿瘤负荷。
十万级人群前瞻性筛查
医院队列94 935例18-92岁参与者中,模型以0.85为切点,筛出66例高危,最终38例经玻璃体活检确诊为PVRL,灵敏度95.0%,特异度99.97%,阳性预测值57.6%,阴性预测值99.99%;社区队列511 786例40-88岁居民中,22例高危13例确诊,阳性预测值59.1%,再次验证模型稳健性。
研究结论与讨论
该工作首次证实常规CBC结合机器学习可实现PVRL的无创、低成本、可扩展早筛,性能显著优于传统房水/玻璃体IL-10/IL-6比值,为罕见恶性肿瘤的“早发现、早转诊、早挽救视力”提供了可行路径。六特征模型不仅跨越不同医院、人群及合并CNS受累场景保持高鉴别力,还能动态监测治疗反应,具备成为眼科门诊“电子哨兵”的潜力。作者同时指出,模型在<40岁人群及单纯CNS受累病例中的外推仍待扩大样本验证,且所有阳性预测必须经玻璃体活检确诊。未来若能整合多组学数据,有望进一步提升特异性并揭示PVRL外周免疫调控机制。论文发表于《Nature Communications》,为血液学参数与眼科交叉研究树立了新标杆。