编辑推荐:
肝吸虫病早期症状隐匿易漏诊,现有诊断方法存在局限。本研究基于 147 例肝吸虫感染患者及 151 例健康对照的实验室数据,构建含 12 项指标的预测模型(AUC 训练集 0.928,验证集 0.808),优于传统生物标志物(EO#、GGT),为早期诊断提供新工具。
肝吸虫(Clonorchis sinensis)感染是我国常见的食源性寄生虫病,成虫寄生于肝胆管内,可引发胆囊炎、胆管炎甚至肝癌等严重并发症。世界卫生组织已将其列为 I 类生物致癌物。然而,肝吸虫感染早期症状轻微,常表现为消化不良、乏力等非特异性症状,加之传统诊断方法如粪便镜检依赖人工操作、阳性率低,免疫检测易出现假阳性,分子诊断成本高,导致早期漏诊率高。因此,开发一种便捷、高效的早期诊断工具迫在眉睫。
为解决这一临床难题,吉林大学第二医院联合第一医院的研究团队开展了一项回顾性研究。研究人员收集了 147 例肝吸虫感染患者(疾病组)和 151 例健康体检者(对照组)的实验室数据,通过单因素 Logistic 回归、Spearman 相关性分析及共线性诊断等方法筛选独立影响因素,最终构建了包含 12 项实验室指标的肝吸虫感染早期预测模型,并在另一医院的独立队列中进行了外部验证。该研究成果发表在《Parasites & Vectors》。
研究采用的关键技术方法包括:
- 数据收集与处理:提取电子病历中的实验室数据(血常规、生化指标等),排除溶血、脂血等不合格样本,对缺失值采用均值、中位数插补等方法处理。
- 统计建模:通过单因素 Logistic 回归筛选差异显著变量,利用 Spearman 分析变量相关性,结合方差膨胀因子(VIF)排除共线性指标,最终采用向后似然比法构建多因素 Logistic 回归模型。
- 模型评估:运用受试者工作特征曲线(ROC)评估区分度,校准曲线验证拟合优度,决策曲线分析(DCA)评价临床实用性,并与传统生物标志物嗜酸性粒细胞计数(EO#)和 γ- 谷氨酰转肽酶(GGT)进行对比。
研究结果
1. 研究对象基线特征
疾病组平均年龄 57.89 岁,男性占 78.91%,最常见合并症为心血管疾病(41.50%);对照组平均年龄 55.28 岁,男性占 77.48%。实验室指标显示,两组间 39 项指标存在显著差异(P<0.05),包括血常规、肝功能、肾功能、电解质等。
2. 特征筛选与模型构建
单因素分析显示 35 项指标与肝吸虫感染相关,经共线性排除后,最终纳入 12 项指标构建模型,包括尿酸(UA)、纤维蛋白原(Fg)、红细胞分布宽度(RDW)、血小板分布宽度(PDW)、GGT、高密度脂蛋白胆固醇(HDL-C)、血尿素氮(BUN)、钾(K)、钠(Na)、磷(P)、镁(Mg)、估算肾小球滤过率(eGFR)。诺莫图(Nomogram)可视化模型,通过各指标评分总和预测感染概率。
3. 模型性能评估
- 区分度:训练集 ROC 曲线下面积(AUC)为 0.928(95% CI 0.899-0.957),显著高于 EO#(AUC=0.577)和 GGT(AUC=0.620);验证集 AUC 为 0.808(95% CI 0.653-0.963)。
- 拟合优度:Hosmer-Lemeshow 检验显示训练集与验证集拟合良好(P>0.05)。
- 临床实用性:DCA 表明,当阈值概率 > 8% 时,模型净获益优于 “全治疗” 策略,在 49.3%-100% 阈值范围内优势显著。
4. 外部验证与对比
验证集包含 16 例患者和 14 例对照,模型灵敏度 62.5%,特异度 64.29%,准确率 63.33%,虽低于训练集,但仍显示稳定的预测能力。
结论与讨论
本研究开发的肝吸虫感染早期预测模型基于常规实验室指标,无需额外影像学或特殊检测,具有便捷、经济的优势。模型整合多维度指标,突破了单一生物标志物(如 EO#、GGT)诊断效能不足的局限,为临床提供了新的辅助诊断工具。
研究发现,肝吸虫感染与多项系统指标相关,如 Fg 升高可能与虫体分泌的组织蛋白酶 L 降解纤维蛋白有关;HDL-C 和 UA 水平变化可能反映寄生虫对宿主脂质代谢的影响;肾功能指标(eGFR、BUN)及电解质(K、Na、P、Mg)异常提示感染可能通过免疫复合物损伤肾脏或干扰电解质平衡。这些发现为深入理解肝吸虫致病机制提供了新线索。
尽管研究存在样本量较小、回顾性设计导致的潜在偏倚等局限,但其构建的模型在早期筛查中的价值显著,尤其适用于高发地区人群的大规模筛查,有助于实现 “早发现、早治疗”,降低重症发生率和疾病负担。未来需更大样本的前瞻性研究进一步验证,并探索与人工智能算法结合以提升预测精度。