编辑推荐:
多发性骨髓瘤(MM)预后评估存在局限,依赖初始评估,未考虑纵向变化。研究人员开展基于 MM 患者常规血液检测数据预测疾病进展的研究。结果显示模型预测准确,可提前识别进展风险,有助于个性化诊疗,推动 MM 精准医疗发展。
在医学领域,多发性骨髓瘤(Multiple Myeloma,MM)一直是个棘手的难题。它是一种异质性疾病,患者的生存时间差异极大,短则数月,长则数十年。目前,虽然有多种评分系统用于评估 MM 患者的预后,比如国际分期系统(International Staging System,ISS)及其修订版(R-ISS、R
2-ISS),但这些系统大多仅依赖患者的初始评估,忽视了治疗过程中实验室指标的纵向变化以及疾病的动态发展。而且,MM 患者在治疗期间需要定期进行血液检测,由此产生了大量的纵向数据,传统的生存分析方法难以对这些数据进行有效处理。因此,开发一种能够利用这些纵向数据,精准预测 MM 患者疾病进展的方法迫在眉睫。
来自德国等多个研究机构的研究人员为此展开了深入研究。他们的研究成果发表在《npj Digital Medicine》上,为 MM 的诊疗带来了新的希望。
研究人员主要运用了以下关键技术方法:首先,从多发性骨髓瘤研究基金会(Multiple Myeloma Research Foundation,MMRF)的 CoMMpass 研究(NCT01454297)数据库获取新诊断多发性骨髓瘤(newly diagnosed multiple myeloma,NDMM)患者的数据,以及德国多发性骨髓瘤多中心研究组(German-Speaking Myeloma Multicenter Group,GMMG)的 MM5 试验数据用于外部验证。其次,采用长短期记忆网络(Long Short-Term Memory,LSTM)结合条件受限玻尔兹曼机(Conditional Restricted Boltzmann Machine,CRBM)构建预测模型。LSTM 用于编码患者血液检测的历史信息,CRBM 则基于 LSTM 的输出生成未来可能的疾病轨迹概率分布,以此预测未来血液检测结果。此外,还开发了注释模型(Annotation Model),用于识别预测数据中的疾病进展事件。
下面来看具体的研究结果:
- 预测模型性能:通过计算均方误差(Mean Squared Error,MSE)等指标评估模型预测血液检测结果的准确性。结果显示,除乳酸脱氢酶(Lactate dehydrogenase,LDH)外,预测模型在所有参数和预测时间跨度上均优于基于最后观测值结转(Last Observation Carried Forward,LOCF)和移动平均(Moving Average,MA)的基线估计器。在预测疾病参数的突然变化时,模型对关键疾病参数 M 蛋白(M-Protein,M-Pr)、血清游离轻链 λ(serum free light-chain λ,SFL-λ)和血清游离轻链 κ(serum free light-chain κ,SFL-κ)的预测表现也显著优于基线估计器。模型预测的血液检测结果与实际数据相关性较高,且能较好地捕捉数据趋势。同时,模型在反映血液检测关键特征之间的交叉相关性和时间序列的自相关性方面也表现出色。通过 SHapley Additive exPlanation(SHAP)值分析发现,模型主要基于特征的历史水平进行预测,并整合与其他特征的相互作用进一步优化预测。例如,SFL-κ 和 SFL-λ 之间存在强烈的负相互作用,而 SFL 与肌酐(Creatinine,Cr)、β2微球蛋白(β2-Microglobulin,β2m)与 Cr 之间存在正相互作用,这些都与临床预期相符。
- 进展注释性能:注释模型在预测疾病进展事件方面表现良好。其受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic Curve,AUROC)达到 0.88 ± 0.01,精度召回曲线下面积(Area Under the Precision-Recall Curve,AUPRC)为 0.41 ± 0.02。通过优化 Fβ分数确定最佳决策阈值,此时模型的灵敏度为 0.92 ± 0.02,特异性为 0.65 ± 0.03 。
- 进展预测元模型评估:将注释模型与预测模型集成的元模型,在预测进展事件时,预测能力在 3 个月的预测时间跨度内较高,随着预测时间跨度的延长逐渐下降。例如,3 个月预测时,AUROC 为 0.78 ± 0.02,15 个月时降至 0.62 ± 0.02。同时发现,先前观察的时长对短期预测影响较小,但对长期预测越来越重要。SHAP 值分析表明,SFL-λ、SFL-κ 和 M-Pr 等关键疾病参数对模型预测有显著影响,而白蛋白(Albumin,Alb)和白细胞(White blood cells,WBC)等特征的影响相对较小但也符合临床预期。
- 外部验证:在 GMMG-MM5 研究数据集上的外部验证结果重现了主要研究发现。预测模型在预测生物标志物轨迹方面始终优于基线估计器,且模型的判别性能在较短预测时间跨度内较高。这表明模型具有良好的泛化能力和稳健性,可用于不同患者群体的疾病进展预测。
研究结论和讨论部分指出,该研究成功开发了一种模块化预测模型,能够根据 MM 患者常规血液检测数据的独特轨迹预测疾病进展事件。通过 5 折交叉验证和外部验证,证明了模型的稳健性和泛化能力。虽然模型目前存在假阳性率较高的问题,但在低患病率情况下,其预测性能仍优于许多癌症筛查方法。该模型可作为临床判断的补充,帮助早期识别高危患者,及时调整随访计划,有可能改善患者预后。同时,研究也指出了模型的局限性,如未考虑系统不确定性、部分临床因素未纳入模型等。未来需要持续进行验证、确认和不确定性量化(Verification Validation and Uncertainty Quantification,VVUQ),探索更自适应的建模技术,进一步完善模型。此外,该模型为多发性骨髓瘤的数字化诊疗提供了新的思路,有助于推动虚拟人类双胞胎(Virtual Human Twin,VHT)系统在 MM 护理中的应用,优化医疗资源利用,提高患者的治疗效果和生活质量,在多发性骨髓瘤的临床诊疗和研究领域具有重要的意义。