小样本预测生物标志物研究中仅病例分析的关键评估与应用指引

【字体: 时间:2025年04月17日 来源:Scientific Reports 3.8

编辑推荐:

  在预测生物标志物研究中,小样本研究常因统计方法不佳导致结果不可靠。研究人员开展了针对乳腺癌的模拟研究,评估仅病例分析(Case-only analysis)的性能。结果显示该方法在特定条件下有可接受的特性且能节省成本,但对假设敏感。其为小样本研究提供了新的分析思路。

  在当今精准医疗时代,寻找有效的个性化治疗方案是医学领域的关键目标。肿瘤和患者的各类特征作为预测生物标志物(Predictive Biomarkers),能够为治疗方案的选择提供重要依据,进而提升治疗效果,这在肿瘤学领域意义非凡。然而,目前的研究状况却面临诸多困境。虽然每年都有大量潜在的生物标志物被发现,但最终能应用于临床实践的却寥寥无几。
这主要是因为生物标志物的验证过程极为严格,最终需要通过随机临床试验(Randomized Clinical Trial)来确定其有效性。但此类试验通常需要大量患者参与,获取患者样本的难度较大,且生物标志物的测量需要标准化的检测方法,这些因素使得早期临床研究往往规模较小。在小样本研究中,若使用传统的统计方法,如 Cox 比例风险回归(Cox Proportional Hazards Regression)并结合生物标志物和治疗之间的乘法交互项进行分析,会存在统计功效不足的问题,还可能导致结果有偏差,进而使一些有潜力的生物标志物被放弃。因此,开发适用于小样本预测生物标志物研究的新统计方法迫在眉睫。

为了解决这些问题,德国勃兰登堡医学学校西奥多?冯塔纳分校(Brandenburg Medical School Theodor Fontane)的研究人员 M. Hauptmann、V. H. Nguyen 等人开展了一项模拟研究。研究人员以乳腺癌(Breast Cancer,BC)相关的真实临床研究数据为基础进行模拟,生成了多个数据集,每个数据集包含不同特征的患者,这些特征涉及生物标志物水平(M)、治疗方式(T)等。

研究人员使用了三种不同的模型对生成的数据集进行分析,包括基于仅病例数据的逻辑回归模型(Logistic Regression),以及对所有患者(病例和非病例)使用的 Firth 校正的 Cox 比例风险模型(Firth-corrected Cox Proportional Hazards Model)。在分析过程中,计算了多个性能指标,如偏差(Bias)、相对偏差(Relative Bias)、置信区间(Confidence Interval,CI)的覆盖率、一类错误(Type I Error)和检验效能(Power)等,以此来评估模型的性能。

模拟结果显示:在标记 - 治疗独立性(即)的情况下,当生物标志物对接受标准治疗的患者具有保护作用或无作用(即)时,使用 Firth 校正的仅病例分析方法估计的交互作用和治疗效果系数及其标准误差通常具有可接受的偏差。在这种情况下,事件发生率较低,5 年随访期内 10 - 20% 的患者发生事件,交互系数的一类错误率约为或略低于 5%。同时,Firth 校正的仅病例模型收敛性很高,当时,置信区间覆盖率通常高于名义水平 95%,并随着样本量增加接近 95%。然而,当生物标志物对接受标准治疗的患者有害(即)时,交互系数会出现严重的正偏差,偏差可达 50%。而且,若治疗分配依赖于标记水平(即),交互系数和高标记水平的治疗效果系数会严重偏差,一类错误率会大幅高于 5% 的名义水平。此外,统计检验效能与标记 - 治疗关联密切相关,随着值增大而降低。

总体而言,当总体事件发生率较低、治疗分配与标记水平无关且生物标志物对接受标准治疗的患者具有保护作用或无作用时,修改后的仅病例模型可用于分析相对较小的预测标记研究。该模型能以可接受的偏差估计交互作用和治疗系数及其标准误差,置信区间覆盖率接近或略高于名义水平,一类错误率接近或略低于名义水平,与全队列分析相比,可减少 80% 或更多的生物标志物测量数量和相应成本。但该模型对假设较为敏感,在事件发生率不低(如因有害生物标志物导致)或治疗分配依赖于标记水平时,不应使用。

研究人员在本研究中采用了数据模拟和多种统计模型分析的技术方法。首先,基于真实乳腺癌临床研究数据生成多个包含不同生物标志物水平、治疗方式等特征的数据集。然后,运用基于仅病例数据的逻辑回归模型和 Firth 校正的 Cox 比例风险模型对数据进行分析,并计算偏差、置信区间覆盖率等多个性能指标来评估模型性能。

在研究结果部分,通过不同条件下的模拟研究,得出了不同情况下仅病例分析模型的性能表现。在标记 - 治疗独立性且生物标志物有保护或无作用时,模型性能较好;而在生物标志物有害或治疗分配依赖标记水平时,模型偏差较大。

研究结论表明,小样本预测标记研究在特定条件下可使用仅病例模型进行分析,这为小样本研究提供了新的分析途径,有助于在资源有限的情况下进行生物标志物研究,节省成本。但同时研究也强调了该模型应用的局限性,提醒研究人员在使用时需谨慎考虑假设条件,这对于后续的生物标志物研究以及临床实践中治疗方案的选择具有重要的指导意义,为精准医疗的发展提供了有价值的参考。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号