编辑推荐:
在生物医药领域,临床试验时长影响药物研发进程及成本。研究人员开展 “Predicting clinical trial duration via statistical and machine learning models” 研究,用多种模型预测试验时长,发现 DeepSurv 模型最佳,还明确关键影响因素,对优化试验设计意义重大。
在生物医药领域,从临床前动物研究到 3 期临床试验的转化研究面临资金缺口,即所谓的 “死亡之谷”。其中,临床试验周期长是一大难题,它增加了药物研发成本,阻碍有效疗法惠及患者。为解决这些问题,研究人员开展了用统计和机器学习模型预测临床试验时长的研究。该研究成果发表在《Contemporary Clinical Trials Communications》上。
研究人员使用了多种关键技术方法。数据方面,从 Citeline 数据库获取历史临床试验数据,涵盖药物、疾病等多方面特征,并进行数据预处理,包括对缺失值的处理等。模型方面,运用传统生存分析模型(如非参数的 Kaplan–Meier、半参数的 Cox 回归、参数的加速失效时间模型)和多种机器学习模型(基于决策树的生存树、随机生存森林、梯度提升生存树,基于神经网络的 DeepSurv、神经多任务逻辑回归,以及生存支持向量机)进行分析,通过五折交叉验证评估模型性能。
研究结果如下:
- 非参数分析和总体统计:对临床试验时长按阶段进行总结统计,发现 1 期试验持续时间最短,1/2 期试验最长,2、2/3 和 3 期的持续时间分布较为相似。不同疾病类别的构成影响各阶段试验时长,同一疾病类别中,试验时长通常随阶段推进而增加。近二十年,平均试验时长呈下降趋势,但近期数据因部分长期试验仍在进行而存在偏差。
- 预测性能:比较不同模型的预测性能,以一致性指数(c-index)衡量。DeepSurv 模型表现最佳,平均 c-index 达到 0.777,随机森林也表现出色,而单一生存树的 c-index 最低。这表明基于神经的生存模型和经过调优的集成模型能更好地捕捉临床试验数据中的复杂关系。
- 特征重要性:
- 相关系数:计算 Spearman 和 Pearson 相关系数衡量特征重要性。“治疗领域:肿瘤学” 与试验时长呈强正相关,1 期试验呈高负相关,以生存为终点的试验与时长正相关。
- 排列重要性:通过排列重要性分析发现,“治疗领域:肿瘤学” 和 “申办者类型:学术” 等特征在所有模型中都具有较高的排列重要性。不同模型虽预测性能有差异,但都认为药物是否用于肿瘤治疗、申办者类型、试验开始日期和试验阶段等是影响试验时长的重要因素 。
研究结论和讨论部分指出,药物是否用于肿瘤治疗是影响试验时长的最重要因素。肿瘤试验因需长期随访以评估生存和疾病进展等终点,导致时间较长,不过可通过采用平台试验、贝叶斯试验等新型试验设计缩短时长。此外,学术和政府机构开展的临床试验比药企的更长,这意味着需要加强公私合作,尤其是在罕见病药物研发方面,给予药企更多激励,有望缩短试验时长,使患者受益。这项研究为优化临床试验设计、合理分配资源、降低药物研发成本提供了重要依据,推动了生物医药领域的发展。