biogrowleR:基于贝叶斯层次模型的纵向数据增强分析工具在肿瘤生长与药物筛选研究中的应用

【字体: 时间:2025年06月04日 来源:Journal of Mammary Gland Biology and Neoplasia 3.0

编辑推荐:

  针对生物医学研究中纵向数据分析存在的组间不平衡、数据缺失等问题,瑞士洛桑联邦理工学院团队开发了开源R包biogrowleR。该工具整合贝叶斯层次模型(Bayesian hierarchical modeling)与效应量分析,突破传统t检验/ANOVA局限,通过随机化算法优化动物实验设计(3R原则),并应用于PDX模型(Patient-derived xenograft)和T47D细胞药物筛选,为激素受体阳性乳腺癌(ER+BC)研究提供可视化-建模-解释一体化解决方案。

  

在生物医学研究中,时间序列数据的分析一直是个棘手的问题。无论是肿瘤生长曲线、药物疗效测试还是高通量筛选,研究人员都面临着数据缺失、组间不平衡等挑战。传统的统计方法如t检验或重复测量ANOVA往往力不从心,尤其是在样本量小、测量点不规律的情况下。更糟糕的是,许多研究过分依赖p值,而忽略了效应量这一更反映生物学意义的关键指标。这些问题在激素受体阳性乳腺癌(ER+BC)等复杂疾病模型中尤为突出,因为这些模型的生长曲线通常呈现高度变异性,且伦理考量限制了动物实验的样本量。

为破解这一难题,瑞士洛桑联邦理工学院(EPFL)的Carlos Ronchi、Giovanna Ambrosini和Cathrin Brisken团队开发了创新性R包biogrowleR。这项发表在《Journal of Mammary Gland Biology and Neoplasia》的研究,通过整合贝叶斯推断与层次建模技术,建立了从数据可视化到生物学解释的完整分析流程。该工具特别适用于患者来源异种移植(PDX)模型和药物筛选实验,能够更准确地捕捉肿瘤生长动力学和治疗响应模式。

研究团队运用了三大关键技术:1) 基于rstanarm包的贝叶斯层次模型(Bayesian hierarchical modeling),处理重复测量和缺失数据;2) 模拟退火算法(simulated annealing)实现基于多时间点的样本随机分组;3) Incucyte SX3高通量成像系统进行药物筛选实验。PDX模型数据来源于表达GFP-Luc报告基因的ER+乳腺癌患者样本,通过导管内移植(MIND)技术建立。

数据探索与可视化
通过体内成像系统(IVIS)追踪移植瘤生物发光信号,团队开发了系统的异常值识别流程。如图2所示,结合原始IVIS图像和立体荧光显微镜检查,能有效区分成功移植(均匀荧光分布)与失败样本(局灶性荧光)。对数转换后的生长曲线可视化揭示了激素处理(雌二醇E2、孕酮P4及其组合)的差异效应,为后续建模奠定基础。

建模数据生成过程
团队创新性地将测量值(log10总光子通量)建模为时间和处理的函数,加入个体差异随机效应(1|id)。公式1展示的混合效应模型既能捕捉整体趋势,又考虑了样本间变异。这种层次结构特别适合PDX实验,其中每个移植导管为一级嵌套,宿主小鼠为二级嵌套。

贝叶斯框架
与传统频率学派不同,该方法通过后验分布直接评估效应量的生物学意义。如图3所示,比较E2与对照的斜率差异时,98%的后验概率支持E2促进生长。团队采用弱信息先验(均值7±2)稳定log10通量估计,这种基于生物学知识(治疗启动阈值)的先验设置显著提升了小样本可靠性。

频率学派框架
作为对照,似然比检验(LRT)显示E2 vs 对照(p=0.068)和E2 vs E2+P4(p=0.0017)存在差异,与贝叶斯结果一致。但贝叶斯方法提供了更丰富的效应方向与幅度信息,如E2+P4组合表现出拮抗效应(图3d)。

样本随机化
针对动物实验的伦理需求,团队开发了基于模拟退火的新型随机化算法。如图4所示,该算法通过最小化组间斜率、终点值及其标准差的差异,实现了仅需8只小鼠的均衡分组。温度衰减函数(α=0.5)确保算法跳出局部最优,为小样本实验提供可靠分组方案。

药物筛选分析
在T47D:RFP-Luc2细胞筛选中(25种处理×12重复),线性样条模型(节点25h)成功捕捉药物动力学。森林图(图6c)显示ARV110(雄激素受体PROTAC降解剂)与DHT联用产生最强抑制,而Fulvestrant(氟维司群)呈现延迟效应,这与ER降解机制相符。热图可视化进一步揭示了不同药物的时间-效应特征。

合成数据验证
通过simstudy包生成的模拟数据证实,当效应量>0.2时,每组10个样本即可获得稳定估计(图7e)。但数据变异>4时需15+样本,这对PDX实验设计具有重要指导意义。运行时间分析显示计算效率随样本量线性增长,保障了实际应用可行性。

这项研究的创新价值体现在三个方面:方法学上,biogrowleR首次将贝叶斯效应量分析与层次建模结合,克服了传统方法的局限性;应用层面,工具已成功应用于PDX模型和药物筛选,特别是揭示了ER+乳腺癌中激素互作模式;伦理贡献方面,通过优化随机化和样本量估算,切实贯彻3R原则。研究提供的开源框架(https://upbri.gitlab.io/biogrowleR/)包含详细教程,即使非生物信息学家也能执行复杂分析。

未来,该方法可扩展至其他纵向研究场景,如微生物生长动力学或临床监测数据。团队特别强调,在生物医学研究中,应当用效应量的概率解释替代简单的"显著/不显著"二分法,这一理念对提升研究可重复性具有重要意义。随着精准医学发展,这种能同时处理技术变异和生物学复杂性的分析方法,将为个体化治疗研究提供新的方法论支持。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号