广义加性模型(GAMs)为回归分析提供了一个简洁、灵活且易于解释的框架,尤其是在处理大量候选预测变量时。本论文探讨了GAM变量选择问题:将每个候选预测变量对均值响应的影响分类为线性、非线性或零。我们采用了贝叶斯模型选择方法和分组最小绝对值收缩与选择算子(LASSO)先验。对于稀疏拟合,我们探索了两种类型的先验。第一种是Laplace-zero和分组LASSO-zero先验,适用于高斯和二元响应;第二种是(分组)马蹄形先验,适用于高斯、泊松和负二项响应。对于这两种先验类型,定制的辅助变量表示使得马尔可夫链蒙特卡洛(MCMC)采样得以实际应用。具体来说,对于高斯和二元响应,采样过程简化为Gibbs采样;对于计数响应,则采用切片采样。为了提高计算效率,尤其是在处理大型数据集时,我们在Laplace-zero和分组LASSO-zero先验下推导出了平均场变分贝叶斯(MFVB)算法。这些用于高斯和二元GAM选择的MCMC和MFVB方法已实现于公开可用的R包gamselBayes中。尽管这种变分方法的准确性低于MCMC,但在速度上有了显著提升。此外,该GAM选择框架还扩展到了具有随机截距的广义加性混合模型(GAMMs),同样适用于高斯和二元响应,并采用了MCMC和MFVB方法。最后,研究了分组马蹄形分布的特性及其在贝叶斯GAM选择中的应用。虽然单变量马蹄形分布的许多特性在分组情况下仍然适用,但也会出现一些差异。
其中一些研究成果已发表在 [参考文献 He和Wand1、参考文献 He和Wand2] 中。


