
-
生物通官微
陪你抓住生命科技
跳动的脉搏
在分布偏移的情况下,通过最小化正则化协方差行列式来实现单个测试样本预测的自适应样本选择
《ANALYTICAL AND BIOANALYTICAL CHEMISTRY》:Adaptive sample selection for individual test-sample prediction under distribution shift via minimum regularized covariance determinant
【字体: 大 中 小 】 时间:2025年11月19日 来源:ANALYTICAL AND BIOANALYTICAL CHEMISTRY 3.8
编辑推荐:
针对分布偏移问题对高维回归PLS模型的影响,提出自适应最小正则化协方差行列式(AMRCD)方法,通过自适应匹配测试样本分布选择训练样本,结合正则化技术优化协方差矩阵条件,在模拟和真实数据验证中显著提升预测精度,优于传统PLS方法。
数据分布的偏移对数据分析构成了重大挑战。如果训练样本中的一部分与实际应用中的数据分布不匹配,模型的预测性能和泛化能力将会下降。这种现象在偏最小二乘(PLS)中尤为明显,PLS是一种广泛用于处理高维回归问题的回归技术。为了解决这一挑战,本研究提出了自适应最小正则化协方差行列式(AMRCD)方法,该方法能够从与单个测试样本具有相同分布的训练样本中自适应地选择样本。该方法有助于构建准确的PLS模型,并有效提高测试样本的预测精度。此外,AMRCD框架还结合了正则化技术,以确保在高维空间中协方差矩阵保持良好的条件数。通过三个模拟实验和两个真实世界数据集的验证,该方法在预测精度上显著优于传统的PLS和其他样本选择框架。

生物通微信公众号
知名企业招聘