《Journal of Radiation Research and Applied Sciences》:A novel statistical outlet with reliability characteristics: Its implementations in the human capital resilience and radiation sector
编辑推荐:
摘要—研究人员提出一类基于概率比例于规模抽样(Probability Proportional to Size, PPS)并结合指数变换与线性校正的新估计量,用以估计有限总体均值,特别面向辐射行业人力韧性(human capital resilience)评估
摘要—研究人员提出一类基于概率比例于规模抽样(Probability Proportional to Size, PPS)并结合指数变换与线性校正的新估计量,用以估计有限总体均值,特别面向辐射行业人力韧性(human capital resilience)评估场景。传统PPS估计量及常规比估计(ratio estimator)、回归估计(regression estimator)、指数型估计(exponential-type estimator)未能充分利用与调查变量(study variable Y)高度相关的辅助信息(auxiliary variable X),且在异质与不等概抽样条件下效率偏低。本文推导了所提估计量的偏倚(Bias)与均方误差(Mean Squared Error, MSE)至一阶近似,通过最优化获得使MSE最小化的常数S1、S2,并与既有经典估计量进行理论比较条件推导。基于四组真实数据集与蒙特卡洛模拟(Monte Carlo simulation, R=1000次)的数值与模拟研究结果表明,所提估计类的MSE显著低于无偏PPS估计量及Bahl & Tuteja(1991)指数估计量、Shabbir & Gupta(2007)改进估计量等现有方法,百分比相对效率(PRE)最高可超过4000%,证明融合领域相关辅助信息能显著提升PPS下总体均值估计的效率与稳定性,适用于安全关键(safety-critical)行业的决策支持。
研究背景与意义
在辐射等安全关键(safety?critical)行业中,人力资本的韧性与职业健康监控依赖对关键指标总体均值的可靠统计推断。传统简单随机抽样或常规概率比例于规模抽样(Probability Proportional to Size, PPS)估计量未充分利用已有的辅助信息(auxiliary variable, 如设施规模、辐射剂量日志、运营能力标度),且对异质性强、单元规模差异大的总体表现不稳定,导致估计偏倚大或方差高,影响资源配置与安全决策。现有指数型与改进回归类估计量亦未在PPS框架下系统性整合可靠性导向的辅助信息利用机制。为此,研究人员开展此项研究,旨在PPS抽样下构造一类融合指数变换、线性校正及辅助信息的新型总体均值估计类,通过理论推导与实证验证其优于既有估计方法,论文发表于《Journal of Radiation Research and Applied Sciences》。
主要关键技术方法
研究人员采用以下主要技术路线:①在PPS抽样(有放回,PPSWR)框架下构造含可调常数S1、S2及指数因子α、β的新广义估计类YˉPropps=uˉ[S1+S2(Xˉ/vˉ)]exp(α(Xˉ+vˉ)+2βα{Xˉ?vˉ});②以误差项法将估计量展开至一阶,推导偏倚(Bias)与均方误差(Mean Squared Error, MSE MSE(?))的一阶近似表达式;③对MSE关于S1、S2求偏导并令为零,解得最优S1(opt)、S2(opt)及最小MSE解析式;④分别用四个真实数据集(辐射相关及社会经济数据源,N=20~3280, n=8~400)与蒙特卡洛模拟(N=500, n=50, R=1000, 正态分布/伽马分布/指数分布, ρ=0.3与0.9)计算各估计量MSE与百分比相对效率(PRE=\frac{\text{MSE}(\bar{Y}_{ups})}{\text{MSE}(\hat{\theta)}\times100),与无偏PPS估计Yˉupps、比估计YˉRpps、积估计YˉPpps、回归PPS估计YˉRegpps、Bahl & Tuteja(1991)指数比/积估计YˉERpps、YˉEPpps及Shabbir & Gupta(2007)改进估计YˉSGpps做对比。
研究结果
—4. Suggested estimator(建议估计量)
研究人员给出广义PPS估计类表达式,经误差展开(uˉ=Yˉ(1+ξ0), Xˉ=Xˉ(1+ξ1))并作泰勒展开并略去高阶项,获得其一阶偏差表达式Bias(YˉPropps)=Yˉ[?]与MSE最小化条件,得到最优常数S1(opt)、S2(opt)及最小MSE公式,其中含AA1、BB1、CC1、DD1、EE1等由ν20、ν02、ν11与θ=αXˉ/[2(αXˉ+β)]构成之组合项。结论:经最优化的所提估计类在理论上具备比既有估计量更低MSE。
—5. Empirical study(实证研究)
采用四组真实总体(Population?I~IV,来自El?Saeed et al. 2025、Alomani et al. 2025、Aloraini et al. 2025及Kaggle智慧城市中国数据集),分别计算八类估计量MSE与PRE。结论:所提估计量(YˉPropps1~YˉPropps4)在全部四个总体中MSE最低(如Pop?I: 88.73 vs 次优89.29;Pop?III: 55.26),PRE最高(Pop?IV达约4263),传统积估计与指数积估计因Y–X相关性方向不适而效率低下(PRE<100),回归估计次之,证实新估计量有效利用正相关辅助信息且稳健。
—7. Simulation study(模拟研究)
按设定N=500、n=50、R=1000,生成正态/伽马/指数分布X并依Yi=α+βXi+εi(εi~N(0,σ2))构建不同ρ(0.3,0.9)的人工总体,PPSWR抽样后重复计算各估计量MSE与PRE。结论:随ρ增大所有利用辅助信息的估计量MSE下降、PRE上升;无偏PPS估计量MSE始终最大;所提估计类在所有分布与相关系数水平下MSE最小、PRE最高(正态ρ=0.9时MSE低至38.55,PRE达1266),其中Proposed?3表现最优,验证其在异质与偏态总体中的高效性与稳健性。
—8. Discussion(讨论归纳)
讨论指出:新估计量较传统PPS及经典估计显著降低MSE系因充分融合与调查变量强相关的领域辅助信息;可靠性导向设计使其在极端规模失衡时估计仍稳定,适合辐射行业安全决策;领域特定辅助变量(如人员暴露等级、运营能力)比通用变量更能提升精度;产品与指数积估计不适用于Y与X正相关情形;所提估计类各变体差异微小,说明结构稳健。局限含依赖设定相关结构、仅估总体均值、未涉动态PPS或纵向追踪。未来可拓展至多参数估计、多辅助变量、动态PPS及纵向韧性监测系统集成。
结论部分翻译
本研究提出一种基于概率比例于规模抽样(Probability Proportional to Size, PPS)且融合可靠性思想的总体均值新估计量,可有效利用辅助信息(auxiliary information),应用于辐射行业人力韧性(human capital resilience)评估。分析表明所提估计量相较传统PPS及经典抽样估计量具更优的效率与可靠性,偏差(Bias)与均方误差(Mean Squared Error, MSE)的一阶近似推导及数值与模拟结果均证实这点。模拟与实证研究发现,在PPS抽样中将领域相关辅助信息与所提函数形式相结合可显著降低MSE,故该估计量适于复杂异质总体下的实际应用。此研究弥补了抽样理论与韧性导向实务间的缺口,为辐射密集型及其他类似结构行业的研究者、从业者及政策制定者提供有效、稳定且实用的统计工具,属兼顾效率与可靠性的PPS估计新途径。