基于中性集理论的不确定数据缺失值插补新方法研究
《Franklin Open》:Simulation based evaluation of neutrosophic exponential imputations of population mean using neutrosophic ranked set sampling
【字体:
大
中
小
】
时间:2025年12月19日
来源:Franklin Open CS1.4
编辑推荐:
为解决传统统计方法在处理不确定、模糊及不完整数据时的局限性,研究人员开展了基于中性集理论(Neutrosophic Set Theory)的缺失值插补方法研究。该研究系统性地提出了多种中性集插补结构,包括比率、回归、指数及幂比率-指数混合型插补器,并推导了其均方误差(MSE)的近似表达式。研究结果表明,在存在不确定性的数据集中,所提出的中性集插补方法能够提供更稳健、更准确的估计,为处理复杂现实世界数据提供了新的理论框架和实用工具,具有重要的理论意义和应用价值。
在现实世界的数据分析中,数据缺失是一个普遍且棘手的问题。无论是社会调查、医学研究还是经济统计,我们常常无法获得所有样本的完整信息。传统的统计方法通常假设数据是确定的、清晰的,但现实中的数据往往充满了不确定性、模糊性和不完整性。例如,在调查问卷中,受访者可能因为隐私、遗忘或理解偏差而拒绝回答或提供模糊的答案。这种不确定性使得传统的“确定性”统计方法在处理这类数据时显得力不从心,可能导致估计结果出现偏差,甚至得出错误的结论。
为了应对这一挑战,研究人员将目光投向了中性集理论(Neutrosophic Set Theory)。该理论由Smarandache教授提出,它扩展了经典集合论和模糊集理论,能够同时处理数据的真、假和不确定(或模糊)三个维度。将这一理论引入统计学,特别是缺失值插补领域,为处理不确定数据提供了全新的视角和强大的数学工具。本研究旨在系统性地开发一套基于中性集理论的缺失值插补方法,以更准确地估计总体参数,为处理复杂、不确定的现实世界数据提供更稳健的解决方案。
为了回答上述问题,研究人员在《Franklin Open》上发表论文,系统性地提出并比较了多种基于中性集理论的插补方法。研究首先定义了中性集环境下的基本概念,如中性集变量、样本均值和方差等。在此基础上,研究人员构建了三种不同的抽样方案(Scheme I, II, III),分别对应不同的辅助信息可用性场景。针对每种方案,研究团队设计并推导了四类插补器及其对应的估计量:中性集比率插补器(Neutrosophic Ratio Imputations)、中性集回归插补器(Neutrosophic Regression Imputations)、中性集指数比率插补器(Neutrosophic Exponential Ratio Imputations)以及中性集幂比率-指数插补器(Neutrosophic Power Ratio-cum Exponential Ratio Imputations)。对于每一种估计量,研究人员都详细推导了其偏差(Bias)和均方误差(MSE)的近似表达式,为后续的理论比较和效率评估奠定了基础。
本研究主要采用了理论推导和数学建模作为关键技术方法。研究首先基于中性集理论构建了数学框架,定义了中性集变量及其统计特征。随后,研究人员针对不同的抽样方案(Scheme I, II, III)设计了多种插补结构,包括比率型、回归型、指数型和混合型。通过引入误差项和泰勒级数展开,研究团队对每种估计量的偏差和均方误差(MSE)进行了严格的数学推导,从而在理论上比较了不同估计量的效率。此外,研究还通过模拟研究和真实数据分析,验证了所提出方法的有效性和优越性。
研究人员首先提出了三种中性集比率插补结构,分别适用于不同的辅助信息场景。这些方法利用研究变量与辅助变量之间的正相关关系,通过比率的形式来估计缺失值。研究推导了这些比率估计量的均方误差(MSE),并给出了具体的数学表达式。结果表明,这些比率估计量在辅助变量与研究变量高度相关时,能够有效降低估计的方差,提高估计效率。
为了进一步提高估计精度,研究人员提出了中性集回归插补方法。该方法通过建立研究变量与辅助变量之间的线性回归关系来预测缺失值。研究推导了回归系数的最优值,并给出了在最优回归系数下,回归估计量的最小均方误差(MSE)。理论分析表明,当回归线通过原点且变量间存在线性关系时,回归估计量通常比简单的比率估计量更有效。
考虑到某些情况下变量之间的关系可能不是线性的,研究人员引入了指数函数,提出了中性集指数比率插补方法。该方法结合了比率和指数变换,能够更好地捕捉变量之间的非线性关系。研究同样推导了这些指数比率估计量的均方误差(MSE),并展示了其在特定条件下的优良性能。
为了构建更一般、更灵活的插补器,研究人员进一步提出了中性集幂比率-指数插补方法。该方法将幂函数和指数函数相结合,通过引入一个可优化的参数,使得插补器能够根据数据特征自适应地调整其形式。研究推导了该估计量的均方误差(MSE),并给出了优化参数的最优值。这种混合型插补器具有更强的适应性,能够在更广泛的数据分布下保持较高的估计效率。
本研究系统性地提出并比较了多种基于中性集理论的缺失值插补方法,为解决不确定数据下的统计推断问题提供了新的理论框架和实用工具。研究结果表明,所提出的中性集插补方法,特别是回归型、指数型和幂比率-指数混合型插补器,在理论上具有更小的均方误差(MSE),能够提供比传统方法更准确、更稳健的总体参数估计。这些方法能够有效处理数据中的不确定性和模糊性,为社会科学、医学、经济学等领域的复杂数据分析提供了更可靠的技术支持。该研究不仅丰富了中性集统计学的理论体系,也为处理现实世界中的不确定数据开辟了新的途径,具有重要的理论意义和广泛的应用前景。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号