基于k-记录值的累积不精确性测度及其性质
中文标题
《Entropy》:Some Results on Cumulative Residual Inaccuracy Measure of k-Record Values
【字体:
大
中
小
】
时间:2025年12月25日
来源:Entropy 2
编辑推荐:
本文系统评述了基于k-记录值的累积不精确性测度H(Fn,k, F),该测度是动态累积残差熵的推广。作者深入探讨了其数学性质、随机序关系及在威布尔分布等特定模型下的界,为记录值理论在可靠性及信息论中的应用提供了新的理论工具和深刻见解。
本文聚焦于一种名为“基于k-记录值的累积不精确性”的信息理论测度。该测度是动态累积残差熵(DCRE)概念在k-记录值统计量背景下的自然推广。k-记录值是从随机序列中提取的一种特殊顺序统计量,在可靠性理论、极值统计和生存分析中具有重要应用。文章的核心目标是系统研究这一新测度的数学性质、边界及其在不同随机序下的行为。
文章开篇阐述了信息论中熵测度的重要性,特别是用于衡量随机变量不确定性的香农熵。然而,对于非负随机变量,累积残差熵(CRE)及其动态形式(DCRE)通常比香农熵更具优势。研究者随后将注意力转向k-记录值,这是对经典记录值的推广,能提供序列极端或罕见事件更丰富的信息。受此启发,本文定义了k-记录值的累积不精确性测度H(F?n,k, F?),旨在量化第n个k-记录值的生存函数F?n,k(x)与原始分布生存函数F?(x)之间的差异或“不精确性”。该测度的定义为一个积分表达式:H(F?n,k, F?) = -∫0∞F?n,k(x) ln F?(x) dx。文章指出,当k=1时,此测度退化为标准记录值的累积不精确性。
本节首先给出了k-记录值生存函数F?n,k(x)的具体表达式,它是一个与不完全伽马函数相关的求和式。利用此表达式,作者成功地将累积不精确性测度H(F?n,k, F?)转化为一个更易于处理的级数形式,即对j从0到n-1的求和,其中每一项都包含k的j次幂、(j+1)的阶乘、生存函数的k次幂以及对数项的j+1次幂的积分。进一步地,通过识别被积函数与j+2阶k-记录值密度函数的关系,文章将H(F?n,k, F?)优雅地表达为一系列k-记录值期望的加权和之差,即∑j=0n-1kj(j+1)[μj+2,k(x) - μj+1,k(x)],其中μn,k(x)是第n个k-记录值的期望。文章还探讨了该测度的一些基本性质,例如,如果k-记录值的生存函数F?n,k(x)是n的增函数,那么累积不精确性H(F?n,k, F?)也随n增加。此外,如果对随机变量进行严格的单调变换Y = φ(X),则变换后变量对应的累积不精确性测度与原变量测度之间存在明确关系,特别地,当变换是线性缩放(Y = aX)时,有H(G?n,k, G?) = a H(F?n,k, F?)。另一个有趣的性质是,当生存函数满足G?(x) = [F?(x)]β(β为大于1的整数)时,有H(G?n,k, G?) = β H(F?n,kβ, F?)。
本章节致力于推导累积不精确性测度的下界。首先,通过利用生存函数取值在[0,1]之间的性质,将H(F?n,k, F?)的表达式中的项进行放大。接着,引入一个辅助函数η(X) = -∫0∞[F?(x)]kln F?(x) dx和一个概率测度dPk(x) = [F?(x)]k/ Ckdx,其中Ck= ∫0∞[F?(x)]kdx。然后,应用凸函数tj+1的詹森不等式,得到一个积分不等式。将此不等式代入H(F?n,k, F?)的表达式后,最终导出一个通用的下界,该下界表示为∑j=0n-1(j+1)/k2* [η(X)]j+1/ [Ck]j。作为特例,当k=1时,C1即为原始随机变量X的期望E(X),而η(X)则等于原始分布的累积残差熵H(F?)。将此代入通用下界,得到H(F?n,1, F?)的一个具体下界。若进一步假设E(X)=1,则该下界简化为∑j=0n-1[H(F?)]j+1/ j!。
本节研究了在随机序意义下,累积不精确性测度与其他信息测度之间的关系。首先回顾了随机序(X ≤stY 当且仅当 F?(x) ≤ G?(x) 对所有x)和似然比序(X ≤lrY 当且仅当 f(x)/g(x) 关于x递减)的定义。随后提出了两个重要命题。第一个命题指出,如果第n个k-记录值在随机序下小于等于原始变量(Xn,k≤stX),那么k-记录值本身的动态累积残差熵H(F?n,k)满足不等式:H(F?n,k) ≤ H(F?n,k, F?) - E(Xn,k) ln[E(Xn,k)/E(X)]。其证明巧妙地运用了对数求和不等式。进而,在Xn,k≤stX的假设下,可以推导出H(F?n,k) ≤ H(F?) - E(Xn,k) ln[E(Xn,k)/E(X)]。第二个命题建立了累积不精确性测度H(F?n,k, F?)与k-记录值和原始分布之间的另一种不精确性测度H(fn,k, f) = -∫0∞fn,k(x) ln f(x) dx 之间的联系。证明过程再次使用对数求和不等式,并通过对生存函数进行变量替换(u = F?n,k(x))计算一个关键积分,最终得到H(F?n,k, F?) ≤ C eH(fn,k, f),其中C = ek为常数。最后,文章考察了当原始随机变量X服从威布尔分布(其生存函数为F?(x) = e-(λx)β)时的情形。通过计算威布尔分布的期望E(X) = Γ(1/β + 1)/λ,并将相关表达式代入之前的不等式中,经过一系列代数运算和优化,得到了H(F?n,k)的一个下界表达式,该表达式依赖于k-记录值的期望E(Xn,k)以及其β+1阶矩Efn,k(Xβ+1),并且这个下界在某个特定的μβ值处取得。