偏度

形狀量數

偏度(英语:skewness),亦称歪度,在概率论统计学中衡量实数随机变量概率分布的不对称性。偏度的值可以为正,可以为负或者甚至是无法定义。在数量上,偏度为负(负偏态;左偏)就意味着在概率密度函数左侧的尾部比右侧的长,绝大多数的值(不一定包括中位数在内[1])位于平均值的右侧。偏度为正(正偏态;右偏)就意味着在概率密度函数右侧的尾部比左侧的长,绝大多数的值(不一定包括中位数[1])位于平均值的左侧。偏度为零就表示数值相对均匀地分布在平均值的两侧,但不一定意味着其为对称分布。

偏度不为零的实验数据样本(小麦胚芽鞘向地反应:1,790)
负偏态(左)和正偏态(右)

介绍 编辑

偏度分为两种:

  • 负偏态左偏态:左侧的尾部更长,分布的主体集中在右侧。[2]
  • 正偏态右偏态:右侧的尾部更长,分布的主体集中在左侧。[2]

如果分布对称,那么平均值=中位数,偏度为零(此外,如果分布为单峰分布,那么平均值=中位数=众数)。

定义 编辑

随机变量 的偏度 为三阶标准矩,可被定义为:

 

其中 是三阶中心矩 标准差 期望算子。等式的最后以三阶累积量与二阶累积量的1.5次方的比率来表示偏度。这和用四阶累积量除去二阶累积量的平方来表示峰度的方法向类似。

偏度有时用 来表示。老教科书过去常常用 来表示偏度,可是由于偏度可为负,这样的表示法较为不便。

对上面的等式进行扩展可导出用非中心矩E[X3]来表示偏度的公式:

 

样本偏度 编辑

具有 个值的样本样本偏度为:

 

其中 样本平均值 是三阶样本中心矩, 是二阶样本中心距,即样本方差

性质 编辑

当:   时,偏度可以是无穷大的。

或者当:   为负)及

  为正)时,偏度无法定义。

在后面的这个例子中,三阶累积量是无法定义的。 其他分布形式比如:

 

二阶和三阶累积量是无穷大的,所以偏度也是无法定义的。

如果假定  个独立变量之和并且这些变量和 具有相同的分布,那么 的三阶累积量是  倍, 的二阶累积量也是  倍,所以:  。根据中心极限定理,当其接近高斯分布时变量之和的偏度减小。

参见 编辑

注释 编辑

  1. ^ 1.0 1.1 存档副本. [2018-12-14]. (原始内容存档于2020-11-12). 
  2. ^ 2.0 2.1 存档副本. [2010-10-30]. (原始内容存档于2011-08-11). 

参考资料 编辑

  • Groeneveld, RA; Meeden, G. Measuring Skewness and Kurtosis. The Statistician. 1984, 33 (4): 391–399 [2010-10-30]. doi:10.2307/2987742. (原始内容存档于2020-08-20). 
  • Johnson, NL, Kotz, S, Balakrishnan N (1994) Continuous Univariate Distributions, Vol 1, 2nd Edition Wiley ISBN 0-471-58495-9
  • MacGillivray, HL. Shape properties of the g- and h- and Johnson families. Comm. Statistics - Theory and Methods. 1992, 21: 1244–1250.