§2.7 分布的其他特征数

依赖于

无显式依赖

被以下题目直接调用

正文部分

§2.7 分布的其他特征数

$k$ 阶矩

（1）称

μ_{k} = E (X^{k})

为 $X$ 的 $k$ 阶原点矩。一阶原点矩就是数学期望；

（2）称

ν_{k} = E (X - E (X))^{k}

为 $X$ 的 $k$ 阶中心矩。二阶中心矩就是方差；

（3）前 $k$ 阶中心矩可用原点矩表示，如

ν_{1} = 0,

ν_{2} = μ_{2} - μ_{1}^{2},

ν_{3} = μ_{3} - 3 μ_{2} μ_{1} + 2 μ_{1}^{3},

ν_{4} = μ_{4} - 4 μ_{3} μ_{1} + 6 μ_{2} μ_{1}^{2} - 3 μ_{1}^{4} .

变异系数 称比值

C_{v} (X) = \frac{Var ( X )}{E ( X )}

为 $X$ 的变异系数。变异系数是一个无量纲的量。

分位数 设连续随机变量 $X$ 的分布函数为 $F (x)$ ，密度函数为 $p (x)$ 。对任意 $p \in (0, 1)$ ，

（1）称满足条件

F (x_{p}) = \int_{- \infty}^{x_{p}} p (x) d x = p

的 $x_{p}$ 为此分布的 $p$ 分位数，又称下侧 $p$ 分位数，它把密度函数下的面积一分为二，左侧面积恰好为 $p$ ；

（2）称满足条件

1 - F (x_{p}^{'}) = \int_{x_{p}^{'}}^{\infty} p (x) d x = p

的 $x_{p}^{'}$ 为此分布的上侧 $p$ 分位数；

（3）分位数与上侧分位数的转换公式：

x_{p}^{'} = x_{1 - p}, x_{p} = x_{1 - p}^{'} .

（4）称 $p = 0.5$ 时的 $p$ 分位数 $x_{0.5}$ 为此分布的中位数，即 $x_{0.5}$ 满足

F (x_{0.5}) = \int_{- \infty}^{x_{0.5}} p (x) d x = 0.5.

（5）若随机变量 $X$ 的密度函数 $p (x)$ 是偶函数，则此分布的 $p$ 分位数 $x_{p}$ 满足

x_{p} = - x_{1 - p} .

中位数为分布对称中心；

（6）记标准正态分布的 $p$ 分位数为 $u_{p}$ 。因为标准正态密度函数是偶函数，所以

u_{p} = - u_{1 - p} .

譬如

u_{0.25} = - u_{0.75} = - 0.675;

（7）一般正态分布 $N (μ, σ^{2})$ 的 $p$ 分位数 $x_{p}$ 满足

x_{p} = μ + σ u_{p} .

譬如 $N (10, 2^{2})$ 的 $0.25$ 分位数为

x_{0.25} = 10 + 2 u_{0.25} = 8.65;

（8）分布的矩有可能不存在，但连续分布的分位数总存在。 $p$ 分位数 $x_{p}$ 总是 $p$ 的增函数。

\setcounter{enumi}{3}

偏度系数

（1）称比值

β_{s} = \frac{E ( X - E ( X ) ) ^{3}}{[ Var ( X ) ] ^{3/2}}

为 $X$ 的分布的偏度系数，简称偏度；

（2）偏度系数刻画的是分布的不对称程度， $∣ β_{s} ∣$ 愈大，分布的对称性愈差；

（3）任一对称分布的偏度 $β_{s} = 0$ 。当 $β_{s} > 0$ 时，分布为正偏（又称右偏）；当 $β_{s} < 0$ 时，分布为负偏（又称左偏）。

峰度系数

（1）称

β_{k} = \frac{E ( X - E ( X ) ) ^{4}}{[ Var ( X ) ] ^{2}} - 3

为 $X$ 的分布的峰度系数，简称峰度；

（2）峰度系数是刻画分布的尖峭性和尾部粗细的一个特征数；

（3）任一正态分布的峰度 $β_{k} = 0$ 。当 $β_{k} < 0$ 时，分布比标准正态分布平坦；当 $β_{k} > 0$ 时，分布比标准正态分布更尖峭。

偏度与峰度都是描述分布（密度）形状的参数。

习题与解答 2.7

习题 2.7-1

设随机变量 $X \sim U (a, b)$ ，对 $k = 1, 2, 3, 4$ ，求 $μ_{k} = E (X^{k})$ 与 $ν_{k} = E (X - E (X))^{k}$ ，进一步求此分布的偏度系数和峰度系数。

解因为

E (X^{k}) = \int_{a}^{b} \frac{x ^{k}}{b - a} d x = \frac{1}{b - a} \cdot \frac{b ^{k + 1} - a ^{k + 1}}{k + 1},

所以

μ_{1} = E (X) = \frac{a + b}{2}, μ_{2} = E (X^{2}) = \frac{1}{3} (a^{2} + ab + b^{2}),

μ_{3} = E (X^{3}) = \frac{1}{4} (a^{3} + a^{2} b + a b^{2} + b^{3}),

μ_{4} = E (X^{4}) = \frac{1}{5} (a^{4} + a^{3} b + a^{2} b^{2} + a b^{3} + b^{4}) .

又

ν_{1} = E (X - E (X)) = 0, ν_{2} = E (X - E (X))^{2} = Var (X) = \frac{( b - a ) ^{2}}{12},

ν_{3} = μ_{3} - 3 μ_{2} μ_{1} + 2 μ_{1}^{3} = 0,

ν_{4} = μ_{4} - 4 μ_{3} μ_{1} + 6 μ_{2} μ_{1}^{2} - 3 μ_{1}^{4} = \frac{( b - a ) ^{4}}{80} .

偏度系数和峰度系数分别为

β_{s} = \frac{ν _{3}}{ν _{2}^{3/2}} = 0, β_{k} = \frac{ν _{4}}{ν _{2}^{2}} - 3 = \frac{( b - a ) ^{4} /80}{[( b - a ) ^{2} /12 ] ^{2}} - 3 = - 1.2.

**注：**上述 $β_{s}, β_{k}$ 与 $a, b$ 无关。这表明：任一均匀分布的偏度为 $0$ ，峰度为 $- 1.2$ 。

习题 2.7-2

设随机变量 $X \sim U (0, a)$ ，求此分布的变异系数。

解因为

E (X) = \frac{a}{2}, Var (X) = \frac{a ^{2}}{12},

所以此分布的变异系数为

C_{v} (X) = \frac{Var ( X )}{E ( X )} = \frac{a ^{2} /12}{a /2} = \frac{3}{3} = 0.5774.

习题 2.7-3

求以下分布的中位数：

区间 $(a, b)$ 上的均匀分布；

正态分布 $N (μ, σ^{2})$ ；

对数正态分布 $L N (μ, σ^{2})$ 。

解 \text{（1）} 从

0.5 = \int_{a}^{x_{0.5}} \frac{1}{b - a} d x

中解得

x_{0.5} = \frac{a + b}{2} .

\text{（2）} 记 $X \sim N (μ, σ^{2})$ ，由

P (X \leq μ) = Φ (\frac{μ - μ}{σ}) = 0.5

可得

x_{0.5} = μ .

\text{（3）} 记 $Y \sim L N (μ, σ^{2})$ ，令 $X = ln Y$ ，则 $X \sim N (μ, σ^{2})$ 。又记 $x_{0.5}$ 为 $X$ 的中位数， $y_{0.5}$ 为 $Y$ 的中位数，则由（2）知 $x_{0.5} = μ$ ，即

0.5 = P (X \leq μ) = P (ln Y \leq μ) = P (Y \leq e^{μ}),

由此得

y_{0.5} = e^{μ} .

习题 2.7-4

设随机变量 $X \sim G a (α, λ)$ ，对 $k = 1, 2, 3$ ，求 $μ_{k} = E (X^{k})$ 与 $ν_{k} = E (X - E (X))^{k}$ 。

解因为

E (X^{k}) = \frac{λ ^{α}}{Γ ( α )} \int_{0}^{\infty} x^{k + α - 1} e^{- λ x} d x = \frac{Γ ( k + α )}{Γ ( α ) λ ^{k}},

所以

μ_{1} = E (X) = \frac{α}{λ}, μ_{2} = E (X^{2}) = \frac{α ( α + 1 )}{λ ^{2}},

μ_{3} = E (X^{3}) = \frac{α ( α + 1 ) ( α + 2 )}{λ ^{3}},

ν_{1} = E (X - E (X)) = 0, ν_{2} = Var (X) = \frac{α}{λ ^{2}},

ν_{3} = μ_{3} - 3 μ_{2} μ_{1} + 2 μ_{1}^{3} = \frac{2 α}{λ ^{3}} .

习题 2.7-5

设随机变量 $X \sim E x p (λ)$ ，对 $k = 1, 2, 3, 4$ ，求 $μ_{k} = E (X^{k})$ 与 $ν_{k} = E (X - E (X))^{k}$ ，进一步求此分布的变异系数、偏度系数和峰度系数。

解因为

E (X^{k}) = λ \int_{0}^{\infty} x^{k} e^{- λ x} d x = \frac{k !}{λ ^{k}},

所以

μ_{1} = E (X) = \frac{1}{λ}, μ_{2} = E (X^{2}) = \frac{2}{λ ^{2}},

μ_{3} = E (X^{3}) = \frac{6}{λ ^{3}}, μ_{4} = E (X^{4}) = \frac{24}{λ ^{4}},

ν_{1} = E (X - E (X)) = 0, ν_{2} = Var (X) = \frac{1}{λ ^{2}},

ν_{3} = μ_{3} - 3 μ_{2} μ_{1} + 2 μ_{1}^{3} = \frac{2}{λ ^{3}}, ν_{4} = μ_{4} - 4 μ_{3} μ_{1} + 6 μ_{2} μ_{1}^{2} - 3 μ_{1}^{4} = \frac{9}{λ ^{4}} .

此分布的变异系数、偏度系数和峰度系数分别为

C_{v} (X) = \frac{Var ( X )}{E ( X )} = \frac{1/ λ ^{2}}{1/ λ} = 1,

β_{s} = \frac{ν _{3}}{ν _{2}^{3/2}} = \frac{2/ λ ^{3}}{[ 1/ λ ^{2} ] ^{3/2}} = 2, β_{k} = \frac{ν _{4}}{ν _{2}^{2}} - 3 = \frac{9/ λ ^{4}}{1/ λ ^{4}} - 3 = 6.

由此可见：指数分布的变异系数、偏度系数与峰度系数均与参数 $λ$ 无关。它永远是正偏、尖峰。

习题 2.7-6

设随机变量 $X$ 服从正态分布 $N (10, 9)$ ，试求 $x_{0.1}$ 和 $x_{0.9}$ 。

解一般正态分布 $N (μ, σ^{2})$ 的 $p$ 分位数 $x_{p}$ 与标准正态分布的 $p$ 分位数 $u_{p}$ 间满足关系式

x_{p} = μ + σ u_{p},

所以

x_{0.1} = 10 + 3 u_{0.1} = 10 + 3 \times (- 1.282) = 6.154,

x_{0.9} = 10 + 3 u_{0.9} = 10 + 3 \times 1.282 = 13.846.

习题 2.7-7

设随机变量 $X$ 服从双参数韦布尔分布，其分布函数为
$F (x) = 1 - exp {- (\frac{x}{η})^{m}}, x > 0,$
其中 $η > 0, m > 0$ 。试写出该分布的 $p$ 分位数 $x_{p}$ 的表达式，且求出当 $m = 1.5, η = 1000$ 时的 $x_{0.1}, x_{0.5}, x_{0.8}$ 的值。

解因为 $p$ 分位数 $x_{p}$ 满足

1 - exp {- (\frac{x _{p}}{η})^{m}} = p,

解之得

x_{p} = η [- ln (1 - p)]^{1/ m} .

将 $m = 1.5, η = 1000$ 代入上式，可得

x_{0.1} = 1000 (- ln 0.9)^{1/1.5} = 223.08,

x_{0.5} = 1000 (- ln 0.5)^{1/1.5} = 783.22,

x_{0.8} = 1000 (- ln 0.2)^{1/1.5} = 1373.36.

习题 2.7-8

自由度为 $2$ 的 $χ^{2}$ 分布的密度函数为
$p (x) = \frac{1}{2} e^{- x /2}, x > 0.$
试求出其分布函数及分位数 $x_{0.1}, x_{0.5}, x_{0.8}$ 。

解此分布的分布函数 $F (x)$ 为

当 x \leq 0 时, F (x) = 0;

当 $x > 0$ 时，

F (x) = P (X \leq x) = \int_{0}^{x} \frac{1}{2} e^{- t /2} d t = 1 - e^{- x /2} .

所以此分布的 $p$ 分位数 $x_{p}$ 满足

p = F (x_{p}) = 1 - e^{- x_{p} /2},

从中解得

x_{p} = - 2 ln (1 - p) .

由此得

x_{0.1} = - 2 ln 0.9 = 0.211, x_{0.5} = - 2 ln 0.5 = 1.386, x_{0.8} = - 2 ln 0.2 = 3.219.

习题 2.7-9

设随机变量 $X$ 的密度函数 $p (x)$ 关于直线 $x = c$ 是对称的，且 $E (X)$ 存在，试证：

这个对称中心 $c$ 既是均值又是中位数，即 $E (X) = x_{0.5} = c$ ；

如果 $c = 0$ ，则 $x_{p} = - x_{1 - p}$ 。

解 \text{（1）} 由 $p (x)$ 关于直线 $x = c$ 对称可知

p (c + x) = p (c - x), - \infty < x < \infty,

因此

E (X - c) = \int_{- \infty}^{\infty} (x - c) p (x) d x = \int_{- \infty}^{\infty} tp (t + c) d t = \int_{- \infty}^{\infty} tp (c - t) d t = \int_{- \infty}^{\infty} (c - y) p (y) d y = E (c - X),

所以得 $E (X) = c$ 。又由

0.5 = \int_{- \infty}^{x_{0.5}} p (x) d x = \int_{- \infty}^{x_{0.5} - c} p (c + y) d y = \int_{- \infty}^{x_{0.5} - c} p (c - y) d y = \int_{2 c - x_{0.5}}^{\infty} p (t) d t = \int_{x_{0.5}}^{\infty} p (x) d x,

所以

2 c - x_{0.5} = x_{0.5},

由此得

x_{0.5} = c .

\text{（2）} 当 $c = 0$ 时，

p = \int_{- \infty}^{x_{p}} p (x) d x = \int_{- x_{p}}^{\infty} p (- y) d y = \int_{- x_{p}}^{\infty} p (y) d y = 1 - F (- x_{p}),

又由

F (- x_{p}) = 1 - p,

即

- x_{p} = x_{1 - p},

由此得结论。

习题 2.7-10

试证随机变量 $X$ 的偏度系数与峰度系数对位移和改变比例尺是不变的，即对任意的实数 $a, b$ （ $b \neq = 0$ ）， $Y = a + b X$ 与 $X$ 有相同的偏度系数与峰度系数。

解因为

E (Y) = E [a + b X] = a + b E (X),

所以

\frac{E [ Y - E ( Y ) ] ^{3}}{{ E [ Y - E ( Y ) ] ^{2} } ^{3/2}} = \frac{E [ a + b X - a - b E ( X ) ] ^{3}}{{ E [ a + b X - a - b E ( X ) ] ^{2} } ^{3/2}} = \frac{E [ X - E ( X ) ] ^{3}}{{ E [ X - E ( X ) ] ^{2} } ^{3/2}},

即 $Y$ 与 $X$ 有相同的偏度系数。又因为

\frac{E [ Y - E ( Y ) ] ^{4}}{{ E [ Y - E ( Y ) ] ^{2} } ^{2}} = \frac{E [ a + b X - a - b E ( X ) ] ^{4}}{{ E [ a + b X - a - b E ( X ) ] ^{2} } ^{2}} = \frac{E [ X - E ( X ) ] ^{4}}{{ E [ X - E ( X ) ] ^{2} } ^{2}},

所以 $Y$ 与 $X$ 有相同的峰度系数。

习题 2.7-11

设某项维修时间 $T$ （单位：分）服从对数正态分布 $L N (μ, σ^{2})$ 。

求 $p$ 分位数 $t_{p}$ ；

若 $μ = 4.1271$ ，求该分布的中位数；

若 $μ = 4.1271, σ = 1.0364$ ，求完成 $95%$ 维修任务的时间。

解因为 $T \sim L N (μ, σ^{2})$ ，所以 $X = ln T \sim N (μ, σ^{2})$ 。记 $x_{p}$ 为 $N (μ, σ^{2})$ 的 $p$ 分位数， $u_{p}$ 为 $N (0, 1)$ 的 $p$ 分位数，则由

p = P (X \leq x_{p}) = Φ (\frac{x _{p} - μ}{σ}) = Φ (u_{p})

知

x_{p} = μ + σ u_{p} .

\text{（1）} 因为

p = P (X \leq x_{p}) = P (ln T \leq x_{p}) = P (T \leq e^{x_{p}}),

所以

t_{p} = e^{x_{p}} = exp {μ + σ u_{p}} .

\text{（2）} 由本节习题 3（3）知

t_{0.5} = e^{4.1271} = 62.

\text{（3）} 因为 $u_{0.95} = 1.645$ ，所以当 $μ = 4.1271, σ = 1.0364$ 时，完成 $95%$ 的维修任务的时间 $t_{0.95}$ 为

t_{0.95} = exp {4.1271 + 1.0364 \times 1.645} = 341.

习题 2.7-12

某种绝缘材料的使用寿命 $T$ （单位：小时）服从对数正态分布 $L N (μ, σ^{2})$ 。若已知分位数 $t_{0.2} = 5000$ 小时， $t_{0.8} = 65000$ 小时，求 $μ$ 和 $σ$ 。

解由上一题知对数正态分布 $L N (μ, σ^{2})$ 的 $p$ 分位数为

t_{p} = exp {μ + σ u_{p}},

其中 $u_{p}$ 为标准正态分布 $N (0, 1)$ 的 $p$ 分位数，所以根据题意有

5000 = t_{0.2} = exp {μ + σ u_{0.2}},

65000 = t_{0.8} = exp {μ + σ u_{0.8}} .

将

u_{0.2} = - 0.845, u_{0.8} = 0.845

代入上面两式，可解得

μ = 9.7997, σ = 1.5178.

习题 2.7-13

某厂决定按过去生产状况对月生产额最高的 $5%$ 的工人发放高产奖。已知过去每人每月生产额 $X$ （单位：千克）服从正态分布 $N (4000, 6 0^{2})$ ，试问高产奖发放标准应把生产额定为多少？

解根据题意知，求满足

P (X > k) = 0.05

的 $k$ ，即 $k = x_{0.95}$ ，其中 $x_{0.95}$ 为分布 $N (4000, 6 0^{2})$ 的 $95%$ 分位数。又记 $u_{p}$ 为标准正态分布 $N (0, 1)$ 的 $p$ 分位数，则由

x_{p} = μ + σ u_{p},

及 $u_{0.95} = 1.645$ 可得

x_{0.95} = 4000 + 60 \times 1.645 = 4098.7.

因此可将高产奖发放标准定在生产额为 $4099$ 千克。

补充习题及解答

补充习题 14

设 $X \sim N (μ, σ^{2})$ ，求 $E (∣ X - μ ∣^{k})$ 。

解

E (∣ X - μ ∣^{k}) = \frac{1}{2 π σ} \int_{- \infty}^{\infty} ∣ x - μ ∣^{k} e^{- \frac{( x - μ ) ^{2}}{2 σ ^{2}}} d x .

若令

y = \frac{x - μ}{σ}, σ d y = d x,

可得

E (∣ X - μ ∣^{k}) = \frac{1}{2 π} \int_{- \infty}^{\infty} σ^{k} ∣ y ∣^{k} e^{- y^{2} /2} d y = \frac{2}{π} \int_{0}^{\infty} σ^{k} y^{k} e^{- y^{2} /2} d y .

再令

\frac{y ^{2}}{2} = t, y = (2 t)^{1/2}, d y = (2 t)^{- 1/2} d t,

可得

E (∣ X - μ ∣^{k}) = \frac{σ ^{k}}{π} 2^{k /2} \int_{0}^{\infty} t^{k /2 - 1/2} e^{- t} d t = \frac{σ ^{k}}{π} 2^{k /2} Γ (\frac{k + 1}{2}) .

当 $k$ 为偶数时，

E (∣ X - μ ∣^{k}) = (k - 1)!! σ^{k};

当 $k$ 为奇数时，

E (∣ X - μ ∣^{k}) = (k - 1)!! σ^{k} \frac{2}{π} .

其中 $n!!$ 表示不超过 $n$ 且与 $n$ 有相同奇偶性的所有正整数的乘积。

补充习题 15

设随机变量 $X$ 服从参数为 $λ$ 的泊松分布，试求 $X$ 的前四阶原点矩、中心矩、偏度与峰度。

解分几步进行。

（1）先求 $k$ 阶原点矩的递推公式。按定义

μ_{k} = x = 0 \sum \infty x^{k} \frac{λ ^{x}}{x !} e^{- λ}, λ > 0.

显然 $μ_{0} = 1$ ，而当 $k \geq 1$ 时有

μ_{k} = x = 1 \sum \infty [(x - 1) + 1]^{k - 1} \frac{λ ^{x}}{( x - 1 )!} e^{- λ} = λ x = 1 \sum \infty i = 0 \sum k - 1 (i k - 1) (x - 1)^{i} \frac{λ ^{x - 1}}{( x - 1 )!} e^{- λ} = λ i = 0 \sum k - 1 (i k - 1) μ_{i} .

（2）由此递推公式可导出前四阶原点矩。

μ_{1} = λ μ_{0} = λ .

μ_{2} = λ (μ_{0} + μ_{1}) = λ (1 + λ) .

μ_{3} = λ (μ_{0} + 2 μ_{1} + μ_{2}) = λ (1 + 3 λ + λ^{2}) .

μ_{4} = λ (μ_{0} + 3 μ_{1} + 3 μ_{2} + μ_{3}) = λ [1 + 3 λ + 3 λ (1 + λ) + λ (λ^{2} + 3 λ + 1)] = λ (1 + 7 λ + 6 λ^{2} + λ^{3}) .

（3）再计算前四阶中心矩：

ν_{1} = 0, ν_{2} = λ .

ν_{3} = μ_{3} - 3 μ_{2} μ_{1} + 2 μ_{1}^{3} = λ (1 + 3 λ + λ^{2}) - 3 λ^{2} (1 + λ) + 2 λ^{3} = λ .

ν_{4} = μ_{4} - 4 μ_{3} μ_{1} + 6 μ_{2} μ_{1}^{2} - 3 μ_{1}^{4} = λ (1 + 7 λ + 6 λ^{2} + λ^{3}) - 4 λ^{2} (1 + 3 λ + λ^{2}) + 6 λ^{3} (1 + λ) - 3 λ^{4} = λ (1 + 3 λ) .

（4）最后计算偏度 $β_{s}$ 与峰度 $β_{k}$ ：

β_{s} = \frac{ν _{3}}{ν _{2}^{3/2}} = \frac{λ}{λ ^{3/2}} = \frac{1}{λ} > 0.

所以泊松分布是正偏分布， $λ$ 愈小偏度愈大。

β_{k} = \frac{ν _{4}}{ν _{2}^{2}} - 3 = \frac{λ ( 1 + 3 λ )}{λ ^{2}} - 3 = \frac{1}{λ} > 0.

所以泊松分布比标准正态分布更尖峭一些， $λ$ 愈小分布愈尖峭。

补充习题 16

设随机变量 $X$ 服从二项分布 $b (n, p)$ ，试求 $X$ 的前四阶原点矩、中心矩、偏度与峰度。

解分几步进行。

（1）先求 $k$ 阶原点矩的递推公式。记

J_{k} (n) = x = 0 \sum n x^{k} (x n) p^{x} (1 - p)^{n - x} .

显然有

J_{0} (n) = J_{0} (n - i) = 1, i = 1, 2, \dots, n,

而当 $k \geq 1$ 时有

J_{k} (n) = n p x = 1 \sum n [(x - 1) + 1]^{k - 1} (x - 1 n - 1) p^{x - 1} (1 - p)^{n - x} = n p x = 1 \sum n i = 0 \sum k - 1 (i k - 1) (x - 1)^{i} (x - 1 n - 1) p^{x - 1} (1 - p)^{(n - 1) - (x - 1)} = n p i = 0 \sum k - 1 (i k - 1) J_{i} (n - 1) .

（2）由此递推公式可导出前四阶原点矩。

μ_{1} = J_{1} (n) = n p J_{0} (n - 1) = n p .

μ_{2} = J_{2} (n) = n p [J_{0} (n - 1) + J_{1} (n - 1)] = n p [1 + (n - 1) p] .

μ_{3} = J_{3} (n) = n p [J_{0} (n - 1) + 2 J_{1} (n - 1) + J_{2} (n - 1)] = n p {1 + 2 (n - 1) p + (n - 1) p [1 + (n - 2) p]} = n p [1 + 3 (n - 1) p + (n - 1) (n - 2) p^{2}] .

μ_{4} = J_{4} (n) = n p [J_{0} (n - 1) + 3 J_{1} (n - 1) + 3 J_{2} (n - 1) + J_{3} (n - 1)] = n p [1 + 7 (n - 1) p + 6 (n - 1) (n - 2) p^{2} + (n - 1) (n - 2) (n - 3) p^{3}] .

（3）再计算前四阶中心矩：

ν_{1} = 0.

ν_{2} = n p (1 - p) .

ν_{3} = μ_{3} - 3 μ_{2} μ_{1} + 2 μ_{1}^{3} = n p [1 + 3 (n - 1) p + (n - 1) (n - 2) p^{2}] - 3 n^{2} p^{2} [1 + (n - 1) p] + 2 n^{3} p^{3} = n p (1 - p) (1 - 2 p) .

ν_{4} = μ_{4} - 4 μ_{3} μ_{1} + 6 μ_{2} μ_{1}^{2} - 3 μ_{1}^{4} = n p (1 - p) [1 + 3 (n - 2) p (1 - p)] .

（4）最后计算偏度 $β_{s}$ 与峰度 $β_{k}$ ：

β_{s} = \frac{ν _{3}}{ν _{2}^{3/2}} = \frac{1 - 2 p}{n p ( 1 - p )} = ⎩ ⎨ ⎧ 0, = 0, < 0, p < \frac{1}{2}, p = \frac{1}{2}, p > \frac{1}{2} .

由此可见：二项分布在 $p = 1/2$ 时是对称分布；当 $p < 1/2$ 时，二项分布正偏；当 $p > 1/2$ 时，二项分布负偏。

β_{k} = \frac{ν _{4}}{ν _{2}^{2}} - 3 = \frac{n p ( 1 - p ) [ 1 + 3 ( n - 2 ) p ( 1 - p )]}{n ^{2} p ^{2} ( 1 - p ) ^{2}} - 3 = \frac{1}{n p ( 1 - p )} - \frac{6}{n} = \frac{1}{n} (\frac{1}{p ( 1 - p )} - 6) .

更细致地讨论会发现：（i）当 $p$ 在区间

[0.5 - \frac{3}{6}, 0.5 + \frac{3}{6}] \approx [0.21, 0.79]

内， $β_{k} \leq 0$ ，此时二项分布比标准正态分布更平坦，譬如在 $p = 0.5$ 时，

β_{k} = - \frac{2}{n} < 0,

此时二项分布是对称的，且比标准正态分布更平坦；

（ii）当 $p$ 在区间

[0.5 - \frac{3}{6}, 0.5 + \frac{3}{6}]

外， $β_{k} > 0$ ，此时二项分布比标准正态分布更尖峭。

群知识库

AI 找笔记

Explorer

2.7 分布的其他特征数

§2.7 分布的其他特征数

依赖于

被以下题目直接调用

正文部分

§2.7 分布的其他特征数

习题与解答 2.7

补充习题及解答

评论

Graph View

目录

反向链接