§2.7 分布的其他特征数
依赖于
被以下题目直接调用
正文部分
§2.7 分布的其他特征数
- k 阶矩
(1)称
μk=E(Xk)
为 X 的 k 阶原点矩。一阶原点矩就是数学期望;
(2)称
νk=E(X−E(X))k
为 X 的 k 阶中心矩。二阶中心矩就是方差;
(3)前 k 阶中心矩可用原点矩表示,如
ν1=0,
ν2=μ2−μ12,
ν3=μ3−3μ2μ1+2μ13,
ν4=μ4−4μ3μ1+6μ2μ12−3μ14.
- 变异系数 称比值
Cv(X)=E(X)Var(X)
为 X 的变异系数。变异系数是一个无量纲的量。
- 分位数 设连续随机变量 X 的分布函数为 F(x),密度函数为 p(x)。对任意 p∈(0,1),
(1)称满足条件
F(xp)=∫−∞xpp(x)dx=p
的 xp 为此分布的 p 分位数,又称下侧 p 分位数,它把密度函数下的面积一分为二,左侧面积恰好为 p;
(2)称满足条件
1−F(xp′)=∫xp′∞p(x)dx=p
的 xp′ 为此分布的上侧 p 分位数;
(3)分位数与上侧分位数的转换公式:
xp′=x1−p,xp=x1−p′.
(4)称 p=0.5 时的 p 分位数 x0.5 为此分布的中位数,即 x0.5 满足
F(x0.5)=∫−∞x0.5p(x)dx=0.5.
(5)若随机变量 X 的密度函数 p(x) 是偶函数,则此分布的 p 分位数 xp 满足
xp=−x1−p.
中位数为分布对称中心;
(6)记标准正态分布的 p 分位数为 up。因为标准正态密度函数是偶函数,所以
up=−u1−p.
譬如
u0.25=−u0.75=−0.675;
(7)一般正态分布 N(μ,σ2) 的 p 分位数 xp 满足
xp=μ+σup.
譬如 N(10,22) 的 0.25 分位数为
x0.25=10+2u0.25=8.65;
(8)分布的矩有可能不存在,但连续分布的分位数总存在。p 分位数 xp 总是 p 的增函数。
\setcounter{enumi}{3}
- 偏度系数
(1)称比值
βs=[Var(X)]3/2E(X−E(X))3
为 X 的分布的偏度系数,简称偏度;
(2)偏度系数刻画的是分布的不对称程度,∣βs∣ 愈大,分布的对称性愈差;
(3)任一对称分布的偏度 βs=0。当 βs>0 时,分布为正偏(又称右偏);当 βs<0 时,分布为负偏(又称左偏)。
- 峰度系数
(1)称
βk=[Var(X)]2E(X−E(X))4−3
为 X 的分布的峰度系数,简称峰度;
(2)峰度系数是刻画分布的尖峭性和尾部粗细的一个特征数;
(3)任一正态分布的峰度 βk=0。当 βk<0 时,分布比标准正态分布平坦;当 βk>0 时,分布比标准正态分布更尖峭。
- 偏度与峰度都是描述分布(密度)形状的参数。
习题与解答 2.7
设随机变量 X∼U(a,b),对 k=1,2,3,4,求 μk=E(Xk) 与 νk=E(X−E(X))k,进一步求此分布的偏度系数和峰度系数。
解
因为
E(Xk)=∫abb−axkdx=b−a1⋅k+1bk+1−ak+1,
所以
μ1=E(X)=2a+b,μ2=E(X2)=31(a2+ab+b2),
μ3=E(X3)=41(a3+a2b+ab2+b3),
μ4=E(X4)=51(a4+a3b+a2b2+ab3+b4).
又
ν1=E(X−E(X))=0,ν2=E(X−E(X))2=Var(X)=12(b−a)2,
ν3=μ3−3μ2μ1+2μ13=0,
ν4=μ4−4μ3μ1+6μ2μ12−3μ14=80(b−a)4.
偏度系数和峰度系数分别为
βs=ν23/2ν3=0,βk=ν22ν4−3=[(b−a)2/12]2(b−a)4/80−3=−1.2.
**注:**上述 βs,βk 与 a,b 无关。这表明:任一均匀分布的偏度为 0,峰度为 −1.2。
设随机变量 X∼U(0,a),求此分布的变异系数。
解
因为
E(X)=2a,Var(X)=12a2,
所以此分布的变异系数为
Cv(X)=E(X)Var(X)=a/2a2/12=33=0.5774.
求以下分布的中位数:
- 区间 (a,b) 上的均匀分布;
- 正态分布 N(μ,σ2);
- 对数正态分布 LN(μ,σ2)。
解
\text{(1)} 从
0.5=∫ax0.5b−a1dx
中解得
x0.5=2a+b.
\text{(2)} 记 X∼N(μ,σ2),由
P(X≤μ)=Φ(σμ−μ)=0.5
可得
x0.5=μ.
\text{(3)} 记 Y∼LN(μ,σ2),令 X=lnY,则 X∼N(μ,σ2)。又记 x0.5 为 X 的中位数,y0.5 为 Y 的中位数,则由(2)知 x0.5=μ,即
0.5=P(X≤μ)=P(lnY≤μ)=P(Y≤eμ),
由此得
y0.5=eμ.
设随机变量 X∼Ga(α,λ),对 k=1,2,3,求 μk=E(Xk) 与 νk=E(X−E(X))k。
解
因为
E(Xk)=Γ(α)λα∫0∞xk+α−1e−λxdx=Γ(α)λkΓ(k+α),
所以
μ1=E(X)=λα,μ2=E(X2)=λ2α(α+1),
μ3=E(X3)=λ3α(α+1)(α+2),
ν1=E(X−E(X))=0,ν2=Var(X)=λ2α,
ν3=μ3−3μ2μ1+2μ13=λ32α.
设随机变量 X∼Exp(λ),对 k=1,2,3,4,求 μk=E(Xk) 与 νk=E(X−E(X))k,进一步求此分布的变异系数、偏度系数和峰度系数。
解
因为
E(Xk)=λ∫0∞xke−λxdx=λkk!,
所以
μ1=E(X)=λ1,μ2=E(X2)=λ22,
μ3=E(X3)=λ36,μ4=E(X4)=λ424,
ν1=E(X−E(X))=0,ν2=Var(X)=λ21,
ν3=μ3−3μ2μ1+2μ13=λ32,ν4=μ4−4μ3μ1+6μ2μ12−3μ14=λ49.
此分布的变异系数、偏度系数和峰度系数分别为
Cv(X)=E(X)Var(X)=1/λ1/λ2=1,
βs=ν23/2ν3=[1/λ2]3/22/λ3=2,βk=ν22ν4−3=1/λ49/λ4−3=6.
由此可见:指数分布的变异系数、偏度系数与峰度系数均与参数 λ 无关。它永远是正偏、尖峰。
设随机变量 X 服从正态分布 N(10,9),试求 x0.1 和 x0.9。
解
一般正态分布 N(μ,σ2) 的 p 分位数 xp 与标准正态分布的 p 分位数 up 间满足关系式
xp=μ+σup,
所以
x0.1=10+3u0.1=10+3×(−1.282)=6.154,
x0.9=10+3u0.9=10+3×1.282=13.846.
设随机变量 X 服从双参数韦布尔分布,其分布函数为
F(x)=1−exp{−(ηx)m},x>0,
其中 η>0,m>0。试写出该分布的 p 分位数 xp 的表达式,且求出当 m=1.5,η=1000 时的 x0.1,x0.5,x0.8 的值。
解
因为 p 分位数 xp 满足
1−exp{−(ηxp)m}=p,
解之得
xp=η[−ln(1−p)]1/m.
将 m=1.5,η=1000 代入上式,可得
x0.1=1000(−ln0.9)1/1.5=223.08,
x0.5=1000(−ln0.5)1/1.5=783.22,
x0.8=1000(−ln0.2)1/1.5=1373.36.
自由度为 2 的 χ2 分布的密度函数为
p(x)=21e−x/2,x>0.
试求出其分布函数及分位数 x0.1,x0.5,x0.8。
解
此分布的分布函数 F(x) 为
当 x≤0 时,F(x)=0;
当 x>0 时,
F(x)=P(X≤x)=∫0x21e−t/2dt=1−e−x/2.
所以此分布的 p 分位数 xp 满足
p=F(xp)=1−e−xp/2,
从中解得
xp=−2ln(1−p).
由此得
x0.1=−2ln0.9=0.211,x0.5=−2ln0.5=1.386,x0.8=−2ln0.2=3.219.
设随机变量 X 的密度函数 p(x) 关于直线 x=c 是对称的,且 E(X) 存在,试证:
- 这个对称中心 c 既是均值又是中位数,即 E(X)=x0.5=c;
- 如果 c=0,则 xp=−x1−p。
解
\text{(1)} 由 p(x) 关于直线 x=c 对称可知
p(c+x)=p(c−x),−∞<x<∞,
因此
E(X−c)=∫−∞∞(x−c)p(x)dx=∫−∞∞tp(t+c)dt=∫−∞∞tp(c−t)dt=∫−∞∞(c−y)p(y)dy=E(c−X),
所以得 E(X)=c。又由
0.5=∫−∞x0.5p(x)dx=∫−∞x0.5−cp(c+y)dy=∫−∞x0.5−cp(c−y)dy=∫2c−x0.5∞p(t)dt=∫x0.5∞p(x)dx,
所以
2c−x0.5=x0.5,
由此得
x0.5=c.
\text{(2)} 当 c=0 时,
p=∫−∞xpp(x)dx=∫−xp∞p(−y)dy=∫−xp∞p(y)dy=1−F(−xp),
又由
F(−xp)=1−p,
即
−xp=x1−p,
由此得结论。
试证随机变量 X 的偏度系数与峰度系数对位移和改变比例尺是不变的,即对任意的实数 a,b(b=0),Y=a+bX 与 X 有相同的偏度系数与峰度系数。
解
因为
E(Y)=E[a+bX]=a+bE(X),
所以
{E[Y−E(Y)]2}3/2E[Y−E(Y)]3={E[a+bX−a−bE(X)]2}3/2E[a+bX−a−bE(X)]3={E[X−E(X)]2}3/2E[X−E(X)]3,
即 Y 与 X 有相同的偏度系数。又因为
{E[Y−E(Y)]2}2E[Y−E(Y)]4={E[a+bX−a−bE(X)]2}2E[a+bX−a−bE(X)]4={E[X−E(X)]2}2E[X−E(X)]4,
所以 Y 与 X 有相同的峰度系数。
设某项维修时间 T(单位:分)服从对数正态分布 LN(μ,σ2)。
- 求 p 分位数 tp;
- 若 μ=4.1271,求该分布的中位数;
- 若 μ=4.1271,σ=1.0364,求完成 95% 维修任务的时间。
解
因为 T∼LN(μ,σ2),所以 X=lnT∼N(μ,σ2)。记 xp 为 N(μ,σ2) 的 p 分位数,up 为 N(0,1) 的 p 分位数,则由
p=P(X≤xp)=Φ(σxp−μ)=Φ(up)
知
xp=μ+σup.
\text{(1)} 因为
p=P(X≤xp)=P(lnT≤xp)=P(T≤exp),
所以
tp=exp=exp{μ+σup}.
\text{(2)} 由本节习题 3(3)知
t0.5=e4.1271=62.
\text{(3)} 因为 u0.95=1.645,所以当 μ=4.1271,σ=1.0364 时,完成 95% 的维修任务的时间 t0.95 为
t0.95=exp{4.1271+1.0364×1.645}=341.
某种绝缘材料的使用寿命 T(单位:小时)服从对数正态分布 LN(μ,σ2)。若已知分位数 t0.2=5000 小时,t0.8=65000 小时,求 μ 和 σ。
解
由上一题知对数正态分布 LN(μ,σ2) 的 p 分位数为
tp=exp{μ+σup},
其中 up 为标准正态分布 N(0,1) 的 p 分位数,所以根据题意有
5000=t0.2=exp{μ+σu0.2},
65000=t0.8=exp{μ+σu0.8}.
将
u0.2=−0.845,u0.8=0.845
代入上面两式,可解得
μ=9.7997,σ=1.5178.
某厂决定按过去生产状况对月生产额最高的 5% 的工人发放高产奖。已知过去每人每月生产额 X(单位:千克)服从正态分布 N(4000,602),试问高产奖发放标准应把生产额定为多少?
解
根据题意知,求满足
P(X>k)=0.05
的 k,即 k=x0.95,其中 x0.95 为分布 N(4000,602) 的 95% 分位数。又记 up 为标准正态分布 N(0,1) 的 p 分位数,则由
xp=μ+σup,
及 u0.95=1.645 可得
x0.95=4000+60×1.645=4098.7.
因此可将高产奖发放标准定在生产额为 4099 千克。
补充习题及解答
解
E(∣X−μ∣k)=2πσ1∫−∞∞∣x−μ∣ke−2σ2(x−μ)2dx.
若令
y=σx−μ,σdy=dx,
可得
E(∣X−μ∣k)=2π1∫−∞∞σk∣y∣ke−y2/2dy=π2∫0∞σkyke−y2/2dy.
再令
2y2=t,y=(2t)1/2,dy=(2t)−1/2dt,
可得
E(∣X−μ∣k)=πσk2k/2∫0∞tk/2−1/2e−tdt=πσk2k/2Γ(2k+1).
当 k 为偶数时,
E(∣X−μ∣k)=(k−1)!!σk;
当 k 为奇数时,
E(∣X−μ∣k)=(k−1)!!σkπ2.
其中 n!! 表示不超过 n 且与 n 有相同奇偶性的所有正整数的乘积。
设随机变量 X 服从参数为 λ 的泊松分布,试求 X 的前四阶原点矩、中心矩、偏度与峰度。
解
分几步进行。
(1)先求 k 阶原点矩的递推公式。按定义
μk=x=0∑∞xkx!λxe−λ,λ>0.
显然 μ0=1,而当 k≥1 时有
μk=x=1∑∞[(x−1)+1]k−1(x−1)!λxe−λ=λx=1∑∞i=0∑k−1(ik−1)(x−1)i(x−1)!λx−1e−λ=λi=0∑k−1(ik−1)μi.
(2)由此递推公式可导出前四阶原点矩。
μ1=λμ0=λ.
μ2=λ(μ0+μ1)=λ(1+λ).
μ3=λ(μ0+2μ1+μ2)=λ(1+3λ+λ2).
μ4=λ(μ0+3μ1+3μ2+μ3)=λ[1+3λ+3λ(1+λ)+λ(λ2+3λ+1)]=λ(1+7λ+6λ2+λ3).
(3)再计算前四阶中心矩:
ν1=0,ν2=λ.
ν3=μ3−3μ2μ1+2μ13=λ(1+3λ+λ2)−3λ2(1+λ)+2λ3=λ.
ν4=μ4−4μ3μ1+6μ2μ12−3μ14=λ(1+7λ+6λ2+λ3)−4λ2(1+3λ+λ2)+6λ3(1+λ)−3λ4=λ(1+3λ).
(4)最后计算偏度 βs 与峰度 βk:
βs=ν23/2ν3=λ3/2λ=λ1>0.
所以泊松分布是正偏分布,λ 愈小偏度愈大。
βk=ν22ν4−3=λ2λ(1+3λ)−3=λ1>0.
所以泊松分布比标准正态分布更尖峭一些,λ 愈小分布愈尖峭。
设随机变量 X 服从二项分布 b(n,p),试求 X 的前四阶原点矩、中心矩、偏度与峰度。
解
分几步进行。
(1)先求 k 阶原点矩的递推公式。记
Jk(n)=x=0∑nxk(xn)px(1−p)n−x.
显然有
J0(n)=J0(n−i)=1,i=1,2,…,n,
而当 k≥1 时有
Jk(n)=npx=1∑n[(x−1)+1]k−1(x−1n−1)px−1(1−p)n−x=npx=1∑ni=0∑k−1(ik−1)(x−1)i(x−1n−1)px−1(1−p)(n−1)−(x−1)=npi=0∑k−1(ik−1)Ji(n−1).
(2)由此递推公式可导出前四阶原点矩。
μ1=J1(n)=npJ0(n−1)=np.
μ2=J2(n)=np[J0(n−1)+J1(n−1)]=np[1+(n−1)p].
μ3=J3(n)=np[J0(n−1)+2J1(n−1)+J2(n−1)]=np{1+2(n−1)p+(n−1)p[1+(n−2)p]}=np[1+3(n−1)p+(n−1)(n−2)p2].
μ4=J4(n)=np[J0(n−1)+3J1(n−1)+3J2(n−1)+J3(n−1)]=np[1+7(n−1)p+6(n−1)(n−2)p2+(n−1)(n−2)(n−3)p3].
(3)再计算前四阶中心矩:
ν1=0.
ν2=np(1−p).
ν3=μ3−3μ2μ1+2μ13=np[1+3(n−1)p+(n−1)(n−2)p2]−3n2p2[1+(n−1)p]+2n3p3=np(1−p)(1−2p).
ν4=μ4−4μ3μ1+6μ2μ12−3μ14=np(1−p)[1+3(n−2)p(1−p)].
(4)最后计算偏度 βs 与峰度 βk:
βs=ν23/2ν3=np(1−p)1−2p=⎩⎨⎧0,=0,<0,p<21,p=21,p>21.
由此可见:二项分布在 p=1/2 时是对称分布;当 p<1/2 时,二项分布正偏;当 p>1/2 时,二项分布负偏。
βk=ν22ν4−3=n2p2(1−p)2np(1−p)[1+3(n−2)p(1−p)]−3=np(1−p)1−n6=n1(p(1−p)1−6).
更细致地讨论会发现:
(i)当 p 在区间
[0.5−63,0.5+63]≈[0.21,0.79]
内,βk≤0,此时二项分布比标准正态分布更平坦,譬如在 p=0.5 时,
βk=−n2<0,
此时二项分布是对称的,且比标准正态分布更平坦;
(ii)当 p 在区间
[0.5−63,0.5+63]
外,βk>0,此时二项分布比标准正态分布更尖峭。
评论
支持 Markdown 和 LaTeX 数学公式。