02-第二章 随机变量及其分布
依赖于
被以下题目直接调用
正文部分
§2.1 随机变量及其分布
- 随机变量 定义在样本空间 Ω 上的实值函数 X=X(ω) 称为随机变量。
- 仅取有限个或可列个值的随机变量称为离散随机变量;
- 取值充满某个区间 (a,b) 的随机变量称为连续随机变量,这里 a 可为 −∞,b 可为 ∞。
- 分布函数 设 X 是一个随机变量,对任意实数 x,称
F(x)=P(X≤x)
为 X 的分布函数,记为 X∼F(x)。分布函数具有如下三条基本性质:
- 单调性 F(x) 是单调非减函数,即对任意的 x1<x2,有 F(x1)≤F(x2)。
- 有界性 对任意的 x,有 0≤F(x)≤1,且
F(−∞)=x→−∞limF(x)=0,F(∞)=x→∞limF(x)=1.
- 右连续性 F(x) 是 x 的右连续函数,即对任意的 x0,有
x→x0+0limF(x)=F(x0),即F(x0+0)=F(x0).
反之,可以证明:具有上述三条性质的函数 F(x) 一定是某一个随机变量的分布函数。
- 离散随机变量的概率分布列 若离散随机变量 X 的可能取值是 x1,x2,⋯,xn,⋯,则称 X 取 xi 的概率
pi=p(xi)=P(X=xi),i=1,2,⋯,n,⋯
为 X 的概率分布列,简称分布列。分布列也可用列表方式表示:
| X | x1 | x2 | ⋯ | xn | ⋯ |
|---|
| P | p(x1) | p(x2) | ⋯ | p(xn) | ⋯ |
分布列 p(xi) 具有如下两条基本性质:
- 非负性:p(xi)≥0,i=1,2,⋯;
- 正则性:
i=1∑∞p(xi)=1.
离散随机变量 X 的分布函数为
F(x)=xi≤x∑p(xi),
它是有限级或可列无限级阶梯函数。离散随机变量 X 取值于区间 (a,b] 上的概率为
P(a<X≤b)=F(b)−F(a).
常数 c 可看作仅取一个值的随机变量 X,即 P(X=c)=1,它的分布常称为单点分布或退化分布。
- 连续随机变量的概率密度函数 记连续随机变量 X 的分布函数为 F(x),若存在一个非负可积函数 p(x),使得对任意实数 x,有
F(x)=∫−∞xp(t)dt,
则称 p(x) 为 X 的概率密度函数,简称为密度函数或密度。密度函数 p(x) 具有如下两条基本性质:
- 非负性:p(x)≥0;
- 正则性:
∫−∞∞p(x)dx=1.
连续随机变量 X 的分布函数 F(x) 是 (−∞,∞) 上的连续函数,它可能在有限个点或可列个点上不可导,除此以外,有
F′(x)=p(x).
连续随机变量 X 仅取一点值的概率恒为零,从而有
P(a≤X≤b)=P(a<X≤b)=P(a≤X<b)=P(a<X<b)=∫abp(x)dx.
这给计算带来很大方便。
连续随机变量 X 的密度函数不唯一,但它们必几乎处处相等,即它们不相等处的点组成的集合的概率为零。
- 分布在离散场合可以是分布列或分布函数,这时称为离散分布;在连续场合可以是密度函数或分布函数,这时称为连续分布。常用的是这两类分布,但还存在既非离散又非连续的分布。
- 设随机变量 X 的分布函数为 F(x),则可用 F(x) 表示下列概率:
- P(X≤a)=F(a);
- P(X<a)=F(a−0);
- P(X>a)=1−P(X≤a)=1−F(a);
- P(X=a)=P(X≤a)−P(X<a)=F(a)−F(a−0);
- P(X≥a)=1−P(X<a)=1−F(a−0);
-
P(∣X∣<a)=P(−a<X<a)=P(X<a)−P(X≤−a)=F(a−0)−F(−a).
习题与解答 2.1
口袋中有 5 个球,编号为 1,2,3,4,5。从中任取 3 个,以 X 表示取出的 3 个球中的最大号码。
- 试求 X 的分布列;
- 写出 X 的分布函数,并作图。
解
**(1)**从 5 个球中任取 3 个,共有
(35)=10
种等可能取法。X 为取出的 3 个球中的最大号码,则 X 的可能取值为 3,4,5。因为
P(X=i)=P(X≤i)−P(X≤i−1),
且当 i≥3 时,有
P(X≤i)=10(3i),
所以
P(X=3)=P(X≤3)−P(X≤2)=10(33)−0=101,
P(X=4)=P(X≤4)−P(X≤3)=10(34)−101=103,
P(X=5)=P(X≤5)−P(X≤4)=1−10(34)=106.
所以 X 的分布列为
**(2)**由分布函数的定义知
F(x)=P(X≤x)=⎩⎨⎧0,0.1,0.4,1,x<3,3≤x<4,4≤x<5,x≥5.
F(x) 的图形如图 2.1。
图 2.1
一颗骰子抛两次,求以下随机变量的分布列:
- X 表示两次中所得的最小点数;
- Y 表示两次所得点数之差的绝对值。
解
**(1)**一颗骰子抛两次,共有 36 种等可能的结果。X 表示两次中所得的最小点数,则 X 的可能取值为 1,2,3,4,5,6。由确定概率的古典方法得
P(X=1)=3611,P(X=2)=369,P(X=3)=367,
P(X=4)=365,P(X=5)=363,P(X=6)=361.
将以上计算结果列表为
| X | 1 | 2 | 3 | 4 | 5 | 6 |
|---|
| P | 3611 | 369 | 367 | 365 | 363 | 361 |
**(2)**因为 Y 表示两次所得点数之差的绝对值,所以 Y 的可能取值为 0,1,2,3,4,5。而
P(Y=0)=366=61,P(Y=1)=3610=185,P(Y=2)=368=92,
P(Y=3)=366=61,P(Y=4)=364=91,P(Y=5)=362=181.
将以上计算结果列表为
| Y | 0 | 1 | 2 | 3 | 4 | 5 |
|---|
| P | 61 | 185 | 92 | 61 | 91 | 181 |
口袋中有 7 个白球、3 个黑球。
- 每次从中任取一个不放回,求首次取出白球时的取球次数 X 的概率分布列;
- 如果取出的是黑球则不放回,而另外放入一个白球,求此时 X 的概率分布列。
解
X 为首次取到白球时的取球次数,则 X 的可能取值为 1,2,3,4。记 Ai 为“第 i 次取出的球为黑球”,i=1,2,⋯,10。
**(1)**由乘法公式可得
P(X=1)=P(Aˉ1)=107,
P(X=2)=P(A1Aˉ2)=P(A1)P(Aˉ2∣A1)=103×97=307,
P(X=3)=P(A1A2Aˉ3)=103×92×87=1207,
P(X=4)=P(A1A2A3Aˉ4)=103×92×81×77=1201.
将以上计算结果列表为
**(2)**如果取出黑球不放回,而另外放入一个白球,那么由乘法公式得
P(X=1)=P(Aˉ1)=107,
P(X=2)=P(A1Aˉ2)=103×108=256,
P(X=3)=P(A1A2Aˉ3)=103×102×109=50027,
P(X=4)=P(A1A2A3Aˉ4)=103×102×101×1010=5003.
将以上计算结果列表为
| X | 1 | 2 | 3 | 4 |
|---|
| P | 107 | 256 | 50027 | 5003 |
有 3 个盒子,第一个盒子装有 1 个白球、4 个黑球;第二个盒子装有 2 个白球、3 个黑球;第三个盒子装有 3 个白球、2 个黑球。现任取一个盒子,从中任取 3 个球,以 X 表示所取到的白球数。
- 试求 X 的概率分布列;
- 取到的白球数不少于 2 个的概率是多少?
解
**(1)**记 Ai 为“取到第 i 个盒子”,i=1,2,3。由全概率公式得
P(X=0)=P(A1)P(X=0∣A1)+P(A2)P(X=0∣A2)+P(A3)P(X=0∣A3)=31⋅(35)(34)+31⋅(35)(33)+31⋅0=61,
P(X=1)=P(A1)P(X=1∣A1)+P(A2)P(X=1∣A2)+P(A3)P(X=1∣A3)=31⋅(35)(11)(24)+31⋅(35)(12)(23)+31⋅(35)(13)(22)=21,
P(X=2)=P(A1)P(X=2∣A1)+P(A2)P(X=2∣A2)+P(A3)P(X=2∣A3)=31⋅0+31⋅(35)(22)(13)+31⋅(35)(23)(12)=103,
P(X=3)=P(A1)P(X=3∣A1)+P(A2)P(X=3∣A2)+P(A3)P(X=3∣A3)=31⋅0+31⋅0+31⋅(35)(33)=301.
将以上计算结果列表为
(2)
P(X≥2)=P(X=2)+P(X=3)=31.
掷一颗骰子 4 次,求点数 6 出现的次数的概率分布.
解
记 X 为掷 4 次中点数 6 出现的次数,则 X 的可能取值为 0,1,2,3,4.由确定概率的古典方法得
P(X=0)P(X=1)P(X=2)P(X=3)P(X=4)=6454=0.4823,=(14)6453=0.3858,=(24)6452=0.1157,=(34)645=0.0154,=641=0.0008.
将以上结果列表为
| X | 0 | 1 | 2 | 3 | 4 |
|---|
| P | 0.4823 | 0.3858 | 0.1157 | 0.0154 | 0.0008 |
由以上的计算结果也可以看出:出现 0 次 6 点的可能性最大.
从一副 52 张的扑克牌中任取 5 张,求其中黑桃张数的概率分布.
解
记 X 为取出的 5 张牌中黑桃的张数,则 X 的可能取值为 0,1,2,3,4,5. 将 52 张牌分成两类:一类为 13 张黑桃,另一类为 39 张除黑桃外的其他花色,则由抽样模型得
P(X=k)=(552)(k13)(5−k39),k=0,1,2,3,4,5.
一批产品共有 100 件,其中 10 件是不合格品.根据验收规则,从中任取 5 件产品进行质量检验,假如 5 件中无不合格品,则这批产品被接收,否则就要重新对这批产品逐个检验.
- 试求 5 件中不合格品数 X 的分布列;
- 需要对这批产品进行逐个检验的概率是多少?
解
(1) X 的分布列为
P(X=i)=(5100)(i10)(5−i90),i=0,1,2,3,4,5.
计算结果列表略.
(2)“需要对这批产品进行逐个检验”则意味着“检验 5 个产品,至少有一个不合格品”,因此所求概率为
P(X≥1)=1−P(X=0)=1−(5100)(590)=0.4162.
设随机变量 X 的分布函数为
F(x)=⎩⎨⎧0,41,31,21,1,x<0,0≤x<1,1≤x<3,3≤x<6,x≥6.
试求 X 的概率分布列及 P(X<3),P(X≤3),P(X>1),P(X≥1).
解
X 的概率分布列为
P(X<3)P(X≤3)P(X>1)P(X≥1)=P(X=0)+P(X=1)=31,=1−P(X=6)=21,=P(X=3)+P(X=6)=32,=1−P(X=0)=43.
设随机变量 X 的分布函数为
F(x)=⎩⎨⎧0,lnx,1,x<1,1≤x<e,x≥e.
试求 P(X<2),P(0<X≤3),P(2<X<2.5).
解
这里 X 是连续随机变量,所求概率分别为
P(X<2)P(0<X≤3)P(2<X<2.5)=F(2)=ln2=0.6931,=F(3)−F(0)=1,=F(2.5)−F(2)=ln2.5−ln2=0.2231.
若 P(X≥x1)=1−α,P(X≤x2)=1−β, 其中 x1<x2, 试求 P(x1≤X≤x2).
解
P(x1≤X≤x2)=1−P(X<x1)−P(X>x2)=1−α−β.
从 1,2,3,4,5 五个数中任取三个,按大小排列记为 x1<x2<x3, 令 X=x2, 试求
- X 的分布函数;
- P(X<2) 及 P(X>4).
解
(1) 因为 X 的分布列为
所以 X 的分布函数为
F(x)=⎩⎨⎧0,103,107,1,x<2,2≤x<3,3≤x<4,x≥4.
(2)
P(X<2)=F(2−0)=0,P(X>4)=1−F(4)=1−1=0.
设随机变量 X 的密度函数为
p(x)={1−∣x∣,0,−1≤x≤1,其他.
试求 X 的分布函数.
解
由于密度函数 p(x) 在 (−∞,∞) 上分为四段(如图 2.2),所以其分布函数也要分四段设立,具体如下:
当 x<−1 时,F(x)当 −1≤x<0 时,F(x)当 0≤x<1 时,F(x)当 x≥1 时,F(x)=∫−∞x0dt=0;=∫−1x(1+t)dt=2x2+x+21;=∫−10(1+t)dt+∫0x(1−t)dt=−2x2+x+21;=∫−10(1+t)dt+∫01(1−t)dt=1.
综上所述,X 的分布函数为
F(x)=⎩⎨⎧0,2x2+x+21,−2x2+x+21,1,x<−1,−1≤x<0,0≤x<1,x≥1.
\FigureTwoTwo
如果随机变量 X 的密度函数为
p(x)=⎩⎨⎧x,2−x,0,0≤x<1,1≤x<2,其他.
试求 P(X≤1.5).
解
因为密度函数 p(x) 的图形如图 2.3,因此所求概率为
P(X≤1.5)=∫01xdx+∫11.5(2−x)dx=0.875.
\FigureTwoThree
设随机变量 X 的密度函数为
p(x)=⎩⎨⎧Acosx,0,∣x∣≤2π,∣x∣>2π.
试求
- 系数 A;
- X 落在区间 (0,π/4) 内的概率.
解
(1) 因为
1=∫−∞∞p(x)dx=A∫−π/2π/2cosxdx=Asinx−π/2π/2=2A,
由此解得
A=21.
(2) 所求概率为
p=∫0π/421cosxdx=21sinx0π/4=42.
设连续随机变量 X 的分布函数为
F(x)=⎩⎨⎧0,Ax2,1,x<0,0≤x<1,x≥1.
试求
- 系数 A;
- X 落在区间 (0.3,0.7) 内的概率;
- X 的密度函数.
解
(1) 由 F(x) 的连续性,有
1=F(1)=x→1−0limF(x)=x→1−0limAx2=A,
由此解得 A=1.
(2)
P(0.3<X<0.7)=F(0.7)−F(0.3)=0.72−0.32=0.4.
(3) X 的密度函数(如图 2.4)为
p(x)=F′(x)={2x,0,0<x<1,其他.
\FigureTwoFour
学生完成一道作业题的时间 X 是一个随机变量,单位为小时.它的密度函数为
p(x)={cx2+x,0,0≤x≤0.5,其他.
- 确定常数 c;
- 写出 X 的分布函数;
- 试求在 20 min 内完成一道作业题的概率;
- 试求在 10 min 以上完成一道作业题的概率.
解
(1) 因为
1=∫00.5(cx2+x)dx=(3cx3+21x2)00.5=24c+81,
由此解得
c=21.
(2) 当 x<0 时,
F(x)=∫−∞x0dt=0;
当 0≤x<0.5 时,
F(x)=∫0x(21t2+t)dt=7x3+21x2;
当 x≥0.5 时,
F(x)=∫00.5(21t2+t)dt=1.
所以 X 的分布函数为
F(x)=⎩⎨⎧0,7x3+21x2,1,x<0,0≤x<0.5,x≥0.5.
(3) 所求概率为
P(X≤31)=F(31)=277+181=5417.
(4) 所求概率为
P(X>61)=1−F(61)=1−(2167+721)=108103.
某加油站每周补给一次油,如果这个加油站每周的销售量(单位:千升)为一随机变量,其密度函数为
p(x)=⎩⎨⎧0.05(1−100x)4,0,0<x<100,其他.
试问该油站的储油罐需要多大,才能把一周内断油的概率控制在 5% 以下?
解
记 X 为该油站每周的销售量,k 为该油站储油罐的最大储油量.则由题意知 k 应该满足
P(X>k)≤0.05.
这等价于 P(X≤k)≥0.95,因此由
P(X≤k)=∫0k0.05(1−100x)4dx=1−(1−100k)5≥0.95
中解得
k≥45.072 千升.
所以可取 k=46 千升即可将一周内断油的概率控制在 5% 以下.
设随机变量 X 和 Y 同分布,X 的密度函数为
p(x)=⎩⎨⎧83x2,0,0<x<2,其他.
已知事件 A={X>a} 和 B={Y>a} 独立,且 P(A∪B)=3/4, 求常数 a.
解
由同分布可得 P(A)=P(B),从而
43=P(A∪B)=P(A)+P(B)−P(AB)=2P(A)−[P(A)]2,
由此解得 P(A)=0.5,进而由
0.5=P(A)=P(X>a)=∫a283x2dx=81x3a2=1−81a3,
解得
a=34=1.5874.
注:随机变量 X 与 Y 同分布,并不意味着 X=Y, 反之成立,即 X=Y, 则 X 与 Y 同分布.
设连续随机变量 X 的密度函数 p(x) 是一个偶函数,F(x) 为 X 的分布函数,求证对任意实数 a>0,有
- F(−a)=1−F(a)=0.5−∫0ap(x)dx;
- P(∣X∣<a)=2F(a)−1;
- P(∣X∣>a)=2[1−F(a)].
解
因为 p(x) 是一个偶函数,所以 p(−x)=p(x),且从
1=∫−∞∞p(x)dx=2∫0∞p(x)dx,
可得
∫0∞p(x)dx=0.5.
(1) 在
F(−a)=∫−∞−ap(x)dx
中令 x=−t,则
F(−a)=∫∞ap(t)(−dt)=∫a∞p(t)dt=1−F(a),
所以
F(−a)=∫a∞p(t)dt=∫0∞p(t)dt−∫0ap(x)dx=0.5−∫0ap(x)dx.
(2)
P(∣X∣<a)=P(−a<X<a)=F(a)−F(−a)=F(a)−[1−F(a)]=2F(a)−1.
(3)
P(∣X∣>a)=P(X<−a)+P(X>a)=F(−a)+1−F(a)=1−F(a)+1−F(a)=2[1−F(a)].
补充习题及解答
设连续随机变量 X 的密度函数 p(x) 关于直线 x=c 是对称的,证明:其分布函数 F(x) 满足
F(c−x)=1−F(c+x),−∞<x<∞.
解
由 p(x) 关于直线 x=c 是对称的,知
p(c−x)=p(c+x),−∞<x<∞.
由
F(c−x)=P(X≤c−x)=∫−∞c−xp(t)dt,
对上式右端积分作变量变换 y=c−t,则
F(c−x)=∫∞xp(c−y)(−dy)=∫x∞p(c−y)dy=∫x∞p(c+y)dy,
再对上式右端积分作变量变换 z=c+y,则
F(c−x)=∫c+x∞p(z)dz=1−∫−∞c+xp(z)dz=1−F(c+x).
结论得证.
对称分布函数的这个性质可用图 2.5 表示:
\FigureTwoFive
设 F1(x) 与 F2(x) 都是分布函数,又 a 和 b 是两个正常数,且 a+b=1.证明:
F(x)=aF1(x)+bF2(x)
也是一个分布函数.
解
为此要验证 F(x) 具有分布函数的三个基本性质.
(1) 单调性.因为 F1(x) 与 F2(x) 都是分布函数,故当 x1<x2 时,有
F1(x1)≤F1(x2),F2(x1)≤F2(x2),
于是
F(x1)=aF1(x1)+bF2(x1)≤aF1(x2)+bF2(x2)=F(x2).
(2) 有界性.对任意的 x,有 0≤F(x)≤1,且
F(−∞)=aF1(−∞)+bF2(−∞)=0,
F(∞)=aF1(∞)+bF2(∞)=a+b=1.
(3) 右连续性.
F(x+0)=aF1(x+0)+bF2(x+0)=aF1(x)+bF2(x)=F(x).
讨论:若取 a=b=1/2,又令
F1(x)={0,1,x<0,x≥0,F2(x)=⎩⎨⎧0,x,1,x<0,0≤x<1,x≥1,
由此可得 F1(x) 与 F2(x) 的凸组合的分布函数为(如图 2.6)
F(x)=aF1(x)+bF2(x)=⎩⎨⎧0,21+x,1,x<0,0≤x<1,x≥1.
显然,F(x) 不是连续函数,故 F(x) 对应的随机变量不是连续随机变量.又因为 F(x) 不是阶梯函数,故 F(x) 对应的随机变量不是离散随机变量.用上述凸组合方法可以构造很多既非离散又非连续的随机变量及其分布函数.
\FigureTwoSix
§2.2 随机变量的数学期望
1. 数学期望 设随机变量 X 的分布用分布列 p(xi) 或用密度函数 p(x) 表示,若
{∑i∣xi∣p(xi)<∞,∫−∞∞∣x∣p(x)dx<∞,当 X 为离散随机变量,当 X 为连续随机变量,
则称
E(X)={∑ixip(xi),∫−∞∞xp(x)dx,当 X 为离散随机变量,当 X 为连续随机变量,
为 X 的数学期望,简称期望或均值,且称 X 的数学期望存在.否则称数学期望不存在.数学期望是由分布决定的,它是分布的位置特征.若两个随机变量同分布,则其数学期望(存在的话)是相等的.
假如把概率看作质量,分布看作某物体的质量分布,那么数学期望就是该物体的重心位置.
2. 数学期望的性质 以下所涉及的数学期望均假定其存在.
- 随机变量 X 的某一函数 g(X) 的数学期望为
E[g(X)]={∑ig(xi)p(xi),∫−∞∞g(x)p(x)dx,在离散场合,在连续场合;
- 若 c 是常数,则 E(c)=c;
- 对任意常数 a,有 E(aX)=aE(X);
- 对任意的两个函数 g1(x) 和 g2(x),有
E[g1(X)±g2(X)]=E[g1(X)]±E[g2(X)].
习题与解答 2.2
设离散型随机变量 X 的分布列为
试求 E(X) 和 E(3X+5).
解
E(X)=(−2)×0.4+0×0.3+2×0.3=−0.2,
E(3X+5)=[3×(−2)+5]×0.4+(3×0+5)×0.3+(3×2+5)×0.3=4.4.
某商店根据历年销售资料得知:一位顾客在商店中消费的金额 X(百元)的分布列为
| X | 0 | 1 | 2 | 3 | 4 | 5 |
|---|
| P | 0.10 | 0.33 | 0.31 | 0.13 | 0.09 | 0.04 |
试求顾客在商店的平均消费金额.
解
E(X)=1×0.33+2×0.31+3×0.13+4×0.09+5×0.04=1.9.
某地区一个月内发生重大交通事故数 X 服从如下分布:
| X | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
|---|
| P | 0.301 | 0.362 | 0.216 | 0.087 | 0.026 | 0.006 | 0.002 |
试求该地区发生重大交通事故的月平均数.
解
E(X)=1×0.362+2×0.216+3×0.087+4×0.026+5×0.006+6×0.002=1.201.
一海运货船的甲板上放着 20 个装有化学原料的圆桶,现已知其中有 5 桶被海水污染了.若从中随机抽取 8 桶,记 X 为 8 桶中被污染的桶数,试求 X 的分布列,并求 E(X).
解
因为 X 的可能取值为 0,1,2,…,5,且
P(X=k)=(820)(k5)(8−k15),k=0,1,2,…,5.
将计算结果列表为
| X | 0 | 1 | 2 | 3 | 4 | 5 |
|---|
| P | 0.0511 | 0.2554 | 0.3973 | 0.2384 | 0.0542 | 0.0036 |
由此得
E(X)=1×0.2554+2×0.3973+3×0.2384+4×0.0542+5×0.0036=2.
用天平来称某物品的质量(砝码仅允许放在一个盘中),现有三组砝码(单位:g):(甲)1,2,2,5,10;(乙)1,2,3,4,10;(丙)1,1,2,5,10,称重时只能使用一组砝码.问:当物品的质量为 1 g,2 g,…,10 g 的概率是相同的,用哪一组砝码称重所用的平均砝码数最少?
解
分别用 X,Y,Z 表示用甲、乙、丙三组砝码称重时所用的砝码数.
(1) 用甲组砝码称重时,1 个砝码可称 4 种物品(1 g,2 g,5 g,10 g);2 个砝码可称 4 种物品(3 g,4 g,6 g,7 g);3 个砝码可称 2 种物品(8 g,9 g).所以 X 的分布列为
因此平均所用砝码数为
E(X)=1×104+2×104+3×102=1.8.
(2) 用乙组砝码称重时,1 个砝码可称 5 种物品(1 g,2 g,3 g,4 g,10 g);2 个砝码可称 3 种物品(5 g,6 g,7 g);3 个砝码可称 2 种物品(8 g,9 g).所以 Y 的分布列为
因此平均所用砝码数为
E(Y)=1×105+2×103+3×102=1.7.
(3) 用丙组砝码称重时,1 个砝码可称 4 种物品(1 g,2 g,5 g,10 g);2 个砝码可称 3 种物品(3 g,6 g,7 g);3 个砝码可称 2 种物品(4 g,8 g);4 个砝码可称 1 种物品(9 g).所以 Z 的分布列为
因此平均所用砝码数为
E(Z)=1×104+2×103+3×102+4×101=2.0.
所以用乙组砝码称重时,所用的平均砝码数最少.
假设有十只同种电器元件,其中有两只不合格品.装配仪器时,从这批元件中任取一只,如是不合格品,则扔掉重新任取一只;如仍是不合格品,则扔掉再取一只,试求在取到合格品之前,已取出的不合格品数的数学期望.
解
记 Ai 为“第 i 次取出的是合格品”,i=1,2,3.随机变量 X 为“取到合格品之前,已取出的不合格品数”.则
P(X=0)P(X=1)P(X=2)=P(A1)=108,=P(A1A2)=102×98=458,=P(A1A2A3)=102×91×88=451.
上述三个概率组成一个分布列,其数学期望为
E(X)=1×458+2×451=92.
对一批产品进行检查,如查到第 a 件全为合格品,就认为这批产品合格;若在前 a 件中发现不合格品即停止检查,且认为这批产品不合格.设产品的数量很大,可以认为每次查到不合格品的概率都是 p.问每批产品平均要查多少件?
解
设每批要查 X 件,记 q=1−p,则 X 的分布列为
所以
E(X)=k=1∑akqk−1p+aqa=p(k=1∑aqk)′+aqa=p(1−qq−qa+1)′+aqa=p(1−q)2[1−(a+1)qa](1−q)+(q−qa+1)+aqa=p1−qa.
某人参加“答题秀”,一共有问题 1 和问题 2 两个问题.他可以自行决定回答这两个问题的顺序.如果他先回答问题 i(i=1,2),那么只有回答正确,他才被允许回答另一题.如果他有 60% 的把握答对问题 1,而答对问题 1 将获得 200 元奖励;有 80% 的把握答对问题 2,而答对问题 2 将获得 100 元奖励.问他应该先回答哪个问题,才能使获得奖励的期望值最大?
解
记 X 为回答顺序为 1,2 时所获得的奖励,则 X 的分布列为
| X | 0 | 200 | 300 |
|---|
| P | 0.4 | 0.6×0.2 | 0.6×0.8 |
由此得
E(X)=168 元.
又记 Y 为回答顺序为 2,1 时所获得的奖励,则 Y 的分布列为
| Y | 0 | 100 | 300 |
|---|
| P | 0.2 | 0.8×0.4 | 0.8×0.6 |
由此得
E(Y)=176 元.
因此应该先回答问题 2,可以使获得的奖励的期望值最大.
某人想用 10000 元投资于某股票,该股票当前的价格是 2 元/股.假设一年后该股票可能地为 1 元/股和 4 元/股.而理财顾问给他的建议是:若期望一年后所拥有的股票市值达到最大,则现在就购买;若期望一年后所拥有的股票数量达到最大,则一年以后购买.试问理财顾问的建议是否正确?为什么?
解
若现在就购买 2 元/股,则 10000 元可购买 5000 股.记 X 为一年后所拥有的股票市值,X 的分布列为
所以
E(X)=12500 元,
比一年后购买(市值为 10000 元)大.
若一年后购买,记 Y 为一年后所购股票数,则 10000 元等可能地购买 10000/1=10000 股或 10000/4=2500 股,所以 Y 的分布列为
由此得
E(Y)=5000+1250=6250(股),
比现在就购买(5000 股)多.
因此,理财顾问的建议是正确的.
保险公司的某险种规定:若某个事件 A 在一年内发生了,则保险公司应付给投保户金额 a 元,而事件 A 在一年内发生的概率为 p.若保险公司向投保户收取的保费为每年 ka 元,则 k 为多少,才能使保险公司当年期望收益达到 a 的 10%?
解
记 X 为保险公司的收益,则 X 的分布列为
所以保险公司的期望收益为
E(X)=(k−1)ap+ka(1−p)=ka−ap.
由 E(X)≥0.1a,即从
ka−ap≥0.1a
中解得
k≥0.1+p.
所以取
k=0.1+p
即可满足要求.
某厂推土机发生故障后的维修时间 T 是一个随机变量(单位:h),其密度函数为
p(t)={0.02e−0.02t,0,t>0,t≤0.
试求平均维修时间.
解
E(T)=∫0∞0.02te−0.02tdt=−te−0.02t0∞+∫0∞e−0.02tdt=−0.021e−0.02t0∞=50.
故其平均维修时间为 50 h.
某新产品在未来市场上的占有率 X 是在区间 (0,1) 上取值的随机变量,它的密度函数为
p(x)={4(1−x)3,0,0<x<1,其他,
试求平均市场占有率.
解
这里平均市场占有率就是 E(X).
E(X)=∫014x(1−x)3dx=∫01(4x−12x2+12x3−4x4)dx=2−4+3−54=51.
设随机变量 X 的密度函数如下,试求 E(2X+5).
p(x)={e−x,0,x>0,x≤0.
解
因为
E(X)=∫0∞xe−xdx=1,
所以
E(2X+5)=7.
设随机变量 X 的分布函数如下,试求 E(X).
F(x)=⎩⎨⎧2ex,21,1−21e−21(x−1),x<0,0≤x<1,x≥1.
解
X 的密度函数(如图 2.7)为
p(x)=⎩⎨⎧21ex,0,41e−21(x−1),x<0,0≤x<1,x≥1.
所以
E(X)=∫−∞021xexdx+∫1∞41xe−21(x−1)dx=−21+23=1.
\FigureTwoSeven
设随机变量 X 的密度函数为
p(x)={a+bx2,0,0≤x≤1,其他,
如果 E(X)=2/3, 求 a 和 b.
解
由
∫01(a+bx2)dx=1
得
a+31b=1.(1)
又由
32=E(X)=∫01x(a+bx2)dx
得
21a+41b=32.(2)
联立(1)(2)两式,解得
a=31,b=2.
某工程队完成某项工程的时间 X(单位:月)是一个随机变量,它的分布列为
- 试求该工程队完成此项工程的平均月数;
- 设该工程队所获利润(单位:万元)为 Y=50(13−X),试求工程队的平均利润;
- 若该工程队调整安排,完成该项工程的时间 X1(单位:月)的分布列为
则其平均利润可增加多少?
解
(1)
E(X)=10×0.4+11×0.3+12×0.2+13×0.1=11,
该工程队完成此项工程平均需 11 个月.
(2)
E(Y)=E[50(13−X)]=650−50E(X)=650−550=100,
该工程队所获平均利润为 100 万元.
(3) 调整安排后,
E(X1)=10×0.5+11×0.4+12×0.1=10.6,
所以平均利润为
E(Y1)=E[50(13−X1)]=650−50×10.6=120,
由此得平均利润可增加
120−100=20(万元).
设随机变量 X 的概率密度函数为
p(x)=⎩⎨⎧21cos2x,0,0≤x≤π,其他,
对 X 独立重复观察 4 次,Y 表示观察值大于 3π 的次数,求 Y2 的数学期望.
解
因为事件“观察值大于 π/3”可用 {X>π/3} 表示,从而
p=P(X>3π)=∫π/3π21cos2xdx=sin2xπ/3π=1−sin6π=1−0.5=0.5.
而 Y 的分布列为
P(Y=k)=(k4)0.5k0.54−k,k=0,1,2,3,4.
所以
E(Y2)=k=0∑4k2(k4)0.54=80×0.54=5.
设随机变量 X 的密度函数为
p(x)=⎩⎨⎧83x2,0,0<x<2,其他,
试求 X21 的数学期望.
解
E(X21)=∫02x21⋅83x2dx=43.
设 X 为仅取非负整数的离散随机变量,若其数学期望存在,证明:
- E(X)=k=1∑∞P(X≥k);
- k=0∑∞kP(X>k)=21[E(X2)−E(X)].
解
(1) 由于
E(X)=k=1∑∞kP(X=k)
存在,所以该级数绝对收敛,从而有
E(X)=k=1∑∞kP(X=k)=k=1∑∞[i=1∑kP(X=k)]=i=1∑∞[k=i∑∞P(X=k)]=i=1∑∞P(X≥i).
(2)
k=0∑∞kP(X>k)=k=0∑∞ki=k+1∑∞P(X=i)=i=1∑∞k=0∑i−1kP(X=i)=i=1∑∞P(X=i)2(i−1)i=21i=1∑∞i2P(X=i)−21i=1∑∞iP(X=i)=21E(X2)−21E(X).
设连续随机变量 X 的分布函数为 F(x),且数学期望存在,证明:
E(X)=∫0∞[1−F(x)]dx−∫−∞0F(x)dx.
解
E(X)=∫−∞∞xp(x)dx=∫−∞0xp(x)dx+∫0∞xp(x)dx.
将第一个积分改写为二次积分,然后改变积分次序,得
∫−∞0xp(x)dx=−∫−∞0(∫x0dy)p(x)dx=−∫−∞0∫−∞yp(x)dxdy=−∫−∞0F(y)dy.
第二个积分亦可改写为二次积分,然后改变积分次序,可得
∫0∞xp(x)dx=∫0∞(∫0xdy)p(x)dx=∫0∞(∫y∞p(x)dx)dy=∫0∞[1−F(y)]dy.
这两个积分之和恰是所要求证的等式.
设 X 为非负连续随机变量,若 E(Xn) 存在,试证明:
- E(X)=∫0∞P(X>x)dx;
- E(Xn)=∫0∞nxn−1P(X>x)dx.
解
(1) 因为 X 为非负连续随机变量,所以当 x<0 时,有 F(x)=0.利用第 20 题提供的公式得
E(X)=∫0∞[1−F(x)]dx=∫0∞P(X>x)dx.
(2) 因为 X 为非负连续随机变量,所以 Xn 也是非负连续随机变量,因此利用(1)可得
E(Xn)=∫0∞P(Xn>y)dy.
令 y=xn,则
E(Xn)=∫0∞P(Xn>xn)nxn−1dx=∫0∞P(X>x)nxn−1dx.
补充习题及解答
甲、乙两人进行象棋比赛,每局甲胜的概率为 p,乙胜的概率为 q=1−p.比赛进行到有一人连胜两局为止,求平均比赛局数.
解
设 X 为决定胜负所需的局数,X 可取 2,3,… 等正整数.事件 {X≥k} 表示“到第 k−1 局时没有一人连胜两局,总是两人轮流胜”,所以
P(X≥1)=1,
P(X≥2k)=pkqk−1+pk−1qk=(pq)k−1,k=1,2,…,
P(X≥2k+1)=2pkqk,k=1,2,….
利用第 19 题提供的公式,可得
E(X)=k=1∑∞P(X≥k)=1+k=1∑∞(pq)k−1+2k=1∑∞(pq)k=1+1−pq1+1−pq2pq=1−pq2+pq.
又因为对任意的 p(0<p<1),总有 p(1−p)≤41,故由 E(X) 是 pq 的严格单调增函数可得
E(X)≤1−1/42+1/4=3.
这表明:这种象棋比赛决定最终胜负的平均局数不超过 3 局,它在两选手势均力敌(p=21)时达到上界.
设随机变量 X 的分布函数为
F(x)=⎩⎨⎧0,21+π1arcsinx,1,x<−1,−1≤x<1,x≥1.
试求 E(X).
解
利用第 20 题提供的公式,可得
E(X)=∫0∞[1−F(x)]dx−∫−∞0F(x)dx
=∫01(1−21−π1arcsinx)dx−∫−10(21+π1arcsinx)dx=[2x−πxarcsinx−π1−x2]01−[2x+πxarcsinx+π1−x2]−10=(21−π1⋅2π+π1)−(π1+21−π1⋅2π)=0.
§2.3 随机变量的方差与标准差
1. 方差 随机变量 X 对其期望 E(X) 的偏差平方的数学期望(设其存在)
Var(X)=E[X−E(X)]2
称为 X 的方差,方差的正平方根
σ(X)=σx=Var(X)
称为 X 的标准差.方差是由分布决定的,它是分布的散布特征;方差愈大,分布愈分散;方差愈小,分布愈集中.标准差与方差的功能相似,只是量纲不同.
2. 方差的性质 以下所涉及的方差均假定其存在.
- Var(X)=E(X2)−[E(X)]2;
- 若 c 是常数,则 Var(c)=0;
- 若 a,b 是常数,则 Var(aX+b)=a2Var(X);
- 若随机变量 X 的方差存在,则 Var(X)=0 的充要条件是 X 几乎处处为某个常数 a,即 P(X=a)=1.
3. 切比雪夫不等式 设 X 的数学期望和方差都存在,则对任意常数 ε>0,有
P(∣X−E(X)∣≥ε)≤ε2Var(X),
或
P(∣X−E(X)∣<ε)≥1−ε2Var(X).
切比雪夫不等式给出了随机变量取值的大偏差(指事件 {∣X−E(X)∣≥ε})发生概率的上限,该上限与分布的方差成正比.
4. 随机变量的标准化 对任意随机变量 X,如果 X 的数学期望和方差存在,则称
X∗=Var(X)X−E(X)
为 X 的标准化随机变量,此时有 E(X∗)=0,Var(X∗)=1.
习题与解答 2.3
设随机变量 X 满足 E(X)=Var(X)=λ,已知 E[(X−1)(X−2)]=1,试求 λ.
解
由
E(X2)=Var(X)+[E(X)]2=λ+λ2,
及题设条件
1=E[(X−1)(X−2)]=E[X2−3X+2]=E(X2)−3λ+2=λ+λ2−3λ+2,
得
λ2−2λ+1=0,
从中解得
λ=1.
假设有 10 只同种电器元件,其中有两只不合格.装配仪器时,从这批元件中任取一只,如是不合格,则扔掉重新任取一只;如仍是不合格,则扔掉再取一只,试求在取到合格品之前,已取出的不合格品数的方差.
解
记 X 为取到合格品之前,已取出的不合格品数,则 X 的分布列为
由此得
E(X)=92,E(X2)=154,
Var(X)=154−(92)2=40588=0.2173.
已知 E(X)=−2,E(X2)=5, 求 Var(1−3X).
解
Var(1−3X)=9Var(X)=9[E(X2)−(E(X))2]=9[5−4]=9.
设 P(X=0)=1−P(X=1),如果 E(X)=3Var(X),求 P(X=0).
解
记 p=P(X=0),则 P(X=1)=1−p,因为
E(X)=1−p,Var(X)=p(1−p),
所以由 E(X)=3Var(X) 得
1−p=3p(1−p).
由此解得 p=31 或 p=1.因为 p=1 导致 X 为单点分布,即 X 几乎处处为 0,这无多大实际意义,故舍去.所以得
P(X=0)=p=31.
设随机变量 X 的分布函数为
F(x)=⎩⎨⎧2ex,21,1−21e−21(x−1),x<0,0≤x<1,x≥1.
试求 Var(X).
解
X 的密度函数(其图形见习题 2.2 图 2.7)为
p(x)=⎩⎨⎧21ex,0,41e−21(x−1),x<0,0≤x<1,x≥1.
所以
E(X)=∫−∞021xexdx+∫1∞41xe−21(x−1)dx=−21+23=1,
E(X2)=∫−∞021x2exdx+∫1∞41x2e−21(x−1)dx=1+6.5=7.5,
由此得
Var(X)=E(X2)−[E(X)]2=7.5−1=6.5.
设随机变量 X 的密度函数为
p(x)=⎩⎨⎧1+x,1−x,0,−1<x≤0,0<x≤1,其他,
试求 Var(3X+2).
解
因为
E(X)=∫−10x(1+x)dx+∫01x(1−x)dx=−61+61=0,
E(X2)=∫−10x2(1+x)dx+∫01x2(1−x)dx=121+121=61,
所以
Var(X)=E(X2)−[E(X)]2=61,
由此得
Var(3X+2)=9Var(X)=1.5.
设随机变量 X 的密度函数为
p(x)={ax+bx2,0,0<x<1,其他.
如果已知 E(X)=0.5,试计算 Var(X).
解
因为
1=∫−∞∞p(x)dx=∫01(ax+bx2)dx=2a+3b,(1)
0.5=E(X)=∫01x(ax+bx2)dx=3a+4b.(2)
联立(1)(2)两式解得
a=6,b=−6.
由此得
E(X2)=∫01x2(6x−6x2)dx=46−56=103.
所以
Var(X)=E(X2)−[E(X)]2=103−41=0.05.
设随机变量 X 的分布函数为
F(x)=1−e−x2,x>0,
试求 E(X) 和 Var(X).
解
因为 X 为非负连续随机变量,所以利用习题 2.2 第 21 题,有
E(X)=∫0∞[1−F(x)]dx=∫0∞e−x2dx.
令 x=t/2,则
∫0∞e−x2dx=π∫0∞2π1e−t2/2dt=2π.
又
E(X2)=∫0∞2xe−x2dx=∫0∞e−x2d(x2)=1,
由此得
Var(X)=1−4π.
注:此题也可直接计算得
p(x)=2xe−x2,x>0,
所以
E(X)=2∫0∞x2e−x2dx=2π.
试证:对任意的常数 c=E(X),有
Var(X)=E[X−E(X)]2<E(X−c)2.
解
E[X−E(X)]2=E{[(X−c)−(E(X)−c)]2}=E(X−c)2−(E(X)−c)2,
由于 c=E(X),所以 (E(X)−c)2>0,由此得
Var(X)=E[X−E(X)]2<E(X−c)2.
设随机变量 X 仅在区间 [a,b] 上取值,试证:
a≤E(X)≤b,Var(X)≤(2b−a)2.
解
仅对连续随机变量 X 加以证明.记 p(x) 为 X 的密度函数,因为
E(X)=∫abxp(x)dx≤b∫abp(x)dx=b,
同理可证:E(X)≥a.由上题的结论知
Var(X)=E[X−E(X)]2≤E(X−2a+b)2≤E(b−2a+b)2=(2b−a)2.
注:此命题表明有界随机变量的数学期望和方差总是存在的.
设随机变量 X 取值 x1≤x2≤⋯≤xn 的概率分别是 p1,p2,…,pn,∑k=1npk=1.证明
Var(X)≤(2xn−x1)2.
解
仿上题有
Var(X)≤E(X−2x1+xn)2≤E(xn−2x1+xn)2=(2xn−x1)2.
设 g(x) 为随机变量 X 取值的集合上的非负不减函数,且 E(g(X)) 存在,证明:对任意的 ε>0,有
P(X>ε)≤g(ε)E(g(X)).
解
仅对连续随机变量 X 加以证明.记 p(x) 为 X 的密度函数,则
P(X>ε)=∫ε∞p(x)dx≤∫ε∞g(ε)g(x)p(x)dx≤∫−∞∞g(ε)g(x)p(x)dx=g(ε)E(g(X)).
注:此题给出证明概率不等式的两次放大法:第一次放大被积函数;第二次放大积分区域.
设 X 为非负随机变量,a>0.若 E(eaX) 存在,证明:对任意的 x>0,有
P(X≥x)≤eaxE(eaX).
解
证 因为当 a>0 时,g(x)=eax 是非负不减函数,所以由上题即可得结论。
已知正常成年男性每升血液中的白细胞数平均是 7.3×109,标准差是 0.7×109。试利用切比雪夫不等式估计每升血液中的白细胞数在 5.2×109 至 9.4×109 之间的概率的下界。
解
记 X 为正常成年男性每升血液中的白细胞数,由题设条件知
E(X)=7.3×109,σ(X)=0.7×109.
所以由切比雪夫不等式得
P(5.2×109<X<9.4×109)=P(∣X−E(X)∣<2.1×109)≥1−(2.1×1090.7×109)2=1−91=98.
补充习题及解答
设 X 为非负连续随机变量,证明:对 x≥0,有
P(X<x)≥1−xE(X).
解
证 设 X 的密度函数为 p(x),则有
P(X<x)=∫0xp(t)dt=1−∫x∞p(t)dt≥1−∫x∞xtp(t)dt≥1−x1∫0∞tp(t)dt=1−xE(X).
向 △ABC 中随机投掷一点 P,求 P 点到 AB 距离 X 的数学期望、方差与标准差。
解
先求 X 的分布函数。作 △ABC 的高 CD,记 CD 的长度为 h(如图 2.8)。
\FigureTwoEight
设 X 的分布函数为 F(x),则当 x<0 时,有 F(x)=0;当 x≥h 时,有 F(x)=1;而当 0≤x<h 时,为了求概率 P(X≤x),作 EF∥AB,使 EF 与 AB 间的距离为 x。利用确定概率的几何方法,可得
F(x)=P(X≤x)=SABCSEFBA=1−SABCSEFC=1−(hh−x)2.
综上可得
F(x)=⎩⎨⎧0,1−(hh−x)2,1,x<0,0≤x<h,x≥h.
由此得 X 的密度函数为
p(x)=⎩⎨⎧h22(h−x),0,0≤x<h,其他.
故 X 与 X2 的数学期望为
E(X)E(X2)=h22∫0hx(h−x)dx=h22(2h3−3h3)=3h,=h22∫0hx2(h−x)dx=h22(3h4−4h4)=6h2.
从而得 X 的方差与标准差分别为
Var(X)=6h2−9h2=18h2,σ(X)=18h=62h.
设 X 为仅取正整数的随机变量,若其方差存在,证明:
Var(X)=2n=1∑∞nP(X≥n)−E(X)[E(X)+1].
解
证 由于 Var(X) 存在,所以级数 ∑n=1∞n2P(X=n) 绝对收敛,从而有
Var(X)=E(X2)−[E(X)]2=E(X2)+E(X)−E(X)[E(X)+1],
其中
E(X2)+E(X)=n=1∑∞n(n+1)P(X=n)=2n=1∑∞(i=1∑ni)P(X=n)=2i=1∑∞i[n=i∑∞P(X=n)]=2i=1∑∞iP(X≥i).
代回原式即得证。
§2.4 常用离散分布
1. 二项分布
(1)若 X 的概率分布列为
P(X=k)=(kn)pk(1−p)n−k,k=0,1,⋯,n.
则称 X 服从二项分布,记为 X∼b(n,p),其中 0<p<1。
(2)背景:n 重伯努利试验中成功的次数 X 服从二项分布 b(n,p),其中 p 为一次伯努利试验中成功发生的概率。
(3)n=1 时的二项分布 b(1,p) 称为二点分布,或称 0-1 分布。因为当 X∼b(1,p) 时,X 可表示一次伯努利试验中成功的次数,它只能取值 0 与 1。
(4)二项分布 b(n,p) 的数学期望和方差分别是
E(X)=np,Var(X)=np(1−p).
(5)若 X∼b(n,p),则 Y=n−X∼b(n,1−p),其中 Y=n−X 是 n 重伯努利试验中失败的次数。
2. 泊松分布
(1)若 X 的概率分布列为
P(X=k)=k!λke−λ,k=0,1,2,⋯,
则称 X 服从泊松分布,记为 X∼P(λ),其中参数 λ>0。
(2)背景:单位时间(或单位面积、单位产品等)上某稀有事件(这里稀有事件是指不经常发生的事件)发生的次数常服从泊松分布 P(λ),其中 λ 为该稀有事件发生的强度。
(3)泊松分布 P(λ) 的数学期望和方差分别是
E(X)=λ,Var(X)=λ.
(4)二项分布的泊松近似(泊松定理) 在 n 重伯努利试验中,记事件 A 在一次试验中发生的概率为 pn(与试验次数 n 有关),如果当 n→∞ 时,有 npn→λ,则
n→∞lim(kn)pnk(1−pn)n−k=k!λke−λ.
3. 超几何分布
(1)若 X 的概率分布列为
P(X=k)=(nN)(kM)(n−kN−M),k=0,1,⋯,r,
则称 X 服从超几何分布,记为 X∼h(n,N,M),其中 r=min{M,n},且 M≤N, n≤N, n,N,M 均为正整数。
(2)背景:设有 N 个产品,其中有 M 个不合格品。若从中不放回地随机抽取 n 个,则其中含有的不合格品的个数 X 服从超几何分布 h(n,N,M)。
(3)超几何分布 h(n,N,M) 的数学期望和方差分别是
E(X)=nNM,Var(X)=N2(N−1)nM(N−M)(N−n).
(4)超几何分布的二项近似 当 n≪N 时,超几何分布 h(n,N,M) 可用二项分布 b(n,M/N) 近似,即
(nN)(kM)(n−kN−M)≈(kn)pk(1−p)n−k,其中 p=NM.
(5)实际应用中,在不放回抽样时,常用超几何分布描述抽出样品中不合格品数的分布;在放回抽样时,常用二项分布 b(n,p) 描述抽出样品中不合格品数的分布;当批量 N 较大,而抽出样品数 n 较小时,不放回抽样可近似看作放回抽样。
4. 几何分布
(1)若 X 的概率分布列为
P(X=k)=(1−p)k−1p,k=1,2,⋯,
则称 X 服从几何分布,记为 X∼Ge(p),其中 0<p<1。
(2)背景:在伯努利试验序列中,成功事件 A 首次出现时的试验次数 X 服从几何分布 Ge(p),其中 p 为每次试验中事件 A 发生的概率。
(3)几何分布 Ge(p) 的数学期望和方差分别是
E(X)=p1,Var(X)=p21−p.
(4)几何分布的无记忆性:若 X∼Ge(p),则对任意正整数 m 与 n 有
P(X>m+n∣X>m)=P(X>n).
5. 负二项分布
(1)若 X 的概率分布列为
P(X=k)=(r−1k−1)pr(1−p)k−r,k=r,r+1,⋯,
则称 X 服从负二项分布或帕斯卡分布,记为 X∼Nb(r,p),其中 r 为正整数,0<p<1。
(2)背景:在伯努利试验序列中,成功事件 A 第 r 次出现时的试验次数 X 服从负二项分布 Nb(r,p),其中 p 为每次试验中事件 A 发生的概率。
(3)r=1 时的负二项分布为几何分布,即 Nb(1,p)=Ge(p)。
(4)负二项分布 Nb(r,p) 的数学期望和方差分别是
E(X)=pr,Var(X)=p2r(1−p).
(5)负二项分布的随机变量可以表示成 r 个独立同分布的几何分布随机变量之和,即若 X∼Nb(r,p),则
X=X1+X2+⋯+Xr,
其中 X1,X2,⋯,Xr 是相互独立、服从几何分布 Ge(p) 的随机变量。
\FigureTwoNine
这里随机变量间的相互独立是指一个变量的取值不影响其他变量的取值,详见教材 §3.2。
6. 常用离散分布表
\small
\renewcommand{\arraystretch}{1.5}
| 名称与记号 | 分布列 | 期望 | 方差 |
|---|
| 0-1 分布 | | | |
| b(1,p) | pk=pk(1−p)1−k,k=0,1 | p | p(1−p) |
| 二项分布 | | | |
| b(n,p) | pk=(kn)pk(1−p)n−k,k=0,1,⋯,n | np | np(1−p) |
| 泊松分布 | | | |
| P(λ) | pk=k!λke−λ,k=0,1,⋯ | λ | λ |
\small续表
\small
\renewcommand{\arraystretch}{1.5}
| 名称与记号 | 分布列 | 期望 | 方差 |
|---|
| 超几何分布 | | | |
| h(n,N,M) | pk=(nN)(kM)(n−kN−M),k=0,1,⋯,r,r=min{M,n} | nNM | N2(N−1)nM(N−M)(N−n) |
| 几何分布 | | | |
| Ge(p) | pk=(1−p)k−1p,k=1,2,⋯ | p1 | p21−p |
| 负二项分布 | | | |
| Nb(r,p) | pk=(r−1k−1)(1−p)k−rpr,k=r,r+1,⋯ | pr | p2r(1−p) |
习题与解答 2.4
一批产品中有 10% 的不合格品,现从中任取 3 件,求其中至多有一件不合格品的概率。
解
记 X 为取出的 3 件产品中的不合格品数,则 X∼b(3,0.1),所求概率为
P(X≤1)=P(X=0)+P(X=1)=0.93+3×0.1×0.92=0.972.
一条自动化生产线上产品的一级品率为 0.8,现检查 5 件,求至少有 2 件一级品的概率。
解
记 X 为检查 5 件产品中的一级品数,则 X∼b(5,0.8),所求概率为
P(X≥2)=1−P(X=0)−P(X=1)=1−0.25−5×0.8×0.24=0.9933.
某优秀射手命中 10 环的概率为 0.7,命中 9 环的概率为 0.3。试求该射手三次射击所得的环数不少于 29 环的概率。
解
记 X 为三次射击中命中 10 环的次数,则 X∼b(3,0.7)。因为“所得的环数不少于 29 环”相当于“射击三次至少二次命中 10 环”,故所求概率为
P(X≥2)=P(X=2)+P(X=3)=3×0.72×0.3+0.73=0.784.
经验表明:预订餐厅座位而不来就餐的顾客比例为 20%。如今餐厅有 50 个座位,但预订给了 52 位顾客,问到时顾客来到餐厅而没有座位的概率是多少?
解
记 X 为预订的 52 位顾客中不来就餐的顾客数,则 X∼b(52,0.2)。因为“顾客来到餐厅没有座位”相当于“52 位顾客中最多 1 位顾客不来就餐”,所以所求概率为
P(X≤1)=P(X=0)+P(X=1)=0.852+52×0.851×0.2=0.0001279.
设随机变量 X∼b(n,p),已知 E(X)=2.4,Var(X)=1.44,求两个参数 n 与 p 各为多少?
解
从 np=E(X)=2.4 和 np(1−p)=Var(X)=1.44 中解得
n=6,p=0.4.
设随机变量 X 服从二项分布 b(2,p),随机变量 Y 服从二项分布 b(4,p)。若 P(X≥1)=8/9,试求 P(Y≥1)。
解
从
98=P(X≥1)=1−P(X=0)=1−(1−p)2
中解得 p=2/3。由此得
P(Y≥1)=1−P(Y=0)=1−(1−p)4=1−(31)4=8180.
一批产品的不合格品率为 0.02,现从中任取 40 件进行检查,若发现两件或两件以上不合格品就拒收这批产品。分别用以下方法求拒收的概率:
- 用二项分布作精确计算;
- 用泊松分布作近似计算。
解
记 X 为抽取的 40 件产品中的不合格品数,则 X∼b(40,0.02)。而“拒收”就相当于 {X≥2}。
(1)拒收的概率为
P(X≥2)=1−P(X=0)−P(X=1)=1−0.9840−40×0.9839×0.02=0.1905.
(2)因为 λ=40×0.02=0.8,所以用泊松分布作近似计算,可得近似值为
P(X≥2)=1−P(X=0)−P(X=1)≈1−e−0.8−0.8×e−0.8=0.1912.
可见近似值与精确值相差 0.0007,近似效果较好。
设 X 服从泊松分布,且已知 P(X=1)=P(X=2),求 P(X=4)。
解
由 P(X=1)=P(X=2) 得
λe−λ=2λ2e−λ,
从中解得 λ=2,由此得
P(X=4)=4!λ4e−λ=4!24e−2=0.0902.
已知某商场一天来的顾客数 X 服从参数为 λ 的泊松分布,而每个来到商场的顾客购物的概率为 p,证明:此商场一天内购物的顾客数服从参数为 λp 的泊松分布。
解
证 用 Y 表示商场一天内购物的顾客数,则由全概率公式知,对任意正整数 k 有
P(Y=k)=i=k∑∞P(X=i)P(Y=k∣X=i)=i=k∑∞i!λie−λ(ki)pk(1−p)i−k=k!(λp)ke−λi=k∑∞(i−k)![λ(1−p)]i−k=k!(λp)ke−λeλ(1−p)=k!(λp)ke−λp.
这表明:Y 服从参数为 λp 的泊松分布。
设一个人一年内患感冒的次数服从参数 λ=5 的泊松分布。现有某种预防感冒的药物对 75% 的人有效(能将泊松分布的参数减少为 λ=3),对另外的 25% 的人不起作用。如果某人服用了此药,一年内患了两次感冒,那么该药对他(她)有效的可能性是多少?
解
记事件 A 为“服用此药后,一年感冒两次”,事件 B 为“服用此药后有效”。因为
P(A)=P(B)P(A∣B)+P(B)P(A∣B)=0.75×2!32e−3+0.25×2!52e−5,
因此所求概率为
P(B∣A)=0.75×2!32e−3+0.25×2!52e−50.75×2!32e−3=0.889.
有三个朋友去喝咖啡,他们决定用掷硬币的方式确定谁付账:每人掷一次硬币,如果有一人掷出的结果与其他两人不一样,那么由他付账;如果三个人掷出的结果是一样的,那么就重新掷,一直这样下去,直到确定了由谁来付账。求以下事件的概率:
- 进行到了第 2 轮确定了由谁来付账;
- 进行了 3 轮还没有确定付账人。
解
记 X 为所掷的轮数,则 X∼Ge(p),其中
1−p=P(重新掷)=P(出现三个正面或出现三个反面)=81+81=41,
所以
p=43.
(1)第 2 轮确定由谁来付账的概率为
P(X=2)=(1−p)⋅p=41×43=163=0.1875.
(2)进行了 3 轮还没有确定付账人的概率为
P(X>3)=1−P(X=1)−P(X=2)−P(X=3)=1−43−41×43−(41)2×43=641=0.0156.
从一个装有 m 个白球、n 个黑球的袋中进行有放回摸球,直到摸到白球时停止。试求取出黑球数的期望。
解
令 X 为取到白球时已取出的黑球数,则 Y=X+1 服从几何分布 Ge(m/(n+m)),所以
E(Y)=mn+m=mn+1,
由此得
E(X)=E(Y)−1=mn.
某种产品上的缺陷数 X 服从下列分布列:
P(X=k)=2k+11,k=0,1,⋯,
求此种产品上的平均缺陷数。
解
由题意知 Y=X+1 可看作服从几何分布 Ge(1/2) 的随机变量,所以
E(Y)=2,
由此得
E(X)=E(Y)−1=1.
设随机变量 X 的密度函数为
p(x)={2x,0,0<x<1,其他.
以 Y 表示对 X 的三次独立重复观察中事件 {X≤1/2} 出现的次数,试求 P(Y=2)。
解
因为 Y∼b(3,p),其中
p=P(X≤1/2)=∫01/22xdx=41,
所以
P(Y=2)=(23)(41)2×43=649.
某产品的不合格品率为 0.1,每次随机抽取 10 件进行检验,若发现其中不合格品数多于 1,就去调整设备。若检验员每天检验 4 次,试问每天平均要调整几次设备?
解
令 X 为每次检验中不合格品的个数,则 X∼b(10,0.1),而调整设备的概率为
P(X>1)=0.2639.
又记 Y 为每天调整设备的次数,则 Y∼b(4,0.2639),所以平均每天调整次数为
E(Y)=4×0.2639=1.0556.
一个系统由多个元件组成,各个元件是否正常工作是相互独立的,且各个元件正常工作的概率为 p。若在系统中至少有一半的元件正常工作,那么整个系统就有效。问 p 取何值时,5 个元件的系统比 3 个元件的系统更有可能有效?
解
记 X 为 5 个元件的系统中正常工作的元件数;Y 为 3 个元件的系统中正常工作的元件数。则 X∼b(5,p),Y∼b(3,p)。
对 X 而言,系统有效的概率为
P(X≥3)=(35)p3(1−p)2+(45)p4(1−p)+p5;
对 Y 而言,系统有效的概率为
P(Y≥2)=(23)p2(1−p)+p3.
根据题意,求满足下式的 p:
P(X≥3)>P(Y≥2),
即
10p3(1−p)2+5p4(1−p)+p5>3p2(1−p)+p3.
上述不等式可简化为
2p3−5p2+4p−1>0,
或
(p−1)2(2p−1)>0,
或 (2p−1)>0,从而有
p>21.
设随机变量 X 服从参数为 λ 的泊松分布,试证明:
E(Xn)=λE[(X+1)n−1].
利用此结果计算 E(X3)。
解
证
E(Xn)=k=0∑∞knk!λke−λ=λe−λk=1∑∞kn−1(k−1)!λk−1=k′=k−1λe−λk′=0∑∞(k′+1)n−1k′!λk′=λE[(X+1)n−1].
由此得
E(X3)=λE(X+1)2=λ[E(X2)+2E(X)+1]=λ[λE(X+1)+2λ+1]=λ(λ2+3λ+1)=λ3+3λ2+λ.
令 X(n,p) 表示服从二项分布 b(n,p) 的随机变量,试证明:
P(X(n,p)≤i)=1−P(X(n,1−p)≤n−i−1).
解
证
P(X(n,p)≤i)=k=0∑i(kn)pk(1−p)n−k=1−k=i+1∑n(kn)pk(1−p)n−k=k′=n−k1−k′=0∑n−i−1(k′n)pn−k′(1−p)k′=1−P(X(n,1−p)≤n−i−1).
设随机变量 X 服从参数为 p 的几何分布,试证明:
E(X1)=−1−pplnp.
解
证
E(X1)=k=1∑∞k1(1−p)k−1p=1−ppk=1∑∞∫01−pxk−1dx=1−pp∫01−p(k=1∑∞xk−1)dx=1−pp∫01−p1−x1dx=1−pp[−ln(1−x)]01−p=1−pp(−lnp).
设随机变量 X∼b(n,p),试证明:
E(X+11)=(n+1)p1−(1−p)n+1.
解
证
E(X+11)=k=0∑nk+11(kn)pk(1−p)n−k=k=0∑n(k+1)!(n−k)!n!pk(1−p)n−k=(n+1)p1k=0∑n(k+1)![n+1−(k+1)]!(n+1)!pk+1(1−p)n+1−(k+1)=k′=k+1(n+1)p1k′=1∑n+1(k′n+1)pk′(1−p)n+1−k′=(n+1)p1[1−(1−p)n+1].
补充习题及解答
掷一枚不均匀硬币,一直掷到正、反面都出现为止。记出现正面的概率为 p (0<p<1),试求平均抛掷次数。
解
记 X 为直到正、反面都出现时的抛掷次数,则 X 可取值 2,3,⋯,且有
P(X=k)=(1−p)k−1p+pk−1(1−p),k=2,3,⋯,
可以验证:这是一个分布列。由此得 X 的数学期望为
E(X)=k=2∑∞k[(1−p)k−1p+pk−1(1−p)]=k=1∑∞k(1−p)k−1p−p+k=1∑∞kpk−1(1−p)−(1−p)=p1+1−p1−1=p(1−p)1−1.
从上式中可以看出:p=0.9 与 p=0.1 时的平均抛掷次数是一样的,都为 91/9;p=0.8 与 p=0.2 时的平均抛掷次数是一样的,都为 21/4;而 p 越接近于 0.5 时,E(X) 越小;若 p=0.5,即掷一枚均匀硬币,则直至正、反面都出现的平均抛掷次数是 3。
设某商店中每月销售某商品的数量 X 服从参数为 7 的泊松分布。问在月初应进货多少件,才能保证当月不脱销的概率不小于 0.90。
解
用 k 表示在月初进货该商品的件数,则由题意知 k 应满足如下不等式
P(X≤k)≥0.90.
查泊松分布表中 λ=7 数值知
P(X≤9)=0.830,P(X≤10)=0.901,
故应在月初至少进 10 件,才能保证当月不脱销的概率不小于 0.90。
某种产品 500 箱中共有 500 个不合格品,若每个不合格品等可能地出现在每箱中(每箱至少有 500 个产品),试求指定的一箱中至少有三个不合格品的概率。
解
设 X 为指定一箱中不合格品的个数,则 X∼b(500,p),且 p=1/500。所求的概率为
P(X≥3)=1−P(X<3)=1−i=0∑2(i500)(5001)i(500499)500−i.
利用二项分布的泊松近似,取 λ=np=500×5001=1,于是上述概率的近似值为
P(X≥3)≈1−i=0∑2i!e−1=1−e−1−e−1−2e−1=0.0803.
某厂产品的不合格品率为 0.03,现要把产品装箱,若要以不小于 0.9 的概率保证每箱中至少有 100 件合格品,那么每箱至少应装多少件产品?
解
设每箱装 100+k 件产品,则每箱中的不合格品数 X 服从二项分布 b(100+k,0.03)。根据题意要求 k,使 X 小于等于 k 的概率至少为 0.9,即 P(X≤k)≥0.9,也就是求满足下述不等式的 k
i=0∑k(i100+k)0.03i0.97100+k−i≥0.9.
在此 p=0.03,n=100+k 较大,可用二项分布的泊松近似,得 λ=(100+k)×0.03≈3,于是上式可改写为
i=0∑ki!3ie−3≥0.9.
查泊松分布表得
P(X≤4)=0.815,P(X≤5)=0.916,
故取 k=5 是恰当的,即每箱中装 105 件产品可使每箱中至少有 100 件合格品的概率不小于 0.9。
设 X 是只取自然数值的离散随机变量。若 X 的分布具有无记忆性,即对任意自然数 n 与 m,都有
P(X>n+m∣X>m)=P(X>n),
证明 X 的分布一定是几何分布。
解
证 由无记忆性知
P(X>n+m∣X>m)=P(X>m)P(X>n+m)=P(X>n),
或
P(X>n+m)=P(X>n)P(X>m).
若把 n 换成 n−1 仍有
P(X>n+m−1)=P(X>n−1)P(X>m).
上两式相减可得
P(X=n+m)=P(X=n)P(X>m).
若取 n=m=1,并设 P(X=1)=p,则有
P(X=2)=p(1−p).
若取 n=2,m=1,可得
P(X=3)=P(X=2)P(X>1)=p(1−p)2.
若令 P(X=k)=p(1−p)k−1,则用数学归纳法可推得
P(X=k+1)=P(X=k)P(X>1)=p(1−p)k,k=0,1,⋯.
这表明 X 的分布就是几何分布。
§2.5 常用连续分布
1. 正态分布
(1)若随机变量 X 的密度函数和分布函数(如图 2.10)分别为
p(x)=2πσ1e−2σ2(x−μ)2,−∞<x<∞,
F(x)=2πσ1∫−∞xe−2σ2(t−μ)2dt,−∞<x<∞,
则称 X 服从正态分布,记作 X∼N(μ,σ2),其中参数 −∞<μ<∞, σ>0。
\FigureTwoTen
(2)背景:一个变量若是由大量微小的、独立的随机因素的叠加结果,则此变量一定是正态变量(服从正态分布的变量)。测量误差就是由量具偏差、测量环境的影响、测量技术的影响、测量人员的心理影响等随机因素叠加而成的,所以测量误差常认为服从正态分布。
(3)关于参数 μ
- μ 是正态分布的数学期望,即 E(X)=μ,称 μ 为正态分布的位置参数。
- μ 是正态分布的对称中心,在 μ 的左侧和 p(x) 下的面积为 0.5;在 μ 的右侧和 p(x) 下的面积也为 0.5,所以 μ 也是正态分布的中位数(见后面 §2.7)。
- 若 X∼N(μ,σ2),则 X 在离 μ 愈近取值的可能性愈大,离 μ 愈远取值的可能性愈小。
关于参数 σ
- σ2 是正态分布的方差,即 Var(X)=σ2。
- σ 是正态分布的标准差,σ 愈小,正态分布愈集中;σ 愈大,正态分布愈分散。σ 又称为正态分布的尺度参数。
- 若随机变量 X∼N(μ,σ2),则其密度函数 p(x) 在 μ±σ 处有两个拐点。
(4)称 μ=0,σ=1 时的正态分布 N(0,1) 为标准正态分布。记 U 为标准正态变量,φ(u) 和 Φ(u) 为标准正态分布的密度函数和分布函数。φ(u) 和 Φ(u) 满足:
φ(−u)=φ(u);
Φ(−u)=1−Φ(u),
对 u>0,Φ(u) 的值有表可查。
(5)标准化变换:若随机变量 X∼N(μ,σ2),则
U=σX−μ∼N(0,1),
其中 U=(X−μ)/σ 称为 X 的标准化变换。
(6)若随机变量 X∼N(μ,σ2),则对任意实数 a 与 b,有
P(X≤b)=Φ(σb−μ),
P(a<X)=1−Φ(σa−μ),
P(a<X≤b)=Φ(σb−μ)−Φ(σa−μ).
可见,涉及正态变量的概率计算,一般是化为标准正态变量再查表获得。
(7)正态分布的 3σ 原则:设随机变量 X∼N(μ,σ2),则
P(∣X−μ∣<kσ)=Φ(k)−Φ(−k)=⎩⎨⎧0.6826,0.9545,0.9973,k=1,k=2,k=3.
2. 均匀分布
(1)若随机变量 X 的密度函数和分布函数(如图 2.11)分别为
p(x)=⎩⎨⎧b−a1,0,a<x<b,其他,F(x)=⎩⎨⎧0,b−ax−a,1,x<a,a≤x<b,x≥b,
则称 X 服从区间 (a,b) 上的均匀分布,记作 X∼U(a,b)。
(2)背景:向区间 (a,b) 随机投点,落点坐标 X 一定服从均匀分布 U(a,b)。这里“随机投点”是指:点落在任意相等长度的小区间上的可能性是相等的。
(3)均匀分布 U(a,b) 的数学期望和方差分别是
E(X)=2a+b,Var(X)=12(b−a)2.
\FigureTwoEleven
(4)称区间 (0,1) 上的均匀分布 U(0,1) 为标准均匀分布,它是导出其他分布随机数的桥梁。
3. 指数分布
(1)若随机变量 X 的密度函数(如图 2.12)和分布函数分别为
p(x)={λe−λx,0,x≥0,x<0,F(x)={1−e−λx,0,x≥0,x<0,
则称 X 服从指数分布,记作 X∼Exp(λ),其中参数 λ>0。
\FigureTwoTwelve
(2)背景:若一个元器件(或一台设备,或一个系统)遇到外来冲击时即告失效,则首次冲击来到的时间 X(寿命)服从指数分布。很多产品的寿命可以认为服从或近似服从指数分布。
(3)指数分布 Exp(λ) 的数学期望和方差分别为
E(X)=λ1,Var(X)=λ21.
(4)指数分布的无记忆性:若随机变量 X∼Exp(λ),则对任意 s>0, t>0,有
P(X>s+t∣X>s)=P(X>t).
4. 伽马分布
(1)伽马函数 称
Γ(α)=∫0∞xα−1e−xdx
为伽马函数,其中参数 α>0。伽马函数具有如下性质:
- Γ(1)=1;
- Γ(1/2)=π;
- Γ(α+1)=αΓ(α);
- Γ(n+1)=nΓ(n)=n!(n 为自然数)。
(2)伽马分布 若随机变量 X 的密度函数(如图 2.13)为
p(x)=⎩⎨⎧Γ(α)λαxα−1e−λx,0,x≥0,x<0,
则称 X 服从伽马分布,记作 X∼Ga(α,λ),其中 α>0 为形状参数,λ>0 为尺度参数。
\FigureTwoThirteen
(3)背景:若一个元器件(或一台设备,或一个系统)能抵挡一些外来冲击,但遇到第 k 次冲击时即告失效,则第 k 次冲击来到的时间 X(寿命)服从形状参数为 k 的伽马分布 Ga(k,λ)。
(4)伽马分布 Ga(α,λ) 的数学期望和方差分别为
E(X)=λα,Var(X)=λ2α.
(5)伽马分布的两个特例:
- α=1 时的伽马分布就是指数分布,即 Ga(1,λ)=Exp(λ)。
- 称 α=n/2,λ=1/2 时的伽马分布为自由度为 n 的 χ2(卡方)分布,记为 χ2(n),其密度函数为
p(x)=⎩⎨⎧2n/2Γ(2n)1e−x/2xn/2−1,0,x≥0,x<0.
其 χ2(n) 分布的期望和方差分别为
E(X)=n,Var(X)=2n.
(6)若形状参数为整数 k,则伽马变量可以表示成 k 个独立同分布的指数变量之和,即若 X∼Ga(k,λ),则
X=X1+X2+⋯+Xk,
其中 X1,X2,⋯,Xk 是相互独立且都服从指数分布 Exp(λ) 的随机变量,见图 2.14,其中“×”表示冲击来到的时间。
\FigureTwoFourteen
5. 贝塔分布
(1)贝塔函数 称
B(a,b)=∫01xa−1(1−x)b−1dx
为贝塔函数,其中参数 a>0,b>0。贝塔函数具有如下性质:
- B(a,b)=B(b,a);
- B(a,b)=Γ(a+b)Γ(a)Γ(b)。
(2)贝塔分布 若随机变量 X 的密度函数(如图 2.15)为
p(x)=⎩⎨⎧Γ(a)Γ(b)Γ(a+b)xa−1(1−x)b−1,0,0<x<1,其他,
则称 X 服从贝塔分布,记作 X∼Be(a,b),其中 a>0,b>0 都是形状参数。
\FigureTwoFifteen
(3)背景:很多比率,如产品的不合格率、机器的维修率、某商品的市场占有率、射击的命中率等都是在区间 (0,1) 上取值的随机变量,贝塔分布 Be(a,b) 可供描述这些随机变量之用,而在应用中,可调节 a 与 b 以适应实际中的要求。
(4)贝塔分布 Be(a,b) 的数学期望和方差分别为
E(X)=a+ba,Var(X)=(a+b)2(a+b+1)ab.
(5)a=b=1 时的贝塔分布就是区间 (0,1) 上的均匀分布,即 Be(1,1)=U(0,1)。
6. 常用连续分布表
\small
\renewcommand{\arraystretch}{1.45}
| 名称与记号 | 密度函数 p(x) | 期望 | 方差 |
|---|
| 正态分布 | | | |
| N(μ,σ2) | 2πσ1exp{−2σ2(x−μ)2}, −∞<x<∞ | μ | σ2 |
| 均匀分布 | | | |
| U(a,b) | b−a1, a<x<b | 2a+b | 12(b−a)2 |
| 指数分布 | | | |
| Exp(λ) | λe−λx, x≥0 | λ1 | λ21 |
| 伽马分布 | | | |
| Ga(α,λ) | Γ(α)λαxα−1e−λx, x≥0 | λα | λ2α |
| χ2(n) 分布 | Γ(n/2)2n/2xn/2−1e−x/2, x≥0 | n | 2n |
| 贝塔分布 | | | |
| Be(a,b) | Γ(a)Γ(b)Γ(a+b)xa−1(1−x)b−1, 0<x<1 | a+ba | (a+b)2(a+b+1)ab |
| 对数正态分布 | | | |
| LN(μ,σ2) | 2πσx1exp{−2σ2(lnx−μ)2}, x>0 | eμ+σ2/2 | e2μ+σ2(eσ2−1) |
| 柯西分布 | | | |
| Cau(μ,λ) | π1λ2+(x−μ)2λ, −∞<x<∞ | 不存在 | 不存在 |
\small续表
\small
\renewcommand{\arraystretch}{1.45}
| 名称与记号 | 密度函数 p(x) | 期望 | 方差 |
|---|
| 韦布尔分布 | | | |
| W(m,η) | p(x)=F′(x), F(x)=1−exp{−(ηx)m};或 p(x)=ηm(ηx)m−1exp{−(ηx)m}, x>0 | ηΓ(1+m1) | η2[Γ(1+m2)−Γ2(1+m1)] |
7. 要记住常用分布的数学期望与方差,还要弄清它们与分布中参数的关系,因为不少分布可由其数学期望与方差确定。而一个分布就是一个概率模型。
习题与解答 2.5
设随机变量 X 服从区间 (2,5) 上的均匀分布,求对 X 进行 3 次独立观测中,至少有 2 次的观测值大于 3 的概率。
解
在一次观测中,观测值大于 3 的概率为
p=P(X>3)=∫3531dx=32.
设 Y 为此种观测 (X>3) 的次数,则 Y∼b(3,2/3),由此得
P(Y≥2)=1−P(Y=0)−P(Y=1)=1−(31)3−3×32×(31)2=2720.
在 (0,1) 上任取一点记为 X,试求
P(X2−43X+81≥0).
解
由 x2−43x+81=0 解得 x1=0.25, x2=0.5。因为 X∼U(0,1),又因为二次函数 y=x2−43x+81 是开口向上的,故有
{X2−43X+81≥0}={0≤X≤0.25}∪{0.5≤X≤1},
所以
P(X2−43X+81≥0)=∫00.25dx+∫0.51dx=0.75.
设 K 服从 (1,6) 上的均匀分布,求方程 x2+Kx+1=0 有实根的概率。
解
方程 x2+Kx+1=0 有实根的充要条件是
K2−4≥0⟺{K≤−2}∪{K≥2}.
而 K∼U(1,6),因此所求概率为
P(K≤−2)+P(K≥2)=0+∫2651dx=54.
若随机变量 K∼N(μ,σ2),而方程 x2+4x+K=0 无实根的概率为 0.5,试求 μ。
解
方程 x2+4x+K=0 无实根等价于
16−4K<0,
所以由题意知
0.5=P(16−4K<0)=P(K>4)=1−Φ(σ4−μ).
由此得知
μ=4.
设流经一个 2Ω 电阻上的电流强度 I 是一个随机变量,它均匀分布在 9A 至 11A 之间。试求此电阻上消耗的平均功率,其中功率 W=2I2。
解
因为 I∼U(9,11),所以平均功率为
E(W)=E(2I2)=∫9112x2⋅21dx=31x3911=3602.
某种圆盘的直径在区间 (a,b) 上服从均匀分布,试求此种圆盘的平均面积。
解
记 X 为圆盘的直径,则圆盘的面积为 Y=πX2/4,所以平均面积为
E(Y)=4πE(X2)=4π[12(b−a)2+(2a+b)2]=12π(a2+b2+ab).
设某种商品每周的需求量 X 服从区间 (10,30) 上均匀分布,而商店进货数为区间 (10,30) 中的某一整数。商店每销售 1 单位商品可获利 500 元;若供大于求则降价处理,每处理 1 单位商品亏损 100 元;若供不应求,则可从外部调剂供应,此时每 1 单位商品仅获利 300 元。为使商店所获利润期望值不小于 9280 元,试确定最少进货量。
解
设进货量为 a,则利润为
g(X)={500X−100(a−X),500a+300(X−a),10≤X≤a,a<X≤30,={600X−100a,300X+200a,10≤X≤a,a<X≤30.
所以平均利润为
E(g(X))=∫1030g(x)⋅201dx=201∫10a(600x−100a)dx+201∫a30(300x+200a)dx=−7.5a2+350a+5250.
按照题意要求有
−7.5a2+350a+5250≥9280,
即
−7.5a2+350a−4030≥0,
解得
2032≤a≤26,
因此最少进货为 21 单位。
统计调查表明,英格兰在 1875 年至 1951 年期间在矿山发生 10 人或 10 人以上死亡的两次事故之间的时间 T(以日计)服从均值为 241 的指数分布。试求 P(50<T<100)。
解
P(50<T<100)=F(100)−F(50)=e−50/241−e−100/241=0.1523.
若一次电话通话时间 X(以 min 计)服从参数为 0.25 的指数分布,试求一次通话的平均时间。
解
因为 X∼Exp(λ),其中 λ=0.25,所以
E(X)=λ1=0.251=4 min.
某种设备的使用寿命 X(以年计)服从指数分布,其平均寿命为 4 年。制造此种设备的厂家规定,若设备在使用一年之内损坏,则可以予以调换。如果设备制造厂每售出一台设备可赢利 100 元,而调换一台设备制造厂需花费 300 元。试求每台设备的平均利润。
解
令
Y={0,1,设备在使用一年之内不损坏,设备在使用一年之内损坏,
即 Y 是一台设备在使用一年之内损坏的台数,显然 Y∼b(1,p),其中
p=P(设备在使用一年之内损坏)=P(X≤1)=∫0141e−x/4dx=1−e−0.25=0.2212.
因为每台设备的利润为 Z=100−300Y,所以每台设备的平均利润为
E(Z)=100−300E(Y)=100−300×0.2212=33.64(元).
设顾客在某银行的窗口等待服务的时间 X(以 min 计)服从指数分布,其密度函数为
p(x)=⎩⎨⎧51e−x/5,0,x>0,其他.
某顾客在窗口等待服务,若超过 10min 他就离开。他一年要到银行 5 次,以 Y 表示一年内他未等到服务而离开窗口的次数,试求 P(Y≥1)。
解
因为 Y∼b(5,p),其中
p=P(X>10)=e−2,
所以得
P(Y≥1)=1−P(Y=0)=1−(1−p)5=1−(1−e−2)5=0.5167.
某仪器装了 3 个独立工作的同型号电子元件,其寿命 X(以 h 计)都服从同一指数分布,密度函数为
p(x)=⎩⎨⎧6001e−x/600,0,x>0,其他.
试求:此仪器在最初使用的 200h 内,至少有一个此种电子元件损坏的概率。
解
设 Y 为仪器在最初使用的 200h 内损坏的元件个数,则 Y∼b(3,p),其中
p=∫02006001e−x/600dx=1−e−1/3,
所以至少有一个电子元件损坏的概率为
P(Y≥1)=1−P(Y=0)=1−(1−p)3=1−[1−(1−e−1/3)]3=1−e−1=0.6321.
设随机变量 X 的密度函数为
p(x)={λe−λx,0,x>0,x≤0(λ>0).
试求 k,使得 P(X>k)=0.5。
解
因为
0.5=P(X>k)=∫k∞λe−λxdx=e−λk,
由此解得
k=λln2.
设随机变量 X 的密度函数为
p(x)=⎩⎨⎧31,92,0,0≤x≤1,3≤x≤6,其他,
若 P(X≥k)=2/3,试求 k 的取值范围。
解
由题设条件
32=P(X≥k)=1−P(X<k),
知 F(k)=1/3。又由 p(x) 得分布函数如下
F(x)=⎩⎨⎧0,3x,31,92x−31,1,x<0,0≤x<1,1≤x<3,3≤x<6,x≥6.
\FigureTwoSixteen
由此得
1≤k≤3.
写出以下正态分布的均值和标准差:
p1(x)=π1e−(x2+4x+4),p2(x)=π2e−2x2,p3(x)=π1e−x2.
解
对 p1(x) 有
p1(x)=2π(1/2)1exp{−2(1/2)2(x+2)2},
所以 p1(x) 的均值 μ1=−2,标准差 σ1=1/2。
对 p2(x) 有
p2(x)=2π(1/2)1exp{−2(1/2)2(x−0)2},
所以 p2(x) 的均值 μ2=0,标准差 σ2=1/2。
对 p3(x) 有
p3(x)=2π(1/2)1exp{−2(1/2)2(x−0)2},
所以 p3(x) 的均值 μ3=0,标准差 σ3=1/2。
某地区 18 岁女青年的血压 X(收缩压,以 mmHg 计)服从 N(110,122)。试求该地区 18 岁女青年的血压在 100 至 120 的可能性有多大?
解
P(100<X<120)=Φ(12120−110)−Φ(12100−110)=Φ(65)−Φ(−65)=2Φ(65)−1=0.5950.
其中 Φ(5/6)=Φ(0.833)=0.7975 是用内插法得到的。
某地区成年男子的体重 X(以 kg 计)服从正态分布 N(μ,σ2)。若已知 P(X≤70)=0.5, P(X≤60)=0.25。
- 求 μ 与 σ 各为多少?
- 若在这个地区随机地选出 5 名成年男子,问其中至少有两人体重超过 65kg 的概率是多少?
解
(1)由
0.5=P(X≤70)=Φ(σ70−μ),
知
σ70−μ=0,
由此解得 μ=70。又由
0.25=P(X≤60)=Φ(σ60−70)=Φ(−σ10)=1−Φ(σ10),
即
0.75=Φ(σ10).
查表知 10/σ=0.675,由此解得
σ=14.81.
(2)记 Y 为选出的 5 名成年男子中体重超过 65kg 的人数,则 Y∼b(5,p),其中
p=P(X>65)=Φ(14.8170−65)=Φ(0.3376)=0.6324,
所以“5 名中至少有两人体重超过 65kg”的概率为
P(Y≥2)=1−0.36765−5×0.36764×0.6324=0.94.
由某机器生产的螺栓的长度(以 cm 计)服从正态分布 N(10.05,0.062),若规定长度在范围 (10.05±0.12)cm 内为合格品,求螺栓不合格的概率。
解
记螺栓的长度为 X,则
P(螺栓不合格)=1−P(10.05−0.12≤X≤10.05+0.12)=2−2Φ(0.12/0.06)=2−2×0.9772=0.0456.
某地抽样调查结果表明,考生的外语成绩(以百分制计)近似地服从 μ=72 的正态分布,已知 96 分以上的人数占总数的 2.3%,试求考生的成绩大于等于 60 分的概率。
解
记 X 为考生的外语成绩,由题设条件知 X∼N(72,σ2),其中 σ 未知,但由题设条件知
0.023=P(X>96)=1−Φ(σ96−72),
即
Φ(σ24)=0.977.
因此查表知 24/σ=2,由此解得 σ=12。从而得
X∼N(72,122),
由此所求概率为
P(X≥60)=Φ(1)=0.8413.
设随机变量 X∼N(3,22),
- 求 P(2<X≤5);
- 求 P(∣X∣>2);
- 确定 c 使得 P(X>c)=P(X<c)。
解
(1)
P(2<X≤5)=Φ(1)−Φ(−0.5)=Φ(1)−1+Φ(0.5)=0.5328.
(2)
P(∣X∣>2)=P(X>2)+P(X<−2)=1−Φ(−0.5)+Φ(−2.5)=Φ(0.5)+1−Φ(2.5)=0.6977.
因为
1=P(X>c)+P(X<c),
所以由题设条件 P(X>c)=P(X<c) 得
P(X<c)=0.5,
进而有
2c−3=0,
由此得 c=3。
设随机变量 X∼N(4,32)。
- 求 P(−2<X≤10);
- 求 P(X>3);
- 设 d 满足 P(X>d)≥0.9,问 d 至多为多少?
解
(1)P(−2<X≤10)=Φ(2)−Φ(−2)=2Φ(2)−1=2×0.9772−1=0.9544.
(2)P(X>3)=1−Φ(−31)=Φ(31)=0.6304.
由
0.9≤P(X>d)=Φ(34−d)
查表得
34−d≥1.282,
由此解得 d≤0.154,故 d 至多取 0.154。
测量到某一目标的距离时,发生的随机误差 X(以 m 计)具有密度函数
p(x)=402π1exp{−2⋅402(x−20)2},−∞<x<∞.
求在三次测量中,至少有一次误差的绝对值不超过 30 m 的概率。
解
记 Y 为三次测量中误差的绝对值不超过 30 m 的次数,则 Y∼b(3,p),其中 p 为“一次测量中误差的绝对值不超过 30 m”的概率。由 X∼N(20,402),可知
p=P(−30≤X≤30)=Φ(4010)−Φ(−4050)=Φ(0.25)−1+Φ(1.25)=0.4931.
所以“三次测量中至少有一次误差的绝对值不超过 30 m”的概率为
P(Y≥1)=1−P(Y=0)=1−(1−p)3=1−0.50693=0.8698.
从甲地飞往乙地的航班,每天上午 10:10 起飞,飞行时间 X 服从均值是 4 h、标准差是 20 min 的正态分布。
- 该机在下午 2:30 以后到达乙地的概率是多少?
- 该机在下午 2:20 以前到达乙地的概率是多少?
- 该机在下午 1:50 至 2:30 之间到达乙地的概率是多少?
解
设时间单位为 min,则
X∼N(240,202).
(1)P(X≥260)=1−Φ(20260−240)=1−Φ(1)=1−0.8413=0.1587.
(2)P(X≤250)=Φ(20250−240)=Φ(0.5)=0.6915.
(3)P(220≤X≤260)=2Φ(1)−1=2×0.8413−1=0.6826.
在某场招聘人员的考试中,共有 10000 人报考。假设考试成绩服从正态分布,且已知 90 分以上有 359 人,60 分以下有 1151 人。现按考试成绩从高分到低分依次录用 2500 人,试问被录用者中最低分为多少?
解
记 X 为考试成绩,则 X∼N(μ,σ2)。由频率估计概率知
0.0359=P(X>90)=1−Φ(σ90−μ),0.1151=P(X<60)=Φ(σ60−μ).
上面两式可改写为
0.9641=Φ(σ90−μ),0.8849=Φ(σμ−60).
再查表得
σ90−μ=1.8,σμ−60=1.2.
由此解得
μ=72,σ=10.
设被录用者中最低分为 k,则
0.25=P(X≥k)=1−Φ(10k−72),0.75=Φ(10k−72).
查表得
10k−72≥0.675,
从中解得
k≥78.75.
因此取被录用者中最低分为 78.75 分即可。
**注:**当 p<0.5 时,满足等式 Φ(x)=p 的 x 在标准正态分布函数表上不易查得,故改写此式为 Φ(−x)=1−p>0.5,即可查得 −x。
设随机变量 X 服从正态分布 N(60,32),试求实数 a,b,c,d,使得 X 落在如下五个区间中的概率之比为 7:24:38:24:7:
(−∞,a],(a,b],(b,c],(c,d],(d,∞).
解
由题设条件知
P(X≤a)=0.07,P(X≤b)=0.31,P(X≤c)=0.69,P(X≤d)=0.93.
所以
(1)Φ(3a−60)=0.07⟺Φ(360−a)=0.93⟹360−a=1.48,
由此得 a=55.56。
(2)Φ(3b−60)=0.31⟺Φ(360−b)=0.69⟹360−b=0.495,
由此得 b=58.5。
由 P(X≤c)=0.69,查表得
3c−60=0.495,
由此得 c=61.5。
由 P(X≤d)=0.93,查表得
3d−60=1.48,
由此得 d=64.44。
设随机变量 X 与 Y 均服从正态分布,X 服从正态分布 N(μ,42),Y 服从正态分布 N(μ,52),试比较以下 p1 和 p2 的大小:
p1=P(X≤μ−4),p2=P(Y≥μ+5).
解
因为
p1=P(X≤μ−4)=Φ(−1)=1−Φ(1),
p2=P(Y≥μ+5)=1−Φ(1),
所以 p1 与 p2 一样大。
设随机变量 X 服从正态分布 N(0,σ2),若 P(∣X∣>k)=0.1,试求 P(X<k)。
解
由题设条件知
0.9=P(−k≤X≤k)=Φ(σk)−Φ(−σk)=2Φ(σk)−1.
由此得
Φ(σk)=0.95.
所以
P(X<k)=Φ(σk)=0.95.
设随机变量 X 服从正态分布 N(μ,σ2),试问:随着 σ 的增大,概率 P(∣X−μ∣<σ) 是如何变化的?
解
因为
P(∣X−μ∣<σ)=P(−σ<X−μ<σ)=Φ(1)−Φ(−1)=0.6826,
所以随着 σ 的增大,概率 P(∣X−μ∣<σ) 是不变的。
设随机变量 X 服从参数为 μ=160 和 σ 的正态分布,若要求 P(120<X≤200)≥0.90,允许 σ 最大为多少?
解
由题设条件
0.90≤P(120<X≤200)=2Φ(σ40)−1,
得
Φ(σ40)≥0.95.
从而查表得
σ40≥1.645,
或
σ≤24.32.
这表明 σ 最大为 24.32。
设随机变量 X∼N(μ,σ2),求 E(∣X−μ∣)。
解
利用变换
t=σx−μ
及偶函数性质可得
E(∣X−μ∣)=2πσ1∫−∞∞∣x−μ∣exp{−2σ2(x−μ)2}dx=σπ2∫0∞exp{−2t2}d(2t2)=σπ2.
设随机变量 X∼N(0,σ2),证明
E(∣X∣)=σπ2.
解
在上题中令 μ=0 即可得结论。
设随机变量 X 服从伽马分布 Ga(2,0.5),试求 P(X<4)。
解
伽马分布 Ga(2,0.5) 的密度函数为
p(x)=⎩⎨⎧Γ(2)0.52x2−1e−0.5x,0,x≥0,x<0.
由于 Γ(2)=1,因此所求概率为
P(X<4)=41∫04xe−x/2dx=0.5940.
某地区漏缴税款的比例 X 服从参数 a=2,b=9 的贝塔分布,试求此比例小于 10% 的概率及平均漏缴税款的比例。
解
贝塔分布 Be(2,9) 的密度函数为
p(x)=⎩⎨⎧Γ(2)Γ(9)Γ(2+9)x2−1(1−x)9−1,0,0<x<1,其他.
因为 Γ(2+9)=10!,Γ(2)=1,Γ(9)=8!,所以
Γ(9)Γ(2+9)=90,
因此
P(X<0.1)=90∫00.1x(1−x)8dx=0.2639.
又
E(X)=a+ba=112=0.1818.
某班级学生中数学成绩不及格的比率 X 服从 a=1,b=4 的贝塔分布,试求 P(X>E(X))。
解
贝塔分布 Be(1,4) 的密度函数为
p(x)={4(1−x)3,0,0<x<1,其他.
且由
E(X)=a+ba=51=0.2,
知
P(X>E(X))=∫0.214(1−x)3dx=0.4096.
§2.6 随机变量函数的分布
- 设连续随机变量 X 的密度函数为 pX(x),Y=g(X)。
(1)若 y=g(x) 严格单调,其反函数 h(y) 有连续导函数,则 Y=g(X) 的密度函数为
pY(y)={pX[h(y)]∣h′(y)∣,0,a<y<b,其他,
其中
a=min{g(−∞),g(∞)},b=max{g(−∞),g(∞)}.
(2)若 y=g(x) 在不相重叠的区间 I1,I2,… 上逐段严格单调,其反函数 h1(y),h2(y),… 有连续导函数,则 Y=g(X) 的密度函数为
pY(y)=i∑pX(hi(y))∣hi′(y)∣.
- 正态变量的线性变换仍为正态变量。若随机变量 X 服从正态分布 N(μ,σ2),则当 a=0 时,有
Y=aX+b∼N(aμ+b,a2σ2).
- 对数正态分布
(1)若随机变量 X 的密度函数为
p(x)=⎩⎨⎧2πxσ1exp{−2σ2(lnx−μ)2},0,x>0,x≤0,
则称 X 服从对数正态分布,记为
X∼LN(μ,σ2).
\FigureTwoSeventeen
(2)若 X∼LN(μ,σ2),则
E(X)=eμ+σ2/2,Var(X)=(eσ2−1)e2μ+σ2.
(3)若 X∼LN(μ,σ2),则
Y=lnX∼N(μ,σ2).
- 若随机变量 X∼Ga(α,λ),则当 k>0 时,有
Y=kX∼Ga(α,kλ).
- 若随机变量 X 的分布函数 FX(x) 为严格单调增的连续函数,其反函数 FX−1(y) 存在,则
Y=FX(X)∼U(0,1).
习题与解答 2.6
已知离散随机变量 X 的分布列为
XP−251−161051115133011
试求 Y=X2 与 Z=∣X∣ 的分布列。
解
由 Y=X2 可得
YP051130745193011
其中
P(Y=1)=P(X=−1)+P(X=1)=61+151=307.
由 Z=∣X∣ 可得
ZP051130725133011
其中
P(Z=1)=P(X=−1)+P(X=1)=61+151=307.
已知随机变量 X 的密度函数为
p(x)=π2⋅ex+e−x1,−∞<x<∞,
试求随机变量 Y=g(X) 的概率分布,其中
g(x)={−1,1,x<0,x≥0.
解
因为 p(x) 为偶函数,所以可得
P(X<0)=P(X≥0)=0.5.
由此得
P(Y=−1)=P(X<0)=0.5,P(Y=1)=P(X≥0)=0.5.
所以 Y 的分布列为
YP−10.510.5
设随机变量 X 服从区间 (−1,2) 上的均匀分布,记
Y={1,−1,X≥0,X<0.
试求 Y 的分布列。
解
因为
P(Y=−1)=P(X<0)=31,P(Y=1)=P(X≥0)=32,
所以 Y 的分布列为
YP−131132
设随机变量 X∼U(0,1),试求 1−X 的分布。
解
X 的密度函数为
pX(x)={1,0,0<x<1,其他.
因为 y=g(x)=1−x 在 (0,1) 上为严格单调减函数,其反函数为 x=h(y)=1−y,且
h′(y)=−1,
所以 Y=1−X 的密度函数为
pY(y)={pX(1−y)∣−1∣,0,0<y<1,其他,={1,0,0<y<1,其他.
这表明:当 X∼U(0,1) 时,1−X 与 X 同分布。
设随机变量 X 服从 (−π/2,π/2) 上的均匀分布,求随机变量 Y=cosX 的密度函数 pY(y)。
解
X 的密度函数为
pX(x)=⎩⎨⎧π1,0,−2π<x<2π,其他.
由于 X 在 (−π/2,π/2) 内取值,所以 Y=cosX 的可能取值区间为 (0,1)。在 Y 的可能取值区间外,pY(y)=0。
当 0<y<1 时,使 {Y≤y} 的 x 取值范围为两个互不相交的区间
Δ1=(−2π,−arccosy),Δ2=(arccosy,2π).
故
FY(y)=P(Y≤y)=∫−π/2−arccosyπ1dx+∫arccosyπ/2π1dx.
在上式两端对 y 求导,得
pY(y)=π1−y21+π1−y21=π1−y22,0<y<1.
\FigureTwoEighteen
即
pY(y)=⎩⎨⎧π1−y22,0,0<y<1,其他.
设圆的直径服从区间 (0,1) 上的均匀分布,求圆的面积的密度函数。
解
设圆的直径为 X,则圆的面积
Y=4πX2,
而 X 的密度函数为
pX(x)={1,0,0<x<1,其他.
因为 y=g(x)=πx2/4 在区间 (0,1) 上为严格单调增函数,其反函数为
x=h(y)=π4y,
且
h′(y)=πy1,
所以圆面积 Y=πX2/4 的密度函数为
pY(y)=⎩⎨⎧pX(π4y)πy1,0,0<y<4π,其他,=⎩⎨⎧πy1,0,0<y<4π,其他.
设随机变量 X 服从区间 (1,2) 上的均匀分布,试求 Y=e2X 的密度函数。
解
X 的密度函数为
pX(x)={1,0,1<x<2,其他.
由于 X 在 (1,2) 内取值,所以 Y=e2X 的可能取值区间为 (e2,e4);且 y=g(x)=e2x 在区间 (1,2) 上为严格单调增函数,其反函数为
x=h(y)=2lny,
且
h′(y)=2y1.
所以 Y=e2X 的密度函数为
pY(y)=⎩⎨⎧pX(2lny)2y1,0,e2<y<e4,其他,=⎩⎨⎧2y1,0,e2<y<e4,其他.
设随机变量 X 服从区间 (0,2) 上的均匀分布。
- 求 Y=X2 的密度函数;
- 求 P(Y<2)。
解
X 的密度函数为
pX(x)=⎩⎨⎧21,0,0<x<2,其他.
\text{(1)} Y=X2 的可能取值区间为 (0,4)。因为 y=g(x)=x2 在区间 (0,2) 上为严格单调增函数,其反函数为
x=h(y)=y,
且
h′(y)=2y1,
所以 Y=X2 的密度函数为
pY(y)=⎩⎨⎧pX(y)2y1,0,0<y<4,其他,=⎩⎨⎧4y1,0,0<y<4,其他.
\text{(2)}
P(Y<2)=∫024y1dy=21y02=22.
设随机变量 X 服从区间 (−1,1) 上的均匀分布,求:
- P(∣X∣>21);
- Y=∣X∣ 的密度函数。
解
\text{(1)}
P(∣X∣>21)=P(X>21)+P(X<−21)=∫1/2121dx+∫−1−1/221dx=41+41=0.5.
\text{(2)} 设 FY(y)=P(∣X∣≤y)。当 y<0 时,FY(y)=0;当 y≥1 时,FY(y)=1;当 0≤y<1 时,
FY(y)=P(−y≤X≤y)=∫−yy21dx=y.
所以得
pY(y)={1,0,0<y<1,其他.
设随机变量 X 服从 (0,1) 上的均匀分布,试求以下 Y 的密度函数:
- Y=−2lnX;
- Y=3X+1;
- Y=eX;
- Y=∣lnX∣。
解
X 的密度函数为
pX(x)={1,0,0<x<1,其他.
\text{(1)} 因为 Y 的可能取值区间为 (0,∞),且 y=g(x)=−2lnx 在区间 (0,1) 上为严格单调减函数,其反函数为
x=h(y)=e−0.5y,
且
h′(y)=−0.5e−0.5y,
所以 Y=−2lnX 的密度函数为
pY(y)={pX(e−0.5y)∣−0.5e−0.5y∣,0,y>0,y≤0,={0.5e−0.5y,0,y>0,y≤0.
\text{(2)} 因为 Y 的可能取值区间为 (1,4),且 y=g(x)=3x+1 在区间 (0,1) 上为严格单调增函数,其反函数为
x=h(y)=3y−1,
且
h′(y)=31,
所以 Y=3X+1 的密度函数为
pY(y)=⎩⎨⎧pX(3y−1)31,0,1<y<4,其他,=⎩⎨⎧31,0,1<y<4,其他.
\text{(3)} 因为 Y 的可能取值区间为 (1,e),且 y=g(x)=ex 在区间 (0,1) 上为严格单调增函数,其反函数为
x=h(y)=lny,
且
h′(y)=y1,
所以 Y=eX 的密度函数为
pY(y)=⎩⎨⎧pX(lny)y1,0,1<y<e,其他,=⎩⎨⎧y1,0,1<y<e,其他.
\text{(4)} 因为 Y 的可能取值区间为 (0,∞),且 y=∣lnx∣ 在区间 (0,1) 上为严格单调减函数,其反函数为
x=h(y)=e−y,
且
h′(y)=−e−y,
所以 Y=∣lnX∣ 的密度函数为
pY(y)={pX(e−y)∣−e−y∣,0,y>0,y≤0,={e−y,0,y>0,y≤0.
设随机变量 X 的密度函数为
pX(x)=⎩⎨⎧23x2,0,−1<x<1,其他,
试求下列随机变量的分布:
- Y1=3X;
- Y2=3−X;
- Y3=X2。
解
\text{(1)} 因为 Y1 的可能取值区间为 (−3,3),且 y=g(x)=3x 在区间 (−1,1) 上为严格单调增函数,其反函数为
x=h(y)=3y,
且
h′(y)=31,
所以 Y1=3X 的密度函数为
pY1(y)=⎩⎨⎧pX(y/3)31,0,−3<y<3,其他,=⎩⎨⎧18y2,0,−3<y<3,其他.
\text{(2)} 因为 Y2 的可能取值区间为 (2,4),且 y=g(x)=3−x 在区间 (−1,1) 上为严格单调减函数,其反函数为
x=h(y)=3−y,
且
h′(y)=−1,
所以 Y2=3−X 的密度函数为
pY2(y)={pX(3−y)∣−1∣,0,2<y<4,其他,=⎩⎨⎧23(3−y)2,0,2<y<4,其他.
\text{(3)} 因为 Y3 的可能取值区间为 (0,1),所以在区间 (0,1) 外,Y3 的密度函数为 0。而当 0<y<1 时,Y3 的分布函数为
FY3(y)=P(Y3≤y)=P(X2≤y)=P(−y≤X≤y)=FX(y)−FX(−y).
上式两边关于 y 求导,得
pY3(y)=pX(y)2y1+pX(−y)2y1=23y.
即
pY3(y)=⎩⎨⎧23y,0,0<y<1,其他.
这是贝塔分布 Be(3/2,1)。
解
因为 Y=X2 的可能取值区间为 (0,∞),所以当 y≤0 时,Y 的密度函数为 0。而当 y>0 时,Y 的分布函数为
FY(y)=P(X2≤y)=P(−y≤X≤y)=FX(y)−FX(−y).
对上式两边关于 y 求导,得
pY(y)=pX(y)2y1+pX(−y)2y1=2πσy1exp{−2σ2y}.
即
pY(y)=⎩⎨⎧2πy1/2σ1exp{−2σ2y},0,y>0,其他.
这是伽马分布
Ga(21,2σ21).
设 X∼N(μ,σ2),求 Y=eX 的数学期望与方差。
解
因为 Y=eX 的可能取值范围为 (0,∞),且 y=g(x)=ex 为严格单调增函数,其反函数为
x=h(y)=lny,
及
h′(y)=y1,
所以 Y 的密度函数为
pY(y)=⎩⎨⎧pX(lny)y1,0,y>0,其他,=⎩⎨⎧2πyσ1exp{−2σ2(lny−μ)2},0,y>0,其他.
这是对数正态分布 LN(μ,σ2)。为求其数学期望,采用线性变换
t=σx−μ
可得
E(Y)=2πσ1∫−∞∞exe−2σ2(x−μ)2dx=2πσ1∫−∞∞eσt+μe−t2/2σdt=eμ2π1∫−∞∞e−(t2/2−σt)dt=eμ+σ2/2∫−∞∞2π1e−(t−σ)2/2dt=eμ+σ2/2.
上式最后一个等式成立是因为积分中的被积函数是 N(σ,1) 的密度函数之故。为求 Y 的方差,先求 E(Y2)。施行相同的线性变换,可得
E(Y2)=2πσ1∫−∞∞e2xe−2σ2(x−μ)2dx=2πσ1∫−∞∞e2σt+2μe−t2/2σdt=e2μ2π1∫−∞∞e−(t2/2−2σt)dt=e2μ+2σ2∫−∞∞2π1e−(t−2σ)2/2dt=e2μ+2σ2.
上式最后一个等式成立是因为积分中的被积函数是 N(2σ,1) 的密度函数之故。由此得
Var(Y)=E(Y2)−[E(Y)]2=e2μ+2σ2−[eμ+σ2/2]2=e2μ+σ2(eσ2−1).
设随机变量 X 服从标准正态分布 N(0,1),试求以下 Y 的密度函数:
- Y=∣X∣;
- Y=2X2+1。
解
\text{(1)} Y=∣X∣ 的可能取值范围为 (0,∞),所以当 y≤0 时,Y 的密度函数为 0;当 y>0 时,Y 的分布函数为
FY(y)=P(∣X∣≤y)=P(−y≤X≤y)=FX(y)−FX(−y).
对上式两端关于 y 求导得
pY(y)=pX(y)+pX(−y)=π2e−y2/2.
所以 Y 的密度函数为
pY(y)=⎩⎨⎧π2e−y2/2,0,y>0,其他.
这个分布被称为半正态分布。
\text{(2)} Y=2X2+1 的可能取值范围为 (1,∞),所以当 y≤1 时,Y 的密度函数为 0;当 y>1 时,Y 的分布函数为
FY(y)=P(2X2+1≤y)=P(−2y−1≤X≤2y−1)=FX(2y−1)−FX(−2y−1).
对上式两端关于 y 求导得
pY(y)=pX(2y−1)4(y−1)/21+pX(−2y−1)4(y−1)/21=2π(y−1)1e−(y−1)/4.
所以 Y 的密度函数为
pY(y)=⎩⎨⎧2π(y−1)1e−(y−1)/4,0,y>1,其他.
设随机变量 X 的密度函数为
p(x)={e−x,0,x>0,x≤0.
试求以下 Y 的密度函数:
- Y=2X+1;
- Y=eX;
- Y=X2。
解
\text{(1)} 因为 Y=2X+1 的可能取值范围是 (1,∞),且 y=g(x)=2x+1 是严格单调增函数,其反函数为
x=h(y)=2y−1,
及
h′(y)=21,
所以 Y 的密度函数为
pY(y)=⎩⎨⎧pX(2y−1)21,0,y>1,其他,=⎩⎨⎧21e−(y−1)/2,0,y>1,其他.
\text{(2)} 因为 Y=eX 的可能取值范围是 (1,∞),且 y=g(x)=ex 是严格单调增函数,其反函数为
x=h(y)=lny,
及
h′(y)=y1,
所以 Y 的密度函数为
pY(y)=⎩⎨⎧pX(lny)y1,0,y>1,其他,=⎩⎨⎧y21,0,y>1,其他.
\text{(3)} 因为 Y=X2 的可能取值范围是 (0,∞),且 y=g(x)=x2 在 (0,∞) 上是严格单调增函数,其反函数为
x=h(y)=y,
及
h′(y)=2y1,
所以 Y 的密度函数为
pY(y)=⎩⎨⎧pX(y)2y1,0,y>0,其他,=⎩⎨⎧2y1e−y,0,y>0,其他.
这是韦布尔分布的特例。一般韦布尔分布(记为 W(m,η))的密度函数为
p(y)=⎩⎨⎧ηm(ηy)m−1exp{−(ηy)m},0,y>0,y≤0.
本题结论就是 m=1/2,η=1 时的韦布尔分布 W(1/2,1)。
设随机变量 X 服从参数为 2 的指数分布,试证:Y1=e−2X 和 Y2=1−e−2X 都服从区间 (0,1) 上的均匀分布。
解
因为 X 的密度函数为
pX(x)={2e−2x,0,x>0,其他,
又因为 Y1 的可能取值范围是 (0,1),且 y1=e−2x 是严格单调减函数,其反函数为
x=h(y1)=−0.5lny1,
及
h′(y1)=−y10.5,
所以 Y1 的密度函数为
pY1(y1)=⎩⎨⎧pX(−0.5lny1)−y10.5,0,0<y1<1,其他,={1,0,0<y1<1,其他.
即 Y1∼U(0,1)。又由前面第 4 题知,
Y2=1−e−2X=1−Y1
也服从区间 (0,1) 上的均匀分布。结论得证。
设随机变量 X∼LN(μ,σ2),试证:Y=lnX∼N(μ,σ2)。
解
因为 X 的密度函数为
pX(x)=⎩⎨⎧2πxσ1exp{−2σ2(lnx−μ)2},0,x>0,x≤0,
又因为 Y=lnX 的可能取值范围为 (−∞,∞),且 y=g(x)=lnx 是区间 (0,∞) 上的严格单调增函数,其反函数为
x=h(y)=ey,
及
h′(y)=ey,
所以 Y 的密度函数为
pY(y)=pX(ey)∣ey∣=2πσey1exp{−2σ2(lney−μ)2}ey=2πσ1exp{−2σ2(y−μ)2},
其中 −∞<y<∞。
这正是 N(μ,σ2) 的密度函数。
设随机变量 Y∼LN(5,0.122),试求 P(Y<188.7)。
解
P(Y<188.7)=P(lnY<ln188.7)=Φ(0.125.24−5)=Φ(2)=0.9772.
§2.7 分布的其他特征数
- k 阶矩
(1)称
μk=E(Xk)
为 X 的 k 阶原点矩。一阶原点矩就是数学期望;
(2)称
νk=E(X−E(X))k
为 X 的 k 阶中心矩。二阶中心矩就是方差;
(3)前 k 阶中心矩可用原点矩表示,如
ν1=0,
ν2=μ2−μ12,
ν3=μ3−3μ2μ1+2μ13,
ν4=μ4−4μ3μ1+6μ2μ12−3μ14.
- 变异系数 称比值
Cv(X)=E(X)Var(X)
为 X 的变异系数。变异系数是一个无量纲的量。
- 分位数 设连续随机变量 X 的分布函数为 F(x),密度函数为 p(x)。对任意 p∈(0,1),
(1)称满足条件
F(xp)=∫−∞xpp(x)dx=p
的 xp 为此分布的 p 分位数,又称下侧 p 分位数,它把密度函数下的面积一分为二,左侧面积恰好为 p;
(2)称满足条件
1−F(xp′)=∫xp′∞p(x)dx=p
的 xp′ 为此分布的上侧 p 分位数;
(3)分位数与上侧分位数的转换公式:
xp′=x1−p,xp=x1−p′.
(4)称 p=0.5 时的 p 分位数 x0.5 为此分布的中位数,即 x0.5 满足
F(x0.5)=∫−∞x0.5p(x)dx=0.5.
(5)若随机变量 X 的密度函数 p(x) 是偶函数,则此分布的 p 分位数 xp 满足
xp=−x1−p.
中位数为分布对称中心;
(6)记标准正态分布的 p 分位数为 up。因为标准正态密度函数是偶函数,所以
up=−u1−p.
譬如
u0.25=−u0.75=−0.675;
(7)一般正态分布 N(μ,σ2) 的 p 分位数 xp 满足
xp=μ+σup.
譬如 N(10,22) 的 0.25 分位数为
x0.25=10+2u0.25=8.65;
(8)分布的矩有可能不存在,但连续分布的分位数总存在。p 分位数 xp 总是 p 的增函数。
\setcounter{enumi}{3}
- 偏度系数
(1)称比值
βs=[Var(X)]3/2E(X−E(X))3
为 X 的分布的偏度系数,简称偏度;
(2)偏度系数刻画的是分布的不对称程度,∣βs∣ 愈大,分布的对称性愈差;
(3)任一对称分布的偏度 βs=0。当 βs>0 时,分布为正偏(又称右偏);当 βs<0 时,分布为负偏(又称左偏)。
- 峰度系数
(1)称
βk=[Var(X)]2E(X−E(X))4−3
为 X 的分布的峰度系数,简称峰度;
(2)峰度系数是刻画分布的尖峭性和尾部粗细的一个特征数;
(3)任一正态分布的峰度 βk=0。当 βk<0 时,分布比标准正态分布平坦;当 βk>0 时,分布比标准正态分布更尖峭。
- 偏度与峰度都是描述分布(密度)形状的参数。
习题与解答 2.7
设随机变量 X∼U(a,b),对 k=1,2,3,4,求 μk=E(Xk) 与 νk=E(X−E(X))k,进一步求此分布的偏度系数和峰度系数。
解
因为
E(Xk)=∫abb−axkdx=b−a1⋅k+1bk+1−ak+1,
所以
μ1=E(X)=2a+b,μ2=E(X2)=31(a2+ab+b2),
μ3=E(X3)=41(a3+a2b+ab2+b3),
μ4=E(X4)=51(a4+a3b+a2b2+ab3+b4).
又
ν1=E(X−E(X))=0,ν2=E(X−E(X))2=Var(X)=12(b−a)2,
ν3=μ3−3μ2μ1+2μ13=0,
ν4=μ4−4μ3μ1+6μ2μ12−3μ14=80(b−a)4.
偏度系数和峰度系数分别为
βs=ν23/2ν3=0,βk=ν22ν4−3=[(b−a)2/12]2(b−a)4/80−3=−1.2.
**注:**上述 βs,βk 与 a,b 无关。这表明:任一均匀分布的偏度为 0,峰度为 −1.2。
设随机变量 X∼U(0,a),求此分布的变异系数。
解
因为
E(X)=2a,Var(X)=12a2,
所以此分布的变异系数为
Cv(X)=E(X)Var(X)=a/2a2/12=33=0.5774.
求以下分布的中位数:
- 区间 (a,b) 上的均匀分布;
- 正态分布 N(μ,σ2);
- 对数正态分布 LN(μ,σ2)。
解
\text{(1)} 从
0.5=∫ax0.5b−a1dx
中解得
x0.5=2a+b.
\text{(2)} 记 X∼N(μ,σ2),由
P(X≤μ)=Φ(σμ−μ)=0.5
可得
x0.5=μ.
\text{(3)} 记 Y∼LN(μ,σ2),令 X=lnY,则 X∼N(μ,σ2)。又记 x0.5 为 X 的中位数,y0.5 为 Y 的中位数,则由(2)知 x0.5=μ,即
0.5=P(X≤μ)=P(lnY≤μ)=P(Y≤eμ),
由此得
y0.5=eμ.
设随机变量 X∼Ga(α,λ),对 k=1,2,3,求 μk=E(Xk) 与 νk=E(X−E(X))k。
解
因为
E(Xk)=Γ(α)λα∫0∞xk+α−1e−λxdx=Γ(α)λkΓ(k+α),
所以
μ1=E(X)=λα,μ2=E(X2)=λ2α(α+1),
μ3=E(X3)=λ3α(α+1)(α+2),
ν1=E(X−E(X))=0,ν2=Var(X)=λ2α,
ν3=μ3−3μ2μ1+2μ13=λ32α.
设随机变量 X∼Exp(λ),对 k=1,2,3,4,求 μk=E(Xk) 与 νk=E(X−E(X))k,进一步求此分布的变异系数、偏度系数和峰度系数。
解
因为
E(Xk)=λ∫0∞xke−λxdx=λkk!,
所以
μ1=E(X)=λ1,μ2=E(X2)=λ22,
μ3=E(X3)=λ36,μ4=E(X4)=λ424,
ν1=E(X−E(X))=0,ν2=Var(X)=λ21,
ν3=μ3−3μ2μ1+2μ13=λ32,ν4=μ4−4μ3μ1+6μ2μ12−3μ14=λ49.
此分布的变异系数、偏度系数和峰度系数分别为
Cv(X)=E(X)Var(X)=1/λ1/λ2=1,
βs=ν23/2ν3=[1/λ2]3/22/λ3=2,βk=ν22ν4−3=1/λ49/λ4−3=6.
由此可见:指数分布的变异系数、偏度系数与峰度系数均与参数 λ 无关。它永远是正偏、尖峰。
设随机变量 X 服从正态分布 N(10,9),试求 x0.1 和 x0.9。
解
一般正态分布 N(μ,σ2) 的 p 分位数 xp 与标准正态分布的 p 分位数 up 间满足关系式
xp=μ+σup,
所以
x0.1=10+3u0.1=10+3×(−1.282)=6.154,
x0.9=10+3u0.9=10+3×1.282=13.846.
设随机变量 X 服从双参数韦布尔分布,其分布函数为
F(x)=1−exp{−(ηx)m},x>0,
其中 η>0,m>0。试写出该分布的 p 分位数 xp 的表达式,且求出当 m=1.5,η=1000 时的 x0.1,x0.5,x0.8 的值。
解
因为 p 分位数 xp 满足
1−exp{−(ηxp)m}=p,
解之得
xp=η[−ln(1−p)]1/m.
将 m=1.5,η=1000 代入上式,可得
x0.1=1000(−ln0.9)1/1.5=223.08,
x0.5=1000(−ln0.5)1/1.5=783.22,
x0.8=1000(−ln0.2)1/1.5=1373.36.
自由度为 2 的 χ2 分布的密度函数为
p(x)=21e−x/2,x>0.
试求出其分布函数及分位数 x0.1,x0.5,x0.8。
解
此分布的分布函数 F(x) 为
当 x≤0 时,F(x)=0;
当 x>0 时,
F(x)=P(X≤x)=∫0x21e−t/2dt=1−e−x/2.
所以此分布的 p 分位数 xp 满足
p=F(xp)=1−e−xp/2,
从中解得
xp=−2ln(1−p).
由此得
x0.1=−2ln0.9=0.211,x0.5=−2ln0.5=1.386,x0.8=−2ln0.2=3.219.
设随机变量 X 的密度函数 p(x) 关于直线 x=c 是对称的,且 E(X) 存在,试证:
- 这个对称中心 c 既是均值又是中位数,即 E(X)=x0.5=c;
- 如果 c=0,则 xp=−x1−p。
解
\text{(1)} 由 p(x) 关于直线 x=c 对称可知
p(c+x)=p(c−x),−∞<x<∞,
因此
E(X−c)=∫−∞∞(x−c)p(x)dx=∫−∞∞tp(t+c)dt=∫−∞∞tp(c−t)dt=∫−∞∞(c−y)p(y)dy=E(c−X),
所以得 E(X)=c。又由
0.5=∫−∞x0.5p(x)dx=∫−∞x0.5−cp(c+y)dy=∫−∞x0.5−cp(c−y)dy=∫2c−x0.5∞p(t)dt=∫x0.5∞p(x)dx,
所以
2c−x0.5=x0.5,
由此得
x0.5=c.
\text{(2)} 当 c=0 时,
p=∫−∞xpp(x)dx=∫−xp∞p(−y)dy=∫−xp∞p(y)dy=1−F(−xp),
又由
F(−xp)=1−p,
即
−xp=x1−p,
由此得结论。
试证随机变量 X 的偏度系数与峰度系数对位移和改变比例尺是不变的,即对任意的实数 a,b(b=0),Y=a+bX 与 X 有相同的偏度系数与峰度系数。
解
因为
E(Y)=E[a+bX]=a+bE(X),
所以
{E[Y−E(Y)]2}3/2E[Y−E(Y)]3={E[a+bX−a−bE(X)]2}3/2E[a+bX−a−bE(X)]3={E[X−E(X)]2}3/2E[X−E(X)]3,
即 Y 与 X 有相同的偏度系数。又因为
{E[Y−E(Y)]2}2E[Y−E(Y)]4={E[a+bX−a−bE(X)]2}2E[a+bX−a−bE(X)]4={E[X−E(X)]2}2E[X−E(X)]4,
所以 Y 与 X 有相同的峰度系数。
设某项维修时间 T(单位:分)服从对数正态分布 LN(μ,σ2)。
- 求 p 分位数 tp;
- 若 μ=4.1271,求该分布的中位数;
- 若 μ=4.1271,σ=1.0364,求完成 95% 维修任务的时间。
解
因为 T∼LN(μ,σ2),所以 X=lnT∼N(μ,σ2)。记 xp 为 N(μ,σ2) 的 p 分位数,up 为 N(0,1) 的 p 分位数,则由
p=P(X≤xp)=Φ(σxp−μ)=Φ(up)
知
xp=μ+σup.
\text{(1)} 因为
p=P(X≤xp)=P(lnT≤xp)=P(T≤exp),
所以
tp=exp=exp{μ+σup}.
\text{(2)} 由本节习题 3(3)知
t0.5=e4.1271=62.
\text{(3)} 因为 u0.95=1.645,所以当 μ=4.1271,σ=1.0364 时,完成 95% 的维修任务的时间 t0.95 为
t0.95=exp{4.1271+1.0364×1.645}=341.
某种绝缘材料的使用寿命 T(单位:小时)服从对数正态分布 LN(μ,σ2)。若已知分位数 t0.2=5000 小时,t0.8=65000 小时,求 μ 和 σ。
解
由上一题知对数正态分布 LN(μ,σ2) 的 p 分位数为
tp=exp{μ+σup},
其中 up 为标准正态分布 N(0,1) 的 p 分位数,所以根据题意有
5000=t0.2=exp{μ+σu0.2},
65000=t0.8=exp{μ+σu0.8}.
将
u0.2=−0.845,u0.8=0.845
代入上面两式,可解得
μ=9.7997,σ=1.5178.
某厂决定按过去生产状况对月生产额最高的 5% 的工人发放高产奖。已知过去每人每月生产额 X(单位:千克)服从正态分布 N(4000,602),试问高产奖发放标准应把生产额定为多少?
解
根据题意知,求满足
P(X>k)=0.05
的 k,即 k=x0.95,其中 x0.95 为分布 N(4000,602) 的 95% 分位数。又记 up 为标准正态分布 N(0,1) 的 p 分位数,则由
xp=μ+σup,
及 u0.95=1.645 可得
x0.95=4000+60×1.645=4098.7.
因此可将高产奖发放标准定在生产额为 4099 千克。
补充习题及解答
解
E(∣X−μ∣k)=2πσ1∫−∞∞∣x−μ∣ke−2σ2(x−μ)2dx.
若令
y=σx−μ,σdy=dx,
可得
E(∣X−μ∣k)=2π1∫−∞∞σk∣y∣ke−y2/2dy=π2∫0∞σkyke−y2/2dy.
再令
2y2=t,y=(2t)1/2,dy=(2t)−1/2dt,
可得
E(∣X−μ∣k)=πσk2k/2∫0∞tk/2−1/2e−tdt=πσk2k/2Γ(2k+1).
当 k 为偶数时,
E(∣X−μ∣k)=(k−1)!!σk;
当 k 为奇数时,
E(∣X−μ∣k)=(k−1)!!σkπ2.
其中 n!! 表示不超过 n 且与 n 有相同奇偶性的所有正整数的乘积。
设随机变量 X 服从参数为 λ 的泊松分布,试求 X 的前四阶原点矩、中心矩、偏度与峰度。
解
分几步进行。
(1)先求 k 阶原点矩的递推公式。按定义
μk=x=0∑∞xkx!λxe−λ,λ>0.
显然 μ0=1,而当 k≥1 时有
μk=x=1∑∞[(x−1)+1]k−1(x−1)!λxe−λ=λx=1∑∞i=0∑k−1(ik−1)(x−1)i(x−1)!λx−1e−λ=λi=0∑k−1(ik−1)μi.
(2)由此递推公式可导出前四阶原点矩。
μ1=λμ0=λ.
μ2=λ(μ0+μ1)=λ(1+λ).
μ3=λ(μ0+2μ1+μ2)=λ(1+3λ+λ2).
μ4=λ(μ0+3μ1+3μ2+μ3)=λ[1+3λ+3λ(1+λ)+λ(λ2+3λ+1)]=λ(1+7λ+6λ2+λ3).
(3)再计算前四阶中心矩:
ν1=0,ν2=λ.
ν3=μ3−3μ2μ1+2μ13=λ(1+3λ+λ2)−3λ2(1+λ)+2λ3=λ.
ν4=μ4−4μ3μ1+6μ2μ12−3μ14=λ(1+7λ+6λ2+λ3)−4λ2(1+3λ+λ2)+6λ3(1+λ)−3λ4=λ(1+3λ).
(4)最后计算偏度 βs 与峰度 βk:
βs=ν23/2ν3=λ3/2λ=λ1>0.
所以泊松分布是正偏分布,λ 愈小偏度愈大。
βk=ν22ν4−3=λ2λ(1+3λ)−3=λ1>0.
所以泊松分布比标准正态分布更尖峭一些,λ 愈小分布愈尖峭。
设随机变量 X 服从二项分布 b(n,p),试求 X 的前四阶原点矩、中心矩、偏度与峰度。
解
分几步进行。
(1)先求 k 阶原点矩的递推公式。记
Jk(n)=x=0∑nxk(xn)px(1−p)n−x.
显然有
J0(n)=J0(n−i)=1,i=1,2,…,n,
而当 k≥1 时有
Jk(n)=npx=1∑n[(x−1)+1]k−1(x−1n−1)px−1(1−p)n−x=npx=1∑ni=0∑k−1(ik−1)(x−1)i(x−1n−1)px−1(1−p)(n−1)−(x−1)=npi=0∑k−1(ik−1)Ji(n−1).
(2)由此递推公式可导出前四阶原点矩。
μ1=J1(n)=npJ0(n−1)=np.
μ2=J2(n)=np[J0(n−1)+J1(n−1)]=np[1+(n−1)p].
μ3=J3(n)=np[J0(n−1)+2J1(n−1)+J2(n−1)]=np{1+2(n−1)p+(n−1)p[1+(n−2)p]}=np[1+3(n−1)p+(n−1)(n−2)p2].
μ4=J4(n)=np[J0(n−1)+3J1(n−1)+3J2(n−1)+J3(n−1)]=np[1+7(n−1)p+6(n−1)(n−2)p2+(n−1)(n−2)(n−3)p3].
(3)再计算前四阶中心矩:
ν1=0.
ν2=np(1−p).
ν3=μ3−3μ2μ1+2μ13=np[1+3(n−1)p+(n−1)(n−2)p2]−3n2p2[1+(n−1)p]+2n3p3=np(1−p)(1−2p).
ν4=μ4−4μ3μ1+6μ2μ12−3μ14=np(1−p)[1+3(n−2)p(1−p)].
(4)最后计算偏度 βs 与峰度 βk:
βs=ν23/2ν3=np(1−p)1−2p=⎩⎨⎧0,=0,<0,p<21,p=21,p>21.
由此可见:二项分布在 p=1/2 时是对称分布;当 p<1/2 时,二项分布正偏;当 p>1/2 时,二项分布负偏。
βk=ν22ν4−3=n2p2(1−p)2np(1−p)[1+3(n−2)p(1−p)]−3=np(1−p)1−n6=n1(p(1−p)1−6).
更细致地讨论会发现:
(i)当 p 在区间
[0.5−63,0.5+63]≈[0.21,0.79]
内,βk≤0,此时二项分布比标准正态分布更平坦,譬如在 p=0.5 时,
βk=−n2<0,
此时二项分布是对称的,且比标准正态分布更平坦;
(ii)当 p 在区间
[0.5−63,0.5+63]
外,βk>0,此时二项分布比标准正态分布更尖峭。
评论
支持 Markdown 和 LaTeX 数学公式。