§2.1 随机变量及其分布
依赖于
被以下题目直接调用
正文部分
§2.1 随机变量及其分布
- 随机变量 定义在样本空间 Ω 上的实值函数 X=X(ω) 称为随机变量。
- 仅取有限个或可列个值的随机变量称为离散随机变量;
- 取值充满某个区间 (a,b) 的随机变量称为连续随机变量,这里 a 可为 −∞,b 可为 ∞。
- 分布函数 设 X 是一个随机变量,对任意实数 x,称
F(x)=P(X≤x)
为 X 的分布函数,记为 X∼F(x)。分布函数具有如下三条基本性质:
- 单调性 F(x) 是单调非减函数,即对任意的 x1<x2,有 F(x1)≤F(x2)。
- 有界性 对任意的 x,有 0≤F(x)≤1,且
F(−∞)=x→−∞limF(x)=0,F(∞)=x→∞limF(x)=1.
- 右连续性 F(x) 是 x 的右连续函数,即对任意的 x0,有
x→x0+0limF(x)=F(x0),即F(x0+0)=F(x0).
反之,可以证明:具有上述三条性质的函数 F(x) 一定是某一个随机变量的分布函数。
- 离散随机变量的概率分布列 若离散随机变量 X 的可能取值是 x1,x2,⋯,xn,⋯,则称 X 取 xi 的概率
pi=p(xi)=P(X=xi),i=1,2,⋯,n,⋯
为 X 的概率分布列,简称分布列。分布列也可用列表方式表示:
| X | x1 | x2 | ⋯ | xn | ⋯ |
|---|
| P | p(x1) | p(x2) | ⋯ | p(xn) | ⋯ |
分布列 p(xi) 具有如下两条基本性质:
- 非负性:p(xi)≥0,i=1,2,⋯;
- 正则性:
i=1∑∞p(xi)=1.
离散随机变量 X 的分布函数为
F(x)=xi≤x∑p(xi),
它是有限级或可列无限级阶梯函数。离散随机变量 X 取值于区间 (a,b] 上的概率为
P(a<X≤b)=F(b)−F(a).
常数 c 可看作仅取一个值的随机变量 X,即 P(X=c)=1,它的分布常称为单点分布或退化分布。
- 连续随机变量的概率密度函数 记连续随机变量 X 的分布函数为 F(x),若存在一个非负可积函数 p(x),使得对任意实数 x,有
F(x)=∫−∞xp(t)dt,
则称 p(x) 为 X 的概率密度函数,简称为密度函数或密度。密度函数 p(x) 具有如下两条基本性质:
- 非负性:p(x)≥0;
- 正则性:
∫−∞∞p(x)dx=1.
连续随机变量 X 的分布函数 F(x) 是 (−∞,∞) 上的连续函数,它可能在有限个点或可列个点上不可导,除此以外,有
F′(x)=p(x).
连续随机变量 X 仅取一点值的概率恒为零,从而有
P(a≤X≤b)=P(a<X≤b)=P(a≤X<b)=P(a<X<b)=∫abp(x)dx.
这给计算带来很大方便。
连续随机变量 X 的密度函数不唯一,但它们必几乎处处相等,即它们不相等处的点组成的集合的概率为零。
- 分布在离散场合可以是分布列或分布函数,这时称为离散分布;在连续场合可以是密度函数或分布函数,这时称为连续分布。常用的是这两类分布,但还存在既非离散又非连续的分布。
- 设随机变量 X 的分布函数为 F(x),则可用 F(x) 表示下列概率:
- P(X≤a)=F(a);
- P(X<a)=F(a−0);
- P(X>a)=1−P(X≤a)=1−F(a);
- P(X=a)=P(X≤a)−P(X<a)=F(a)−F(a−0);
- P(X≥a)=1−P(X<a)=1−F(a−0);
- P(∣X∣<a)=P(−a<X<a)=P(X<a)−P(X≤−a)=F(a−0)−F(−a).
习题与解答 2.1
口袋中有 5 个球,编号为 1,2,3,4,5。从中任取 3 个,以 X 表示取出的 3 个球中的最大号码。
- 试求 X 的分布列;
- 写出 X 的分布函数,并作图。
解
**(1)**从 5 个球中任取 3 个,共有
(35)=10
种等可能取法。X 为取出的 3 个球中的最大号码,则 X 的可能取值为 3,4,5。因为
P(X=i)=P(X≤i)−P(X≤i−1),
且当 i≥3 时,有
P(X≤i)=10(3i),
所以
P(X=3)=P(X≤3)−P(X≤2)=10(33)−0=101,
P(X=4)=P(X≤4)−P(X≤3)=10(34)−101=103,
P(X=5)=P(X≤5)−P(X≤4)=1−10(34)=106.
所以 X 的分布列为
**(2)**由分布函数的定义知
F(x)=P(X≤x)=⎩⎨⎧0,0.1,0.4,1,x<3,3≤x<4,4≤x<5,x≥5.
F(x) 的图形如图 2.1。
图 2.1
一颗骰子抛两次,求以下随机变量的分布列:
- X 表示两次中所得的最小点数;
- Y 表示两次所得点数之差的绝对值。
解
**(1)**一颗骰子抛两次,共有 36 种等可能的结果。X 表示两次中所得的最小点数,则 X 的可能取值为 1,2,3,4,5,6。由确定概率的古典方法得
P(X=1)=3611,P(X=2)=369,P(X=3)=367,
P(X=4)=365,P(X=5)=363,P(X=6)=361.
将以上计算结果列表为
| X | 1 | 2 | 3 | 4 | 5 | 6 |
|---|
| P | 3611 | 369 | 367 | 365 | 363 | 361 |
**(2)**因为 Y 表示两次所得点数之差的绝对值,所以 Y 的可能取值为 0,1,2,3,4,5。而
P(Y=0)=366=61,P(Y=1)=3610=185,P(Y=2)=368=92,
P(Y=3)=366=61,P(Y=4)=364=91,P(Y=5)=362=181.
将以上计算结果列表为
| Y | 0 | 1 | 2 | 3 | 4 | 5 |
|---|
| P | 61 | 185 | 92 | 61 | 91 | 181 |
口袋中有 7 个白球、3 个黑球。
- 每次从中任取一个不放回,求首次取出白球时的取球次数 X 的概率分布列;
- 如果取出的是黑球则不放回,而另外放入一个白球,求此时 X 的概率分布列。
解
X 为首次取到白球时的取球次数,则 X 的可能取值为 1,2,3,4。记 Ai 为“第 i 次取出的球为黑球”,i=1,2,⋯,10。
**(1)**由乘法公式可得
P(X=1)=P(Aˉ1)=107,
P(X=2)=P(A1Aˉ2)=P(A1)P(Aˉ2∣A1)=103×97=307,
P(X=3)=P(A1A2Aˉ3)=103×92×87=1207,
P(X=4)=P(A1A2A3Aˉ4)=103×92×81×77=1201.
将以上计算结果列表为
**(2)**如果取出黑球不放回,而另外放入一个白球,那么由乘法公式得
P(X=1)=P(Aˉ1)=107,
P(X=2)=P(A1Aˉ2)=103×108=256,
P(X=3)=P(A1A2Aˉ3)=103×102×109=50027,
P(X=4)=P(A1A2A3Aˉ4)=103×102×101×1010=5003.
将以上计算结果列表为
| X | 1 | 2 | 3 | 4 |
|---|
| P | 107 | 256 | 50027 | 5003 |
有 3 个盒子,第一个盒子装有 1 个白球、4 个黑球;第二个盒子装有 2 个白球、3 个黑球;第三个盒子装有 3 个白球、2 个黑球。现任取一个盒子,从中任取 3 个球,以 X 表示所取到的白球数。
- 试求 X 的概率分布列;
- 取到的白球数不少于 2 个的概率是多少?
解
**(1)**记 Ai 为“取到第 i 个盒子”,i=1,2,3。由全概率公式得
P(X=0)=P(A1)P(X=0∣A1)+P(A2)P(X=0∣A2)+P(A3)P(X=0∣A3)=31⋅(35)(34)+31⋅(35)(33)+31⋅0=61,
P(X=1)=P(A1)P(X=1∣A1)+P(A2)P(X=1∣A2)+P(A3)P(X=1∣A3)=31⋅(35)(11)(24)+31⋅(35)(12)(23)+31⋅(35)(13)(22)=21,
P(X=2)=P(A1)P(X=2∣A1)+P(A2)P(X=2∣A2)+P(A3)P(X=2∣A3)=31⋅0+31⋅(35)(22)(13)+31⋅(35)(23)(12)=103,
P(X=3)=P(A1)P(X=3∣A1)+P(A2)P(X=3∣A2)+P(A3)P(X=3∣A3)=31⋅0+31⋅0+31⋅(35)(33)=301.
将以上计算结果列表为
(2)
P(X≥2)=P(X=2)+P(X=3)=31.
掷一颗骰子 4 次,求点数 6 出现的次数的概率分布.
解
记 X 为掷 4 次中点数 6 出现的次数,则 X 的可能取值为 0,1,2,3,4.由确定概率的古典方法得
P(X=0)P(X=1)P(X=2)P(X=3)P(X=4)=6454=0.4823,=(14)6453=0.3858,=(24)6452=0.1157,=(34)645=0.0154,=641=0.0008.
将以上结果列表为
| X | 0 | 1 | 2 | 3 | 4 |
|---|
| P | 0.4823 | 0.3858 | 0.1157 | 0.0154 | 0.0008 |
由以上的计算结果也可以看出:出现 0 次 6 点的可能性最大.
从一副 52 张的扑克牌中任取 5 张,求其中黑桃张数的概率分布.
解
记 X 为取出的 5 张牌中黑桃的张数,则 X 的可能取值为 0,1,2,3,4,5. 将 52 张牌分成两类:一类为 13 张黑桃,另一类为 39 张除黑桃外的其他花色,则由抽样模型得
P(X=k)=(552)(k13)(5−k39),k=0,1,2,3,4,5.
一批产品共有 100 件,其中 10 件是不合格品.根据验收规则,从中任取 5 件产品进行质量检验,假如 5 件中无不合格品,则这批产品被接收,否则就要重新对这批产品逐个检验.
- 试求 5 件中不合格品数 X 的分布列;
- 需要对这批产品进行逐个检验的概率是多少?
解
(1) X 的分布列为
P(X=i)=(5100)(i10)(5−i90),i=0,1,2,3,4,5.
计算结果列表略.
(2)“需要对这批产品进行逐个检验”则意味着“检验 5 个产品,至少有一个不合格品”,因此所求概率为
P(X≥1)=1−P(X=0)=1−(5100)(590)=0.4162.
设随机变量 X 的分布函数为
F(x)=⎩⎨⎧0,41,31,21,1,x<0,0≤x<1,1≤x<3,3≤x<6,x≥6.
试求 X 的概率分布列及 P(X<3),P(X≤3),P(X>1),P(X≥1).
解
X 的概率分布列为
P(X<3)P(X≤3)P(X>1)P(X≥1)=P(X=0)+P(X=1)=31,=1−P(X=6)=21,=P(X=3)+P(X=6)=32,=1−P(X=0)=43.
设随机变量 X 的分布函数为
F(x)=⎩⎨⎧0,lnx,1,x<1,1≤x<e,x≥e.
试求 P(X<2),P(0<X≤3),P(2<X<2.5).
解
这里 X 是连续随机变量,所求概率分别为
P(X<2)P(0<X≤3)P(2<X<2.5)=F(2)=ln2=0.6931,=F(3)−F(0)=1,=F(2.5)−F(2)=ln2.5−ln2=0.2231.
若 P(X≥x1)=1−α,P(X≤x2)=1−β, 其中 x1<x2, 试求 P(x1≤X≤x2).
解
P(x1≤X≤x2)=1−P(X<x1)−P(X>x2)=1−α−β.
从 1,2,3,4,5 五个数中任取三个,按大小排列记为 x1<x2<x3, 令 X=x2, 试求
- X 的分布函数;
- P(X<2) 及 P(X>4).
解
(1) 因为 X 的分布列为
所以 X 的分布函数为
F(x)=⎩⎨⎧0,103,107,1,x<2,2≤x<3,3≤x<4,x≥4.
(2)
P(X<2)=F(2−0)=0,P(X>4)=1−F(4)=1−1=0.
设随机变量 X 的密度函数为
p(x)={1−∣x∣,0,−1≤x≤1,其他.
试求 X 的分布函数.
解
由于密度函数 p(x) 在 (−∞,∞) 上分为四段(如图 2.2),所以其分布函数也要分四段设立,具体如下:
当 x<−1 时,F(x)当 −1≤x<0 时,F(x)当 0≤x<1 时,F(x)当 x≥1 时,F(x)=∫−∞x0dt=0;=∫−1x(1+t)dt=2x2+x+21;=∫−10(1+t)dt+∫0x(1−t)dt=−2x2+x+21;=∫−10(1+t)dt+∫01(1−t)dt=1.
综上所述,X 的分布函数为
F(x)=⎩⎨⎧0,2x2+x+21,−2x2+x+21,1,x<−1,−1≤x<0,0≤x<1,x≥1.
\FigureTwoTwo
如果随机变量 X 的密度函数为
p(x)=⎩⎨⎧x,2−x,0,0≤x<1,1≤x<2,其他.
试求 P(X≤1.5).
解
因为密度函数 p(x) 的图形如图 2.3,因此所求概率为
P(X≤1.5)=∫01xdx+∫11.5(2−x)dx=0.875.
\FigureTwoThree
设随机变量 X 的密度函数为
p(x)=⎩⎨⎧Acosx,0,∣x∣≤2π,∣x∣>2π.
试求
- 系数 A;
- X 落在区间 (0,π/4) 内的概率.
解
(1) 因为
1=∫−∞∞p(x)dx=A∫−π/2π/2cosxdx=Asinx−π/2π/2=2A,
由此解得
A=21.
(2) 所求概率为
p=∫0π/421cosxdx=21sinx0π/4=42.
设连续随机变量 X 的分布函数为
F(x)=⎩⎨⎧0,Ax2,1,x<0,0≤x<1,x≥1.
试求
- 系数 A;
- X 落在区间 (0.3,0.7) 内的概率;
- X 的密度函数.
解
(1) 由 F(x) 的连续性,有
1=F(1)=x→1−0limF(x)=x→1−0limAx2=A,
由此解得 A=1.
(2)
P(0.3<X<0.7)=F(0.7)−F(0.3)=0.72−0.32=0.4.
(3) X 的密度函数(如图 2.4)为
p(x)=F′(x)={2x,0,0<x<1,其他.
\FigureTwoFour
学生完成一道作业题的时间 X 是一个随机变量,单位为小时.它的密度函数为
p(x)={cx2+x,0,0≤x≤0.5,其他.
- 确定常数 c;
- 写出 X 的分布函数;
- 试求在 20 min 内完成一道作业题的概率;
- 试求在 10 min 以上完成一道作业题的概率.
解
(1) 因为
1=∫00.5(cx2+x)dx=(3cx3+21x2)00.5=24c+81,
由此解得
c=21.
(2) 当 x<0 时,
F(x)=∫−∞x0dt=0;
当 0≤x<0.5 时,
F(x)=∫0x(21t2+t)dt=7x3+21x2;
当 x≥0.5 时,
F(x)=∫00.5(21t2+t)dt=1.
所以 X 的分布函数为
F(x)=⎩⎨⎧0,7x3+21x2,1,x<0,0≤x<0.5,x≥0.5.
(3) 所求概率为
P(X≤31)=F(31)=277+181=5417.
(4) 所求概率为
P(X>61)=1−F(61)=1−(2167+721)=108103.
某加油站每周补给一次油,如果这个加油站每周的销售量(单位:千升)为一随机变量,其密度函数为
p(x)=⎩⎨⎧0.05(1−100x)4,0,0<x<100,其他.
试问该油站的储油罐需要多大,才能把一周内断油的概率控制在 5% 以下?
解
记 X 为该油站每周的销售量,k 为该油站储油罐的最大储油量.则由题意知 k 应该满足
P(X>k)≤0.05.
这等价于 P(X≤k)≥0.95,因此由
P(X≤k)=∫0k0.05(1−100x)4dx=1−(1−100k)5≥0.95
中解得
k≥45.072 千升.
所以可取 k=46 千升即可将一周内断油的概率控制在 5% 以下.
设随机变量 X 和 Y 同分布,X 的密度函数为
p(x)=⎩⎨⎧83x2,0,0<x<2,其他.
已知事件 A={X>a} 和 B={Y>a} 独立,且 P(A∪B)=3/4, 求常数 a.
解
由同分布可得 P(A)=P(B),从而
43=P(A∪B)=P(A)+P(B)−P(AB)=2P(A)−[P(A)]2,
由此解得 P(A)=0.5,进而由
0.5=P(A)=P(X>a)=∫a283x2dx=81x3a2=1−81a3,
解得
a=34=1.5874.
注:随机变量 X 与 Y 同分布,并不意味着 X=Y, 反之成立,即 X=Y, 则 X 与 Y 同分布.
设连续随机变量 X 的密度函数 p(x) 是一个偶函数,F(x) 为 X 的分布函数,求证对任意实数 a>0,有
- F(−a)=1−F(a)=0.5−∫0ap(x)dx;
- P(∣X∣<a)=2F(a)−1;
- P(∣X∣>a)=2[1−F(a)].
解
因为 p(x) 是一个偶函数,所以 p(−x)=p(x),且从
1=∫−∞∞p(x)dx=2∫0∞p(x)dx,
可得
∫0∞p(x)dx=0.5.
(1) 在
F(−a)=∫−∞−ap(x)dx
中令 x=−t,则
F(−a)=∫∞ap(t)(−dt)=∫a∞p(t)dt=1−F(a),
所以
F(−a)=∫a∞p(t)dt=∫0∞p(t)dt−∫0ap(x)dx=0.5−∫0ap(x)dx.
(2)
P(∣X∣<a)=P(−a<X<a)=F(a)−F(−a)=F(a)−[1−F(a)]=2F(a)−1.
(3)
P(∣X∣>a)=P(X<−a)+P(X>a)=F(−a)+1−F(a)=1−F(a)+1−F(a)=2[1−F(a)].
补充习题及解答
设连续随机变量 X 的密度函数 p(x) 关于直线 x=c 是对称的,证明:其分布函数 F(x) 满足
F(c−x)=1−F(c+x),−∞<x<∞.
解
由 p(x) 关于直线 x=c 是对称的,知
p(c−x)=p(c+x),−∞<x<∞.
由
F(c−x)=P(X≤c−x)=∫−∞c−xp(t)dt,
对上式右端积分作变量变换 y=c−t,则
F(c−x)=∫∞xp(c−y)(−dy)=∫x∞p(c−y)dy=∫x∞p(c+y)dy,
再对上式右端积分作变量变换 z=c+y,则
F(c−x)=∫c+x∞p(z)dz=1−∫−∞c+xp(z)dz=1−F(c+x).
结论得证.
对称分布函数的这个性质可用图 2.5 表示:
\FigureTwoFive
设 F1(x) 与 F2(x) 都是分布函数,又 a 和 b 是两个正常数,且 a+b=1.证明:
F(x)=aF1(x)+bF2(x)
也是一个分布函数.
解
为此要验证 F(x) 具有分布函数的三个基本性质.
(1) 单调性.因为 F1(x) 与 F2(x) 都是分布函数,故当 x1<x2 时,有
F1(x1)≤F1(x2),F2(x1)≤F2(x2),
于是
F(x1)=aF1(x1)+bF2(x1)≤aF1(x2)+bF2(x2)=F(x2).
(2) 有界性.对任意的 x,有 0≤F(x)≤1,且
F(−∞)=aF1(−∞)+bF2(−∞)=0,
F(∞)=aF1(∞)+bF2(∞)=a+b=1.
(3) 右连续性.
F(x+0)=aF1(x+0)+bF2(x+0)=aF1(x)+bF2(x)=F(x).
讨论:若取 a=b=1/2,又令
F1(x)={0,1,x<0,x≥0,F2(x)=⎩⎨⎧0,x,1,x<0,0≤x<1,x≥1,
由此可得 F1(x) 与 F2(x) 的凸组合的分布函数为(如图 2.6)
F(x)=aF1(x)+bF2(x)=⎩⎨⎧0,21+x,1,x<0,0≤x<1,x≥1.
显然,F(x) 不是连续函数,故 F(x) 对应的随机变量不是连续随机变量.又因为 F(x) 不是阶梯函数,故 F(x) 对应的随机变量不是离散随机变量.用上述凸组合方法可以构造很多既非离散又非连续的随机变量及其分布函数.
\FigureTwoSix
评论
支持 Markdown 和 LaTeX 数学公式。