03-第三章 多维随机变量及其分布
依赖于
被以下题目直接调用
正文部分
§3.1 多维随机变量及其联合分布
- n 维随机变量 若
X1(ω),X2(ω),⋯,Xn(ω)
是定义在同一个样本空间 Ω={ω} 上的 n 个随机变量,则称
X(ω)=(X1(ω),X2(ω),⋯,Xn(ω))
为 n 维随机变量,或 n 元随机变量,或随机向量。
- 联合分布函数 对任意的 n 个实数 x1,x2,⋯,xn,n 个事件
{X1≤x1},{X2≤x2},⋯,{Xn≤xn}
同时发生的概率
F(x1,x2,⋯,xn)=P(X1≤x1,X2≤x2,⋯,Xn≤xn)
称为 n 维随机变量 (X1,X2,⋯,Xn) 的联合分布函数。
二维随机变量 (X,Y) 的联合分布函数
F(x,y)=P(X≤x,Y≤y)
具有如下四条基本性质:
- 单调性 F(x,y) 分别对 x 或 y 是单调不减的;
- 有界性 对任意的 x 和 y,有
0≤F(x,y)≤1,
且
F(−∞,y)=F(x,−∞)=0,F(∞,∞)=1;
- 右连续性 对每个变量都是右连续的,即
F(x+0,y)=F(x,y),F(x,y+0)=F(x,y);
- 非负性 对任意的 a<b,c<d 有
P(a<X≤b,c<Y≤d)=F(b,d)−F(a,d)−F(b,c)+F(a,c)≥0.
可以证明:具有上述四条性质的二元函数 F(x,y) 一定是某个二维随机变量的分布函数。注意:事件 {X≤x,Y≤y} 常可用平面上的无穷直角区域表示。
- 联合分布列 若 (X,Y) 只取有限个或可列个数对 (xi,yj),则称 (X,Y) 为二维离散随机变量,称
pij=P(X=xi,Y=yj),i,j=1,2,⋯
为 (X,Y) 的联合分布列。联合分布列也可用下表格形式表示:
Xx1x2⋮xi⋮\multicolumn5cYy1p11p21⋮pi1⋮y2p12p22⋮pi2⋮⋯⋯⋯⋯yjp1jp2j⋮pij⋮⋯⋯⋯⋯
联合分布列的基本性质:
- 非负性:
pij≥0;
- 正规性:
i=1∑∞j=1∑∞pij=1.
- 联合密度函数 若存在二元非负函数 p(x,y),使得二维随机变量 (X,Y) 的分布函数 F(x,y) 可表示为
F(x,y)=∫−∞x∫−∞yp(u,v)dvdu,
则称 (X,Y) 为二维连续随机变量,称 p(x,y) 为 (X,Y) 的联合密度函数。
联合密度函数的基本性质:
- 非负性:
p(x,y)≥0;
- 正规性:
∫−∞∞∫−∞∞p(x,y)dxdy=1.
在 F(x,y) 偏导数存在的点上有
p(x,y)=∂x∂y∂2F(x,y).
若 G 为平面上的一个区域,则有
P((X,Y)∈G)=∬Gp(x,y)dxdy.
- 多项分布 在 n 次独立重复试验中,若每次试验有 r 个互不相容的结果:
A1,A2,⋯,Ar,
且每次试验中 Ai 发生的概率为
pi=P(Ai),i=1,2,⋯,r,p1+p2+⋯+pr=1,
记 Xi 为 n 次独立重复试验中 Ai 出现的次数,i=1,2,⋯,r,则 (X1,X2,⋯,Xr) 服从多项分布,又称 r 项分布,记为
M(n,p1,p2,⋯,pr),
其联合分布列为
P(X1=n1,X2=n2,⋯,Xr=nr)=n1!n2!⋯nr!n!p1n1p2n2⋯prnr,
其中
n=n1+n2+⋯+nr.
当 r=2 时,即为二项分布。
- 多维超几何分布 有 N 个对象,共分 r 类,其中第 i 类对象有 Ni 个,
N=N1+N2+⋯+Nr.
从中随机取出 n 个,若记 Xi 为取出的 n 个对象中第 i 类对象的个数,i=1,2,⋯,r,则 (X1,X2,⋯,Xr) 服从 r 维超几何分布,其联合分布列为
P(X1=n1,X2=n2,⋯,Xr=nr)=(nN)(n1N1)(n2N2)⋯(nrNr),
其中
n1+n2+⋯+nr=n,ni≤Ni,i=1,2,⋯,r.
- 多维均匀分布 设 D 为 Rn 中的一个有界区域,其度量(平面上的为面积,空间中的为体积等)为 SD,若多维随机变量 (X1,X2,⋯,Xn) 的联合密度函数为
p(x1,x2,⋯,xn)=⎩⎨⎧SD1,0,(x1,x2,⋯,xn)∈D,其他,
则称 (X1,X2,⋯,Xn) 服从 D 上的多维均匀分布,记为
(X1,X2,⋯,Xn)∼U(D).
- 二元正态分布 若二维随机变量 (X,Y) 的联合密度函数为
p(x,y)=2πσ1σ21−ρ21exp{−2(1−ρ2)1[σ12(x−μ1)2−2ρσ1σ2(x−μ1)(y−μ2)+σ22(y−μ2)2]},
其中
−∞<x,y<∞,
则称 (X,Y) 服从二元正态分布,记为
(X,Y)∼N(μ1,μ2,σ12,σ22,ρ),
其中
E(X)=μ1,E(Y)=μ2,Var(X)=σ12,Var(Y)=σ22,−1≤ρ≤1.
习题与解答 3.1
100 件产品中有 50 件一等品、30 件二等品、20 件三等品。从中任取 5 件,以 X,Y 分别表示取出的 5 件中一等品、二等品的件数,在以下情况下求 (X,Y) 的联合分布列:
- 不放回抽取;
- 有放回抽取。
解
\text{(1)} 这是一个三维超几何分布,若取出的 5 件中有 i 件一等品、j 件二等品,则有 5−i−j 件三等品,所以当
i=0,1,⋯,5,j=0,1,⋯,5,i+j≤5
时,有
P(X=i,Y=j)=(5100)(i50)(j30)(5−i−j20).
用表格形式表示如下:
X\Y012345列和00.000210.003220.018550.049460.061180.028140.1607610.001930.022710.092740.156200.091770.000000.3653520.006590.054890.141560.113250.000000.000000.3162930.010240.053930.066060.000000.000000.000000.1302340.007280.018200.000000.000000.000000.000000.0254850.001890.000000.000000.000000.000000.000000.00189行和0.028140.152950.318910.318910.152950.028141.00000
- 行和就是 X 的分布 h(5,100,50)(超几何分布)。
- 列和就是 Y 的分布 h(5,100,30)(超几何分布)。
- P(X≥2,Y≥1)=0.66158。
\text{(2)} 这是一个三项分布,若取出的 5 件中有 i 件一等品、j 件二等品,则有 5−i−j 件三等品,所以当
i=0,1,⋯,5,j=0,1,⋯,5,i+j≤5
时,有
P(X=i,Y=j)=i!j!(5−i−j)!5!0.5i0.3j0.25−i−j.
用表格形式表示如下:
X\Y012345列和00.000320.004000.020000.050000.062500.031250.1680710.002400.024000.090000.150000.093750.000000.3601520.007200.054000.135000.112500.000000.000000.3087030.010800.054000.067500.000000.000000.000000.1323040.008100.020250.000000.000000.000000.000000.0283550.002430.000000.000000.000000.000000.000000.00243行和0.031250.156250.312500.312500.156250.031251.00000
- 行和就是 X 的分布 b(5,0.5)。
- 列和就是 Y 的分布 b(5,0.3)。
- P(X≥2,Y≥1)=0.09+0.135+0.0675+0.15+0.1125+0.09375=0.64875。
盒子里装有 3 个黑球、2 个红球、2 个白球,从中任取 4 个,以 X 表示取到黑球的个数,以 Y 表示取到红球的个数,求 P(X=Y)。
解
P(X=Y)=P(X=1,Y=1)+P(X=2,Y=2)=(47)(13)(12)(22)+(47)(23)(22)(02)=356+353=359=0.2571.
口袋中有 5 个白球、8 个黑球,从中不放回地一个接一个取出 3 个。若第 i 次取出的是白球,则令 Xi=1,否则令 Xi=0,i=1,2,3。求
- (X1,X2,X3) 的联合分布列;
- (X1,X2) 的联合分布列。
解
\text{(1)}
P(X1=0,X2=0,X3=0)=13×12×118×7×6=0.1958,
P(X1=0,X2=0,X3=1)=P(X1=0,X2=1,X3=0)=P(X1=1,X2=0,X3=0)=13×12×118×7×5=0.1632,
P(X1=0,X2=1,X3=1)=P(X1=1,X2=0,X3=1)=P(X1=1,X2=1,X3=0)=13×12×115×4×8=0.0932,
P(X1=1,X2=1,X3=1)=13×12×115×4×3=0.0350.
将以上计算结果列表为
X100001111X200110011X301010101P0.19580.16320.16320.09320.16320.09320.09320.0350
\text{(2)}
P(X1=0,X2=0)=13×128×7=3914,
P(X1=0,X2=1)=P(X1=1,X2=0)=13×128×5=3910,
P(X1=1,X2=1)=13×125×4=395.
将以上计算结果列表为
X1\X20103914391013910395
设随机变量 Xi,i=1,2 的分布列如下,且满足 P(X1X2=0)=1,试求 P(X1=X2)。
XiP−10.2500.510.25
解
记 (X1,X2) 的联合分布列为
X1\X2−101−1p11p21p310p12p22p321p13p23p33
由 P(X1X2=0)=1 知
p12+p21+p22+p23+p32=1,
所以
p11=p13=p31=p33=0,
即
X1\X2−101−10p2100p12p22p3210p230
又因为
0.25=P(X1=−1)=P(X1=−1,X2=−1)+P(X1=−1,X2=0)+P(X1=−1,X2=1)=p11+p12+p13=p12,
同理由
P(X1=1)=P(X2=−1)=P(X2=1)=0.25
可知
p32=p21=p23=0.25,
即
X1\X2−101−100.25000.25p220.25100.250
又由分布列的正规性得
p22=0,
因此
P(X1=X2)=p11+p22+p33=0.
设随机变量 (X,Y) 的联合密度函数为
p(x,y)={k(6−x−y),0,0<x<2, 2<y<4,其他.
试求
- 常数 k;
- P(X<1,Y<3);
- P(X<1.5);
- P(X+Y≤4)。
解
\text{(1)} 由
∫02∫24k(6−x−y)dydx=k∫02(6−2x)dx=8k=1,
解得
k=81.
\text{(2)}
P(X<1,Y<3)=81∫01∫23(6−x−y)dydx=81∫01(3.5−x)dx=83.
\text{(3)}
P(X<1.5)=81∫01.5∫24(6−x−y)dydx=81∫01.5(6−2x)dx=3227.
\text{(4)} p(x,y) 的非零区域与 {x+y≤4} 的交集如图 3.1 的阴影部分,
P(X+Y≤4)=81∫02∫24−x(6−x−y)dydx=81∫02(0.5x2−4x+6)dx=32.
\FigureThreeOne
设随机变量 (X,Y) 的联合密度函数为
p(x,y)={ke−(3x+4y),0,x>0, y>0,其他.
试求
- 常数 k;
- (X,Y) 的联合分布函数 F(x,y);
- P(0<X≤1,0<Y≤2)。
解
\text{(1)} 由
k∫0∞∫0∞e−(3x+4y)dxdy=k(∫0∞e−3xdx)(∫0∞e−4ydy)=k⋅31⋅41=12k=1,
解得
k=12.
\text{(2)} 当 x≤0 或 y≤0 时,有
F(x,y)=0.
而当 x>0,y>0 时,
F(x,y)=12∫0x∫0ye−(3t1+4t2)dt2dt1=12∫0xe−3t1dt1∫0ye−4t2dt2=(1−e−3x)(1−e−4y).
所以
F(x,y)={(1−e−3x)(1−e−4y),0,x>0, y>0,其他.
\text{(3)}
P(0<X≤1,0<Y≤2)=F(1,2)=1−e−3−e−8+e−11=0.9499.
设二维随机变量 (X,Y) 的联合密度函数为
p(x,y)={4xy,0,0<x<1, 0<y<1,其他.
试求
- P(0<X<0.5,0.25<Y<1);
- P(X=Y);
- P(X<Y);
- (X,Y) 的联合分布函数。
解
\text{(1)}
P(0<X<0.5,0.25<Y<1)=4∫00.5xdx∫0.251ydy=4×81×3215=6415.
\text{(2)}
P(X=Y)=0.
\text{(3)}
P(X<Y)=4∫01∫0yxydxdy=4∫0121y3dy=4×81=0.5.
\text{(4)} (X,Y) 的联合分布函数 F(x,y) 要分如下 5 个区域表示:
F(x,y)=⎩⎨⎧0,x2y2,x2,y2,1,x<0, 或 y<0,0≤x<1, 0≤y<1,0≤x<1, 1≤y,1≤x, 0≤y<1,x≥1, y≥1.
设二维随机变量 (X,Y) 在边长为 2、中心为 (0,0) 的正方形区域内服从均匀分布,试求 P(X2+Y2≤1)。
解
记
D={(x,y):−1≤x,y≤1},G={(x,y):x2+y2≤1}.
因为 (X,Y) 服从 D 上的均匀分布,且 D 的面积
SD=4,
G 的面积
SG=π,
所以所求概率为
P(X2+Y2≤1)=SDSG=4π.
设二维随机变量 (X,Y) 的联合密度函数为
p(x,y)={k,0,0<x2<y<x<1,其他.
试求常数 k,并求 P(X>0.5) 和 P(Y<0.5)。
解
\text{(1)} p(x,y) 的非零区域如图 3.2(a) 阴影部分,由
k∫01∫x2xdydx=k∫01(x−x2)dx=6k=1,
解得
k=6.
\text{(2)} p(x,y) 的非零区域与 {x>0.5} 的交集为图 3.2(b) 阴影部分,所以
P(X>0.5)=6∫0.51∫x2xdydx=6∫0.51(x−x2)dx=21.
又因为 p(x,y) 的非零区域与 {y<0.5} 的交集为图 3.2(c) 阴影部分,所以
P(Y<0.5)=6∫00.5∫yydxdy=6∫00.5(y−y)dy=2−43=0.6642.
\FigureThreeTwo
设二维随机变量 (X,Y) 的联合密度函数为
p(x,y)={6(1−y),0,0<x<y<1,其他.
求
- P(X>0.5,Y>0.5);
- P(X<0.5);
- P(Y<0.5);
- P(X+Y<1)。
解
\text{(1)} p(x,y) 的非零区域与 {x>0.5,y>0.5} 的交集为图 3.3(a) 阴影部分,所以
P(X>0.5,Y>0.5)=6∫0.51∫0.5y(1−y)dxdy=6∫0.51(−y2+1.5y−0.5)dy=81.
\text{(2)} p(x,y) 的非零区域与 {x<0.5} 的交集为图 3.3(b) 阴影部分,所以
P(X<0.5)=6∫00.5∫x1(1−y)dydx=6∫00.5(21x2−x+21)dx=87.
\text{(3)} 又因为 p(x,y) 的非零区域与 {y<0.5} 的交集为图 3.3(c) 阴影部分,所以
P(Y<0.5)=6∫00.5∫x0.5(1−y)dydx=6∫00.5(21x2−x+83)dx=21.
\text{(4)} p(x,y) 的非零区域与 {x+y<1} 的交集为图 3.3(d) 阴影部分,所以
P(X+Y<1)=6∫00.5∫x1−x(1−y)dydx=6∫00.5(21−x)dx=43.
\FigureThreeThree
设随机变量 Y 服从参数为 λ=1 的指数分布,定义随机变量 Xk 如下:
Xk={0,1,Y≤k,Y>k,k=1,2.
求 X1 和 X2 的联合分布列。
解
(X1,X2) 的联合分布列共有如下 4 种情况:
P(X1=0,X2=0)=P(Y≤1,Y≤2)=P(Y≤1)=1−e−1=0.63212,
P(X1=0,X2=1)=P(Y≤1,Y>2)=0,
P(X1=1,X2=0)=P(Y>1,Y≤2)=P(1≤Y≤2)=e−1−e−2=0.23254,
P(X1=1,X2=1)=P(Y>1,Y>2)=P(Y>2)=1−P(Y≤2)=e−2=0.13534.
所以 (X1,X2) 的联合分布列为
X1\X20100.632120.2325410.000000.13534
设二维随机变量 (X,Y) 的联合密度函数为
p(x,y)=⎩⎨⎧x2+3xy,0,0<x<1, 0<y<2,其他.
求 P(X+Y≥1)。
解
p(x,y) 的非零区域与 {x+y≥1} 的交集为图 3.4 阴影部分,所以
P(X+Y≥1)=∫01∫1−x2(x2+3xy)dydx=∫01(x2y+6xy2)1−x2dx=∫01(65x3+34x2+21x)dx=(245x4+94x3+41x2)01=7265.
\FigureThreeFour
设二维随机变量 (X,Y) 的联合密度函数为
p(x,y)={e−y,0,0<x<y,其他.
试求 P(X+Y≤1)。
解
p(x,y) 的非零区域与 {x+y≤1} 的交集为图 3.5 阴影部分,所以
P(X+Y≤1)=∫00.5∫x1−xe−ydydx=∫00.5(−e−y)x1−xdx=∫00.5(e−x−e−(1−x))dx=1+e−1−2e−0.5=0.1548.
\FigureThreeFive
设二维随机变量 (X,Y) 的联合密度函数为
p(x,y)=⎩⎨⎧21,0,0<x<1, 0<y<2,其他.
求 X 与 Y 中至少有一个小于 0.5 的概率。
解
两事件 {X<0.5} 与 {Y<0.5} 中至少有一个发生的概率为
P({X<0.5}∪{Y<0.5})=1−P(X≥0.5,Y≥0.5)=1−∫0.51∫0.5221dydx=85.
从 (0,1) 中随机地取两个数,求其积不小于 3/16,且其和不大于 1 的概率。
解
设取出的两个数分别为 X 和 Y,则 (X,Y) 的联合密度函数为
p(x,y)={1,0,0<x<1, 0<y<1,其他.
因为 p(x,y) 的非零区域与
{xy≥163, x+y≤1}
的交集为图 3.6 阴影部分,所以
P(XY≥163,X+Y≤1)=∫1/43/4∫3/(16x)1−xdydx=∫1/43/4(1−x−16x3)dx=(x−21x2−163lnx)1/43/4=41−163ln3=0.0440.
\FigureThreeSix
补充习题及解答
设二维随机变量 (X,Y) 的联合分布函数为 F(x,y),试用 F(x,y) 表示下列概率:
- P(a<X≤b,c<Y≤d);
- P(a≤X<b,c≤Y≤d);
- P(a≤X≤b,Y<c);
- P(X=a,Y>b);
- P(X<−∞,Y<∞)。
解
1.
P(a<X≤b,c<Y≤d)=F(b,d)−F(b,c)−F(a,d)+F(a,c).
-
P(a≤X<b,c≤Y≤d)=P(X<b,Y≤d)−P(X<b,Y<c)−P(X<a,Y≤d)+P(X<a,Y<c)=F(b−0,d)−F(b−0,c−0)−F(a−0,d)+F(a−0,c−0).
-
P(a≤X≤b,Y<c)=P(X≤b,Y<c)−P(X<a,Y<c)=F(b,c−0)−F(a−0,c−0).
-
P(X=a,Y>b)=P(X≤a,Y<∞)−P(X≤a,Y≤b)−P(X<a,Y<∞)+P(X<a,Y≤b)=F(a,∞)−F(a,b)−F(a−0,∞)+F(a−0,b).
-
P(X<−∞,Y<∞)=0.
一个电子设备含有两个主要元件,分别以 X 和 Y 表示这两个主要元件的寿命(单位:h)。若设其联合分布函数为
F(x,y)={0,1−e−0.01x−e−0.01y+e−0.01(x+y),x<0 或 y<0,x≥0 且 y≥0,
试求这两个元件的寿命都超过 120 h 的概率。
解
所求概率为
P(X>120,Y>120)=1−P({X≤120}∪{Y≤120})=1−P(X≤120)−P(Y≤120)+P(X≤120,Y≤120)=1−F(120,∞)−F(∞,120)+F(120,120)=1−(1−e−1.2)−(1−e−1.2)+(1−2e−1.2+e−2.4)=e−2.4=0.0907.
这表明:两个主要元件的寿命都超过 120 h 的概率为 0.0907。
§3.2 边际分布与随机变量的独立性
- 边际分布函数 若二维随机变量 (X,Y) 的联合分布函数为 F(x,y),则称
FX(x)=F(x,∞)=y→∞limF(x,y),−∞<x<∞
为 X 的边际分布,称
FY(y)=F(∞,y)=x→∞limF(x,y),−∞<y<∞
为 Y 的边际分布。
- 边际分布列 若二维离散随机变量 (X,Y) 的联合分布列为 {pij},则称
pi⋅=j=1∑∞pij,i=1,2,⋯
为 X 的边际分布列。称
p⋅j=i=1∑∞pij,j=1,2,⋯
为 Y 的边际分布列。
- 边际密度函数 若二维连续随机变量 (X,Y) 的联合密度函数为 p(x,y),则称
pX(x)=∫−∞∞p(x,y)dy,−∞<x<∞
为 X 的边际密度函数,称
pY(y)=∫−∞∞p(x,y)dx,−∞<y<∞
为 Y 的边际密度函数。
- 一些注意点
- 由高维联合分布可以获得低维的边际分布,反之不一定。
- 不同的联合分布可以有相同边际分布。
- 多项分布的边际分布仍为低维的多项分布或二项分布。
- 二维正态分布的边际分布为一维正态分布。
- 随机变量间的独立性
- 设 n 维随机变量 (X1,X2,⋯,Xn) 的联合分布函数为
F(x1,x2,⋯,xn),
且 $F_i(x_i)$ 为 $X_i$ 的边际分布函数。若对任意 $n$ 个实数 $x_1,x_2,\cdots,x_n$,有
F(x1,x2,⋯,xn)=i=1∏nFi(xi),
则称 $X_1,X_2,\cdots,X_n$ 相互独立。
- 设 n 维离散随机变量 (X1,X2,⋯,Xn) 的联合分布列为
P(X1=x1,X2=x2,⋯,Xn=xn),
且 $P(X_i=x_i)$ 为 $X_i$ 的边际分布列,$i=1,2,\cdots,n$。若对其任意 $n$ 个取值 $x_1,x_2,\cdots,x_n$,有
P(X1=x1,X2=x2,⋯,Xn=xn)=i=1∏nP(Xi=xi),
则称 $X_1,X_2,\cdots,X_n$ 相互独立。
- 设 n 维连续随机变量 (X1,X2,⋯,Xn) 的联合密度函数为
p(x1,x2,⋯,xn),
且 $p_i(x_i)$ 为 $X_i$ 的边际密度函数。若对任意 $n$ 个实数 $x_1,x_2,\cdots,x_n$,有
p(x1,x2,⋯,xn)=i=1∏npi(xi),
则称 $X_1,X_2,\cdots,X_n$ 相互独立。
- 一些注意点
- 多维随机变量间相互独立,必导致其部分随机变量与另一部分随机变量相互独立。
- 多维随机变量相互独立,其联合分布可由其边际分布唯一确定。
- 多维随机变量间的独立性可以从定义出发加以判别,也可从实际背景加以判别。
- 多维随机变量间的独立性假设,可给理论研究和实际运用带来很多方便之处。
习题与解答 3.2
设二维离散随机变量 (X,Y) 的可能取值为
(0,0),(−1,1),(−1,2),(1,0),
且取这些值的概率依次为 1/6,1/3,1/12,5/12,试求 X 与 Y 各自的边际分布列。
解
由题设条件知,(X,Y) 的联合分布列为
X\Y−101006112513100212100
在上面表格中按行相加,得 X 的边际分布列;按列相加,得 Y 的边际分布列,即
XP−11250611125YP01271312121
设二维随机变量 (X,Y) 的联合分布函数为
F(x,y)={1−e−λ1x−e−λ2y+e−λ1x−λ2y−λ12max{x,y},0,x>0, y>0,其他.
试求 X 和 Y 各自的边际分布函数。
解
因为
y→∞lim{1−e−λ1x−e−λ2y+e−λ1x−λ2y−λ12max{x,y}}=1−e−λ1x,
x→∞lim{1−e−λ1x−e−λ2y+e−λ1x−λ2y−λ12max{x,y}}=1−e−λ2y,
所以 X 和 Y 各自的边际分布函数为
FX(x)=F(x,∞)=y→∞limF(x,y)={1−e−λ1x,0,x>0,其他,
FY(y)=F(∞,y)=x→∞limF(x,y)={1−e−λ2y,0,y>0,其他.
可见,这两个边际分布都是指数分布,但这两个分布对应的随机变量不相互独立。
试求以下二维均匀分布的边际分布:
p(x,y)=⎩⎨⎧π1,0,x2+y2≤1,其他.
解
因为在 p(x,y) 的非零区域内,当 −1<x<1 时,有
−1−x2<y<1−x2,
所以当 −1<x<1 时,有
pX(x)=∫−∞∞p(x,y)dy=∫−1−x21−x2π1dy=π21−x2,
所以 X 的边际密度函数为
pX(x)=⎩⎨⎧π21−x2,0,−1<x<1,其他.
又因为在 p(x,y) 的非零区域内,当 −1<y<1 时,有
−1−y2<x<1−y2,
所以当 −1<y<1 时,有
pY(y)=∫−∞∞p(x,y)dx=∫−1−y21−y2π1dx=π21−y2,
所以 Y 的边际密度函数为
pY(y)=⎩⎨⎧π21−y2,0,−1<y<1,其他.
可见,这两个随机变量不相互独立。
设平面区域 D 由曲线 y=1/x 及直线 y=0,x=1,x=e2 所围成,二维随机变量 (X,Y) 在区域 D 上服从均匀分布,试求 X 的边际密度函数。
解
因为区域 D 的面积为(如图 3.7)
SD=∫1e2∫01/xdydx=∫1e2x1dx=(lnx)1e2=2.
又因为 (X,Y) 服从 D 上的均匀分布,所以 (X,Y) 的联合密度函数为
p(x,y)=⎩⎨⎧21,0,1<x<e2, 0<y<1/x,其他.
由此得,当 1<x<e2 时,
pX(x)=∫−∞∞p(x,y)dy=∫01/x21dy=2x1.
所以 X 的边际密度函数为
pX(x)=⎩⎨⎧2x1,0,1<x<e2,其他.
若此题要求出 Y 的边际密度,则从图 3.7 中可以看出:当 0<y<e−2 时,有
pY(y)=∫1e221dx=21(e2−1).
当 e−2<y<1 时,有
pY(y)=∫11/y21dx=21(y1−1).
所以 Y 的边际密度函数为
pY(y)=⎩⎨⎧21(e2−1),21(y1−1),0,0<y<e−2,e−2<y<1,其他.
\FigureThreeSeven
求以下给出的 (X,Y) 的联合密度函数的边际密度函数 pX(x) 和 pY(y):
1.
p(x,y)={e−y,0,0<x<y,其他;
-
p(x,y)=⎩⎨⎧45(x2+y),0,0<y<1−x2,其他;
-
p(x,y)=⎩⎨⎧x1,0,0<y<x<1,其他.
解
\text{(1)} 当 x>0 时,有
pX(x)=∫x∞e−ydy=e−x,
所以 X 的边际密度函数为
pX(x)={e−x,0,x>0,其他,
这是指数分布 Exp(1)。
而当 y>0 时,有
pY(y)=∫0ye−ydx=ye−y,
所以 Y 的边际密度函数为
pY(y)={ye−y,0,y>0,其他,
这是伽马分布 Ga(2,1)。
\text{(2)} 因为 p(x,y) 的非零区域为图 3.8 阴影部分,所以当 −1<x<1 时,有
pX(x)=∫01−x245(x2+y)dy=45x2(1−x2)+85(1−x2)2=85(1−x4),
所以 X 的边际密度函数为
pX(x)=⎩⎨⎧85(1−x4),0,−1<x<1,其他.
又因为当 0<y<1 时,有
pY(y)=∫−1−y1−y45(x2+y)dx=[125x3]−1−y1−y+410y1−y=651−y(1+2y),
所以 Y 的边际密度函数为
pY(y)=⎩⎨⎧651−y(1+2y),0,0<y<1,其他.
\FigureThreeEight
\text{(3)} 当 0<x<1 时,
pX(x)=∫0xx1dy=1,
所以 X 的边际密度函数为
pX(x)={1,0,0<x<1,其他.
又当 0<y<1 时,
pY(y)=∫y1x1dx=−lny,
所以 Y 的边际密度函数为
pY(y)={−lny,0,0<y<1,其他.
设二维随机变量 (X,Y) 的联合密度函数为
p(x,y)={6,0,0<x2<y<x<1,其他.
试求边际密度函数 pX(x) 和 pY(y)。
解
因为 p(x,y) 的非零区域如习题与解答 3.1 第 9 题图 3.2(a) 所示,所以当 0<x<1 时,有
pX(x)=∫x2x6dy=6(x−x2),
所以 X 的边际密度函数为
pX(x)={6(x−x2),0,0<x<1,其他.
这是贝塔分布 Be(2,2)。
又因为当 0<y<1 时,有
pY(y)=∫yy6dx=6(y−y),
所以 Y 的边际密度函数为
pY(y)={6(y−y),0,0<y<1,其他.
试验证:以下给出的两个不同的联合密度函数,它们有相同的边际密度函数。
p(x,y)={x+y,0,0≤x≤1, 0≤y≤1,其他;
g(x,y)={(0.5+x)(0.5+y),0,0≤x≤1, 0≤y≤1,其他.
解
因为当 0<x<1 时,有
pX(x)=∫01p(x,y)dy=∫01(x+y)dy=x+0.5,
gX(x)=∫01g(x,y)dy=∫01(0.5+x)(0.5+y)dy=x+0.5.
又因为当 0<y<1 时,有
pY(y)=∫01p(x,y)dx=∫01(x+y)dx=y+0.5,
gY(y)=∫01g(x,y)dx=∫01(0.5+x)(0.5+y)dx=y+0.5.
所以 p(x,y) 与 g(x,y) 有相同的边际密度函数。
设随机变量 X 和 Y 独立同分布,且
P(X=−1)=P(Y=−1)=P(X=1)=P(Y=1)=21.
试求 P(X=Y)。
解
利用独立性可得
P(X=Y)=P(X=−1,Y=−1)+P(X=1,Y=1)=P(X=−1)P(Y=−1)+P(X=1)P(Y=1)=41+41=0.5.
甲、乙两人独立地各进行两次射击,假设甲的命中率为 0.2,乙的命中率为 0.5,以 X 和 Y 分别表示甲和乙的命中次数,试求 P(X≤Y)。
解
因为当 i=0,1,2,j=0,1,2 时,有
P(X=i,Y=j)=P(X=i)P(Y=j)=(i2)0.2i0.82−i(j2)0.5j0.52−j,
所以 (X,Y) 的联合分布列为
X\Y01200.160.080.0110.320.160.0220.160.080.01
由此得
P(X≤Y)=0.16+0.32+0.16+0.16+0.08+0.01=0.89.
设随机变量 X 与 Y 相互独立,其联合分布列为
x1x2y1a91y291by3c31
试求联合分布列中的 a,b,c。
解
先对联合分布列按行、按列求和,求出边际分布列如下:
X\Yx1x2P(Y=yj)y1a91a+91y291bb+91y3c31c+31P(X=xi)a+c+91b+941
由 X 与 Y 的独立性,从上表的第 2 行、第 2 列知
b=(b+94)(b+91),
从中解得
b=92.
再从上表的第 2 行、第 1 列知
91=(b+94)(a+91),
从中解得
a=181.
最后由联合分布列的正规性知
a+b+c=94,
由此得
c=61.
设 X 与 Y 是两个相互独立的随机变量,X∼U(0,1),Y∼Exp(1)。试求
- X 与 Y 的联合密度函数;
- P(Y≤X);
- P(X+Y≤1)。
解
\text{(1)} 因为 X 与 Y 的密度函数分别为
pX(x)={1,0,0<x<1,其他,pY(y)={e−y,0,y>0,其他,
所以由 X 与 Y 的独立性知,X 与 Y 的联合密度函数为
p(x,y)=pX(x)pY(y)={e−y,0,0<x<1, y>0,其他.
\text{(2)}
P(Y≤X)=∫01∫0xe−ydydx=∫01(1−e−x)dx=1−(−e−x)01=e−1.
\text{(3)}
P(X+Y≤1)=∫01∫01−xe−ydydx=∫01[1−e−(1−x)]dx=1−(ex−1)01=e−1.
设随机变量 (X,Y) 的联合密度函数为
p(x,y)={3x,0,0<y<x<1,其他.
试求:
- 边际密度函数 pX(x) 和 pY(y);
- X 与 Y 是否独立?
解
\text{(1)} 因为当 0<x<1 时,有
pX(x)=∫−∞∞p(x,y)dy=∫0x3xdy=3x2,
所以 X 的边际密度函数为
pX(x)={3x2,0,0<x<1,其他.
这是贝塔分布 Be(3,1)。
又因为当 0<y<1 时,有
pY(y)=∫−∞∞p(x,y)dx=∫y13xdx=(23x2)y1=23(1−y2),
所以 Y 的边际密度函数为
pY(y)=⎩⎨⎧23(1−y2),0,0<y<1,其他.
\text{(2)} 因为
p(x,y)=pX(x)pY(y),
所以 X 与 Y 不独立。
设随机变量 (X,Y) 的联合密度函数为
p(x,y)={1,0,∣x∣<y, 0<y<1,其他.
试求:
- 边际密度函数 pX(x) 和 pY(y);
- X 与 Y 是否独立?
解
\text{(1)} 因为 p(x,y) 的非零区域为图 3.9 的阴影部分,所以,当 −1<x<0 时,有
pX(x)=∫−x1dy=1+x,
当 0<x<1 时,有
pX(x)=∫x1dy=1−x,
因此 X 的边际密度函数为
pX(x)=⎩⎨⎧1+x,1−x,0,−1<x<0,0<x<1,其他.
又当 0<y<1 时,有
pY(y)=∫−yydx=2y,
因此 Y 的边际密度函数为
pY(y)={2y,0,0<y<1,其他.
这是贝塔分布 Be(2,1)。
\text{(2)} 因为
p(x,y)=pX(x)pY(y),
所以 X 与 Y 不独立。
\FigureThreeNine
设二维随机变量 (X,Y) 的联合密度函数如下,试问 X 与 Y 是否相互独立?
1.
p(x,y)={xe−(x+y),0,x>0, y>0,其他;
-
p(x,y)=π2(1+x2)(1+y2)1,−∞<x,y<∞;
-
p(x,y)={2,0,0<x<y<1,其他;
-
p(x,y)={24xy,0,0<x<1, 0<y<1, 0<x+y<1,其他;
-
p(x,y)={12xy(1−x),0,0<x<1, 0<y<1,其他;
-
p(x,y)=⎩⎨⎧421x2y,0,x2<y<1,其他.
解
\text{(1)} 当 x>0 时,
pX(x)=∫0∞xe−(x+y)dy=xe−x;
而当 y>0 时,
pY(y)=∫0∞xe−(x+y)dx=e−y.
所以由
p(x,y)=pX(x)pY(y)
知 X 与 Y 相互独立。
**注意:**上述状态称为变量 X 与 Y 的密度函数是可分离的,它有两方面含义,一是指
p(x,y)=pX(x)pY(y),
二是指 p(x,y) 的非零区域亦可分离为两个一维区域的乘积空间。
\text{(2)} 因为
**(3)**当 0<x<1 时,
pX(x)=∫x12dy=2(1−x);
而当 0<y<1 时,
pY(y)=∫0y2dx=2y.
所以由 p(x,y)=pX(x)pY(y),知 X 与 Y 不相互独立。实际上,由于 p(x,y) 的非零区域不可分离,就可看出 X 与 Y 不相互独立。
**(4)**当 0<x<1 时,
pX(x)=∫01−x24xydy=12x(1−x)2;
而当 0<y<1 时,
pY(y)=∫01−y24xydx=12y(1−y)2.
所以由 p(x,y)=pX(x)pY(y),知 X 与 Y 不相互独立。
**(5)**当 0<x<1 时,
pX(x)=∫0112xy(1−x)dy=6x(1−x);
而当 0<y<1 时,
pY(y)=∫0112xy(1−x)dx=2y.
所以由 p(x,y)=pX(x)pY(y),知 X 与 Y 相互独立。
**(6)**当 −1<x<1 时,
pX(x)=∫x21421x2ydy=821x2(1−x4);
而当 0<y<1 时,
pY(y)=∫−yy421x2ydx=27y25,
所以由 p(x,y)=pX(x)pY(y),知 X 与 Y 不相互独立。
在长为 a 的线段的中点的两边随机地各选取一点,求两点间的距离小于 a/3 的概率。
解
记 X 为线段中点左边所取点到端点 0 的距离,Y 为线段中点右边所取点到端点 a 的距离,则
X∼U(0,a/2),Y∼U(a/2,a),
且 X 与 Y 相互独立,它们的联合密度函数为
p(x,y)=⎩⎨⎧a24,0,0<x<2a, 2a<y<a,其他.
而 p(x,y) 的非零区域与
∣y−x∣<3a
的交集为图 3.10 阴影部分。
\FigureThreeTen
因此,所求概率为
P(∣Y−X∣<3a)=∫a/6a/2∫a/2a/3+xa24dydx=92.
设二维随机变量 (X,Y) 服从区域
D={(x,y):a≤x≤b, c≤y≤d}
上的均匀分布,试证:X 与 Y 相互独立。
解
因为 (X,Y)∼U(D),其中
D={(x,y):a≤x≤b, c≤y≤d},
所以 (X,Y) 的联合密度函数为
p(x,y)=⎩⎨⎧(b−a)(d−c)1,0,a≤x≤b, c≤y≤d,其他.
由此得,当 a≤x≤b 时,
pX(x)=∫cdp(x,y)dy=b−a1;
当 c≤y≤d 时,
pY(y)=∫abp(x,y)dx=d−c1.
由此得
p(x,y)=pX(x)pY(y),
即 X 与 Y 相互独立。
补充习题及解答
设二维随机变量 (X,Y) 的联合密度函数为 p(x,y),证明:X 与 Y 相互独立的充要条件是 p(x,y) 可分离变量,即 p(x,y)=h(x)g(y)。又问 h(x),g(y) 与边际密度函数有什么关系?
解
记 X 与 Y 的边际密度函数分别为 pX(x) 和 pY(y)。必要性是显然的,因为 X 与 Y 相互独立,则
p(x,y)=pX(x)pY(y),
即 p(x,y) 可分离变量,其中
h(x)=pX(x),g(y)=pY(y).
下证充分性:因为
p(x,y)=h(x)g(y),
所以记
k1=∫−∞∞h(x)dx,k2=∫−∞∞g(y)dy.
由联合密度函数的正则性,得
∫−∞∞∫−∞∞p(x,y)dxdy=∫−∞∞∫−∞∞h(x)g(y)dxdy=∫−∞∞h(x)dx∫−∞∞g(y)dy=k1k2=1.
又因为
pX(x)=∫−∞∞p(x,y)dy=h(x)∫−∞∞g(y)dy=k2h(x),
pY(y)=∫−∞∞p(x,y)dx=g(y)∫−∞∞h(x)dx=k1g(y),
由此可得
p(x,y)=h(x)g(y)=k1k2h(x)g(y)=[k2h(x)][k1g(y)]=pX(x)pY(y),
所以 X 与 Y 相互独立。且从以上的证明过程可知:h(x) 与 pX(x) 相差一个常数因子 k2,g(y) 与 pY(y) 也相差一个常数因子 k1,这两个常数因子的乘积为 1。
§3.3 多维随机变量函数的分布
- 最大值、最小值分布 设 (X1,X2,⋯,Xn) 是相互独立、同分布的 n 维连续随机变量,其共同的密度函数和分布函数分别为 p(x) 和 F(x),记
Y=max{X1,X2,⋯,Xn},Z=min{X1,X2,⋯,Xn}.
则
FY(y)=[F(y)]n,pY(y)=n[F(y)]n−1p(y);
FZ(z)=1−[1−F(z)]n,pZ(z)=n[1−F(z)]n−1p(z).
- 变量变换法 若变换
{uv=g1(x,y),=g2(x,y),
存在唯一的反函数
{xy=x(u,v),=y(u,v),
且变换的雅可比行列式
J=∂(u,v)∂(x,y)=∂u∂x∂u∂y∂v∂x∂v∂y=(∂(x,y)∂(u,v))−1=∂x∂u∂x∂v∂y∂u∂y∂v−1=0.
则二维连续随机变量 (X,Y) 的函数
U=g1(X,Y),V=g2(X,Y)
的联合密度函数为
p(u,v)=p(x(u,v),y(u,v))∣J∣.
- 卷积公式 卷积公式用于求随机变量和 Z=X+Y 的分布。
**(1)**离散场合的卷积公式:Z=X+Y 的分布列为
P(Z=zk)=i=1∑∞P(X=xi, Y=zk−xi)
或
P(Z=zk)=j=1∑∞P(X=zk−yj, Y=yj).
当 X 与 Y 独立时,
P(Z=zk)=i=1∑∞P(X=xi)P(Y=zk−xi)
或
P(Z=zk)=j=1∑∞P(X=zk−yj)P(Y=yj).
其中诸 xi 为 X 的取值,诸 yj 为 Y 的取值。
**(2)**连续场合的卷积公式:Z=X+Y 的密度函数为
pZ(z)=∫−∞∞pX,Y(x,z−x)dx
或
pZ(z)=∫−∞∞pX,Y(z−y,y)dy.
当 X 与 Y 独立时,
pZ(z)=∫−∞∞pX(x)pY(z−x)dx
或
pZ(z)=∫−∞∞pX(z−y)pY(y)dy.
- 积的公式 U=XY 的密度函数为
pU(u)=∫−∞∞pX,Y(v,u/v)∣v∣1dv
或
pU(u)=∫−∞∞pX,Y(u/v,v)∣v∣1dv.
当 X 与 Y 独立时,
pU(u)=∫−∞∞pX(u/v)pY(v)∣v∣1dv
或
pU(u)=∫−∞∞pX(v)pY(u/v)∣v∣1dv.
- 商的公式 U=X/Y 的密度函数为
pU(u)=∫−∞∞pX,Y(uy,y)∣y∣dy
或
pU(u)=∫−∞∞pX,Y(v,v/u)u2∣v∣dv.
当 X 与 Y 独立时,
pU(u)=∫−∞∞pX(uy)pY(y)∣y∣dy
或
pU(u)=∫−∞∞pX(v)pY(v/u)u2∣v∣dv.
- 分布的可加性 若同一类分布的独立随机变量和的分布仍属于此类分布,则称此类分布具有可加性。以下一些常用分布具有可加性:
- 二项分布:若随机变量 X∼b(n,p),Y∼b(m,p),且 X 与 Y 独立,则 Z=X+Y∼b(n+m,p)。注意这里两个二项分布中的参数 p 要相同。
- 泊松分布:若随机变量 X∼P(λ1),Y∼P(λ2),且 X 与 Y 独立,则 Z=X+Y∼P(λ1+λ2)。
- 正态分布:若随机变量 X∼N(μ1,σ12),Y∼N(μ2,σ22),且 X 与 Y 独立,则 Z=X+Y∼N(μ1+μ2,σ12+σ22)。
- 伽马分布:若随机变量 X∼Ga(α1,λ),Y∼Ga(α2,λ),且 X 与 Y 独立,则 Z=X+Y∼Ga(α1+α2,λ)。注意这里两个伽马分布中的尺度参数 λ 要相同。
- χ2 分布:若随机变量 X∼χ2(n1),Y∼χ2(n2),且 X 与 Y 独立,则 Z=X+Y∼χ2(n1+n2)。
- 一些结论
- 设随机变量 X1,X2,⋯,Xn 独立同分布,都服从二点分布 b(1,p),则
X1+X2+⋯+Xn∼b(n,p).
- 设随机变量 X1,X2,⋯,Xn 独立同分布,都服从几何分布 Ge(p),则
X1+X2+⋯+Xn∼Nb(n,p).
- 设随机变量 X1,X2,⋯,Xn 独立同分布,都服从指数分布 Exp(λ),则
X1+X2+⋯+Xn∼Ga(n,λ).
- 寻求一维和多维随机变量函数分布的方法是概率论与数理统计中的基本功,要多加练习。一类是分析方法,另一类是代数方法。这里讲的分析方法是考验微积分水平的大好场所。它是以变量变换为主的方法,要多加练习,打开自己的眼界,探索分布之间的联系。
习题与解答 3.3
设二维随机变量 (X,Y) 的联合分布列为
X\Y01210.050.070.0420.150.110.0730.200.220.09
试分别求 U=max{X,Y} 和 V=min{X,Y} 的分布列。
解
可以看出 U=max{X,Y} 的可能取值为 1,2,3,并且
P(U=1)=P(X=0,Y=1)+P(X=1,Y=1)=0.05+0.07=0.12,
P(U=2)=i=0∑2P(X=i,Y=2)+P(X=2,Y=1)=0.15+0.11+0.07+0.04=0.37,
P(U=3)=i=0∑2P(X=i,Y=3)=0.20+0.22+0.09=0.51.
即 U 的分布列为
UP10.1220.3730.51
又可以看出 V=min{X,Y} 的可能取值为 0,1,2,并且
P(V=0)=j=1∑3P(X=0,Y=j)=0.05+0.15+0.20=0.40,
P(V=1)=j=1∑3P(X=1,Y=j)+P(X=2,Y=1)=0.07+0.11+0.22+0.04=0.44,
P(V=2)=P(X=2,Y=2)+P(X=2,Y=3)=0.07+0.09=0.16.
即 V 的分布列为
VP00.4010.4420.16
设 X 和 Y 是相互独立的随机变量,且
X∼Exp(λ),Y∼Exp(μ).
如果定义随机变量
Z={1,0,当 X≤Y,当 X>Y,
求 Z 的分布列。
解
因为 X,Y 相互独立,所以其联合密度函数为
p(x,y)=pX(x)pY(y)={λμe−λx−μy,0,x>0, y>0,其他.
由此得
P(Z=1)=P(X≤Y)=∫0∞∫x∞λμe−λx−μydydx=λ+μλ,
P(Z=0)=P(X>Y)=1−P(X≤Y)=λ+μμ.
设随机变量 X 和 Y 的分布列分别为
XP−141021141YP021121
已知 P(XY=0)=1,试求 Z=max{X,Y} 的分布列。
解
记 (X,Y) 的联合分布列及各自的边际分布为
X\Y−101P(Y=j)0p11p21p311/21p12p22p321/2P(X=i)1/41/21/41
由题设条件 P(XY=0)=1,知
p11+p21+p31+p22=1,
所以得
p12=p32=0.
又由边际分布可知
p22=21,p21=0,p11=41,p31=41.
即 (X,Y) 的联合分布列为
X\Y−10101/401/4101/20
所以 Z=max{X,Y} 的分布列为
ZP041143
设随机变量 X,Y 独立同分布,在以下情况下求随机变量 Z=max{X,Y} 的分布列:
- X 服从 p=0.5 的 0-1 分布;
- X 服从几何分布,即
P(X=k)=(1−p)k−1p,k=1,2,⋯.
解
**(1)**因为 X 与 Y 的可能取值均为 0 或 1,所以 Z=max{X,Y} 的可能取值也为 0 或 1,因此
P(Z=0)=P(X=0,Y=0)=P(X=0)P(Y=0)=0.5×0.5=0.25,
P(Z=1)=1−P(Z=0)=0.75.
**(2)**因为 X 服从几何分布,所以
P(X≤i)=j=1∑i(1−p)j−1p=p1−(1−p)1−(1−p)i=1−(1−p)i,i=1,2,⋯.
由此得
P(Z=i)=P(Z≤i)−P(Z≤i−1)=P(X≤i)P(Y≤i)−P(X≤i−1)P(Y≤i−1)=[1−(1−p)i]2−[1−(1−p)i−1]2=−2(1−p)i+(1−p)2i+2(1−p)i−1−(1−p)2i−2=(1−p)i−1p[2−(1−p)i−1−(1−p)i],i=1,2,⋯.
设 X 和 Y 为两个随机变量,且
P(X≥0,Y≥0)=73,P(X≥0)=P(Y≥0)=74.
试求
P(max{X,Y}≥0).
解
因为
74=P(X≥0)=P(X≥0,Y≥0)+P(X≥0,Y<0)=73+P(X≥0,Y<0),
由此得
P(X≥0,Y<0)=71.
同理由 P(Y≥0)=4/7,可得
P(X<0,Y≥0)=71.
再由
P(X≥0,Y≥0)+P(X≥0,Y<0)+P(X<0,Y≥0)+P(X<0,Y<0)=1,
得
P(X<0,Y<0)=72,
所以
P(max{X,Y}≥0)=1−P(max{X,Y}<0)=1−P(X<0,Y<0)=1−72=75.
设 X 与 Y 的联合密度函数为
p(x,y)={e−(x+y),0,x>0, y>0,其他.
试求以下随机变量的密度函数:
- Z=(X+Y)/2;
- Z=Y−X。
解
**(1)**因为 p(x,y) 的非零区域为 x>0,y>0,所以当 z≤0 时,FZ(z)=0;而当 z>0 时,
FZ(z)=P(Z≤z)=P(X+Y≤2z)=∫02z∫02z−xe−(x+y)dydx=∫02ze−x(1−e−(2z−x))dx=1−e−2z−2ze−2z.
所以,当 z≤0 时有 pZ(z)=0;而当 z>0 时,有
pZ(z)=4ze−2z,
这是伽马分布 Ga(2,2)。
**(2)**当 z≤0 时,p(x,y) 的非零区域与
y−x≤z
的交集为图 3.11(a) 阴影部分。
\FigureThreeElevenA
所以
FZ(z)=P(Z≤z)=P(Y−X≤z)=∫0∞∫y−z∞e−(x+y)dxdy=∫0∞e−ye−(y−z)dy=2ez,
从而
pZ(z)=FZ′(z)=2ez.
又因为当 z>0 时,p(x,y) 的非零区域与
y−x≤z
的交集为图 3.11(b) 阴影部分。
所以
FZ(z)=P(Z≤z)=P(Y−X≤z)=∫0∞∫0x+ze−(x+y)dydx=∫0∞e−x(1−e−(x+z))dx=1−2e−z,
从而
pZ(z)=FZ′(z)=2e−z.
由此得
pZ(z)=21e−∣z∣,−∞<z<∞.
设 X 与 Y 的联合密度函数为
p(x,y)={3x,0,0<x<1, 0<y<x,其他.
试求 Z=X−Y 的密度函数。
解
当 0<z<1 时,p(x,y) 的非零区域与
x−y≤z
的交集为图 3.12 阴影部分。
\FigureThreeTwelve
所以
FZ(z)=P(Z≤z)=P(X−Y≤z)=∫0z∫0x3xdydx+∫z1∫x−zx3xdydx=∫0z3x2dx+∫z13zxdx=23z−21z3,
从而
pZ(z)=FZ′(z)=23(1−z2),0<z<1.
在区间 (0,1) 外的 z 有
pZ(z)=0.
某种商品一周的需要量是一个随机变量,其密度函数为
p1(t)={te−t,0,t>0,t≤0.
设各周的需要量是相互独立的,试求:
- 两周需要量的密度函数 p2(x);
- 三周需要量的密度函数 p3(x)。
解
记 Xi 为第 i 周的需求量,i=1,2,3。根据题意知 X1,X2,X3 相互独立,且密度函数都为 p1(t)。Xi 服从伽马分布 Ga(2,1),所以由伽马分布的可加性知
(1)
X1+X2∼Ga(4,1),
其密度函数为
p2(x)=6x3e−x,x>0.
(2)
X1+X2+X3∼Ga(6,1),
其密度函数为
p3(x)=Γ(6)1x5e−x=1201x5e−x,x>0.
设随机变量 X 与 Y 相互独立,试在以下情况下求 Z=X+Y 的密度函数:
- X∼U(0,1),Y∼U(0,1);
- X∼U(0,1),Y∼Exp(1)。
解
Z=X+Y 的密度函数可由卷积公式求得
pZ(z)=∫−∞∞pX(x)pY(z−x)dx.
**(1)**因为 X∼U(0,1),Y∼U(0,1),所以 Z=X+Y 可在区间 (0,2) 上取值,且使卷积公式中的被积函数大于 0 的区域必须是 {0≤x≤1} 与 {0≤z−x≤1} 的交集,此即图 3.13 的阴影部分。
\FigureThreeThirteen
从图中可以看出:
当 0≤z≤1 时,有 pZ(z)=∫0zdx=z,
当 1≤z≤2 时,有 pZ(z)=∫z−11dx=2−z.
所以得 Z 的密度函数如下:
pZ(z)=⎩⎨⎧z,2−z,0,0≤z<1,1≤z<2,其他.
**(2)**因为 X∼U(0,1),Y∼Exp(1),所以 Z=X+Y 可在 (0,∞) 上取值,且要使卷积公式中的被积函数大于 0 的区域必须是 {0≤x≤1} 与 {z−x≥0} 的交集,此即图 3.14 的阴影部分。
\FigureThreeFourteen
从图中可以看出:
当 0≤z≤1 时,有 pZ(z)=∫0ze−(z−x)dx=1−e−z,
当 1≤z 时,有 pZ(z)=∫01e−(z−x)dx=e−z(e−1).
所以得 Z 的密度函数如下:
pZ(z)=⎩⎨⎧1−e−z,e−z(e−1),0,0≤z≤1,z>1,其他.
设随机变量 X 与 Y 相互独立,试在以下情况下求 Z=X/Y 的密度函数:
- X∼U(0,1),Y∼Exp(1);
- X∼Exp(λ1),Y∼Exp(λ2)。
解
**(1)**因为当 0<x<1 时,pX(x)=1,且当 y>0 时,pY(y)=e−y,所以 Z=X/Y 的密度函数为
pZ(z)=∫−∞∞pX(zy)pY(y)∣y∣dy.
使上式中的被积函数大于 0 的区域是 {y>0} 与 {0<zy<1} 的交集,所以当 z>0 时,有
pZ(z)=∫01/ze−y⋅ydy=1−(1+z1)e−1/z.
**(2)**因为当 x>0 时,
pX(x)=λ1e−λ1x,
且当 y>0 时,
pY(y)=λ2e−λ2y,
所以 Z=X/Y 的密度函数为
pZ(z)=∫−∞∞pX(zy)pY(y)∣y∣dy.
使上式中的被积函数大于 0 的区域是 {y>0} 与 {zy>0} 的交集,所以当 z>0 时,有
pZ(z)=∫0∞λ1λ2e−λ1zye−λ2y⋅ydy=(λ1z+λ2)2λ1λ2.
设 X1,X2,X3 为相互独立的随机变量,且都服从 (0,1) 上的均匀分布,求三者中最大者大于其他两者之和的概率。
解
记
X(3)=max{X1,X2,X3},X(1)=min{X1,X2,X3},
X(2) 为 X1,X2,X3 三者中取值处于中间的,或可将 X(2) 看成为
X(2)=X1+X2+X3−X(1)−X(3).
则
p(X(1),X(2),X(3))(x(1),x(2),x(3))=6,0<x(1)<x(2)<x(3)<1.
注:上面给出的 (X(1),X(2),X(3)) 的联合密度函数也可参见《概率论与数理统计教程(第三版)》§5.3。
因此所求概率为
P(X(3)≥X(1)+X(2))=6∫01∫0x(3)∫0min{x(3)−x(2),x(2)}dx(1)dx(2)dx(3)=6∫01∫0x(3)2x(3)−∣x(3)−2x(2)∣dx(2)dx(3)=6∫01∫0x(3)/2x(2)dx(2)dx(3)+6∫01∫x(3)/2x(3)(x(3)−x(2))dx(2)dx(3)=6∫0181x(3)2dx(3)+6∫0181x(3)2dx(3)=21.
设随机变量 X1 与 X2 相互独立同分布,其密度函数为
p(x)={2x,0,0<x<1,其他.
试求
Z=max{X1,X2}−min{X1,X2}
的分布。
解
因为
Z=max{X1,X2}−min{X1,X2}=2X1+X2+∣X1−X2∣−2X1+X2−∣X1−X2∣=∣X1−X2∣.
所以令
U=X1−X2,V=X2,
则当 0<u+v<1 且 0<v<1 时,有
pU,V(u,v)=pX1(u+v)pX2(v)=2(u+v)⋅2v.
由此得 U 的边际密度函数为
pU(u)=⎩⎨⎧I,II,0,−1<u<0,0<u<1,其他,
其中
I=∫−u14(u+v)⋅vdv=−32u3+2u+34,
II=∫01−u4(u+v)⋅vdv=32u3−2u+34.
又因为当 0<z<1 时,Z=∣U∣ 的分布函数为
FZ(z)=P(∣U∣≤z)=P(−z≤U≤z)=FU(z)−FU(−z),
所以 Z 的密度函数为
pZ(z)=pU(z)+pU(−z)=34z3−4z+38,0<z<1.
设某一设备装有 3 个同类的电器元件,元件工作相互独立,且工作时间都服从参数为 λ 的指数分布。当 3 个元件都正常工作时,设备才正常工作。试求设备正常工作时间 T 的密度函数。
解
记 Ti 为第 i 个元件的工作时间,i=1,2,3。则 T1,T2,T3 独立同分布,其共同的密度函数和分布函数分别为
p1(t)={λe−λt,0,t>0,t≤0,F1(t)={1−e−λt,0,t>0,t≤0.
由题设条件知,当 3 个元件都正常工作时,设备才正常工作。这等价于“3 个元件中有一个失效,则此设备就停止工作”,故设备正常工作时间
T=min{T1,T2,T3},
所以 T 的密度函数为
pT(t)=3[1−F1(t)]2p1(t)={3(e−λt)2λe−λt,0,t>0,t≤0,={3λe−3λt,0,t>0,t≤0.
这表明:设备正常工作时间 T 服从参数为 3λ 的指数分布。
设二维随机变量 (X,Y) 在矩形
G={(x,y):0≤x≤2, 0≤y≤1}
上服从均匀分布,试求边长分别为 X 和 Y 的矩形面积 Z 的密度函数。
解
因为 (X,Y) 服从矩形 G 上的均匀分布,所以 (X,Y) 的联合密度函数为
pX,Y(x,y)=⎩⎨⎧21,0,0≤x≤2, 0≤y≤1,其他.
又因为面积 Z=XY,所以 Z 可在区间 (0,2) 上取值,且 Z 的密度函数可用积的公式求得
pZ(z)=∫−∞∞pX,Y(z/v,v)∣v∣1dv.
要使以上被积函数大于 0 的区域必须是 {0<z/v<2} 与 {0<v<1} 的交集,此交集为 {z/2<v<1},所以当 0<z<2 时,有
pZ(z)=∫z/212v1dv=(21lnv)z/21=2ln2−lnz.
设二维随机变量 (X,Y) 服从圆心在原点的单位圆内的均匀分布,求极坐标
R=X2+Y2,θ=arctan(Y/X)
的联合密度函数。
解
因为 (X,Y) 服从圆心在原点的单位圆内的均匀分布,所以 (X,Y) 的联合密度函数为
pX,Y(x,y)=⎩⎨⎧π1,0,0<x2+y2<1,其他.
记
r=x2+y2,θ=arctan(y/x),
则
J−1=∂x∂r∂x∂θ∂y∂r∂y∂θ=x2+y2xx2+y2−yx2+y2yx2+y2x=x2+y21=r1.
所以 ∣J∣=r。由此得
pR,θ(r,θ)=pX,Y(x(r,θ),y(r,θ))∣J∣=πr,0<r<1, 0<θ<2π.
**注:**在变量变换法中,有些题目计算 J−1 较为方便,下面第 17 题也是如此。
设随机变量 X 与 Y 独立同分布,其密度函数为
p(x)={e−x,0,x>0,x≤0.
- 求 U=X+Y 与 V=X/(X+Y) 的联合密度函数 p(u,v);
- 以上的 U 与 V 独立吗?
解
**(1)**由
{uv=x+y,=x/(x+y)
的反函数为
{xy=uv,=u(1−v),
变换的雅可比行列式
J=∂u∂x∂u∂y∂v∂x∂v∂y=v1−vu−u=−uv−u(1−v)=−u.
所以在 (U,V) 的可能取值范围 {u>0, 0<v<1} 内,有
pU,V(u,v)=pX(uv)pY(u(1−v))∣−u∣=e−uve−u(1−v)u=ue−u.
**(2)**因为 U 与 V 各自的边际密度函数分别为
pU(u)=∫−∞∞pU,V(u,v)dv=∫01ue−udv=ue−u,u>0,
pV(v)=∫−∞∞pU,V(u,v)du=∫0∞ue−udu=1,0<v<1,
所以由
pU,V(u,v)=pU(u)pV(v)
知 U 与 V 相互独立。
设随机变量 X 与 Y 独立同分布,且都服从标准正态分布 N(0,1)。试证:U=X2+Y2 与 V=X/Y 相互独立。
解
设
u=x2+y2,v=x/y,
则
J−1=∂x∂u∂x∂v∂y∂u∂y∂v=2x1/y2y−x/y2=−2(y2x2+1)=−2(v2+1),
所以
∣J∣=2(1+v2)1.
由此得 U=X2+Y2 和 V=X/Y 的联合密度为
pU,V(u,v)=pX,Y(x,y)∣J∣⋅I{y≤0}+pX,Y(x,y)∣J∣⋅I{y>0}=2⋅2π1exp{−2x2+y2}⋅2(1+v2)1=21e−u/2⋅π(1+v2)1,u>0, −∞<v<∞.
所以 pU,V(u,v) 可分离变量,即 U 与 V 相互独立。
**注:**由此题也可以看出,U 服从自由度为 2 的 χ2 分布,V 服从柯西分布。
设随机变量 X 与 Y 相互独立,且
X∼Ga(α1,λ),Y∼Ga(α2,λ).
试证:
U=X+Y,V=X+YX
相互独立,且
V∼Be(α1,α2).
解
因为 X 与 Y 的密度函数分别为
pX(x)=⎩⎨⎧Γ(α1)λα1xα1−1e−λx,0,x≥0,x<0,pY(y)=⎩⎨⎧Γ(α2)λα2yα2−1e−λy,0,y≥0,y<0.
下求 (U,V) 的联合密度函数。因为
{uv=x+y,=x/(x+y)
的反函数为
{xy=uv,=u(1−v),
且变换的雅可比行列式为
J=∂u∂x∂u∂y∂v∂x∂v∂y=v1−vu−u=−u,
所以,当 u>0,0<v<1 时,有
pU,V(u,v)=pX(uv)pY(u(1−v))∣J∣=Γ(α1)λα1(uv)α1−1e−λuv⋅Γ(α2)λα2[u(1−v)]α2−1e−λu(1−v)⋅u=Γ(α1)Γ(α2)λα1+α2e−λuuα1+α2−1vα1−1(1−v)α2−1=Γ(α1+α2)λα1+α2uα1+α2−1e−λu⋅Γ(α1)Γ(α2)Γ(α1+α2)vα1−1(1−v)α2−1.
可见 pU,V(u,v) 可分离变量,故 U 与 V 相互独立,其中
U∼Ga(α1+α2,λ),V∼Be(α1,α2).
**注意,**因为指数分布是特殊的伽马分布,即 Exp(λ)=Ga(1,λ),所以当 X 与 Y 相互独立,且
X∼Exp(λ)=Ga(1,λ),Y∼Exp(λ)=Ga(1,λ)
时,有
V=X+YX∼Be(1,1)=U(0,1).
设随机变量 U1 与 U2 相互独立,且都服从 (0,1) 上的均匀分布,试证明:
- Z1=−2lnU1∼Exp(1/2),Z2=2πU2∼U(0,2π);
-
X=Z1cosZ2,Y=Z1sinZ2
是相互独立的标准正态随机变量。
解
**(1)**设 z1=−2lnu1,则
u1=e−z1/2,dz1du1=−21e−z1/2,
所以当 z1>0 时,Z1=−2lnU1 的密度函数为
pZ1(z1)=pU1(e−z1/2)dz1du1=21e−z1/2,
即
Z1∼Exp(1/2).
又设 z2=2πu2,则
u2=2πz2,dz2du2=2π1,
所以当 0<z2<2π 时,Z2=2πU2 的密度函数为
pZ2(z2)=pU2(2πz2)⋅2π1=2π1.
即
Z2∼U(0,2π).
**(2)**因为
x2+y2=−2lnu1,
所以
u1=exp{−21(x2+y2)},
又因为
xy=tan(2πu2),
所以
u2=2π1arctanxy.
由此得
J=∂x∂u1∂x∂u2∂y∂u1∂y∂u2=−2π1exp{−21(x2+y2)},
所以 (X,Y) 的联合密度函数为
pX,Y(x,y)=pU1,U2(u1,u2)⋅∣J∣=2π1exp{−21(x2+y2)},−∞<x,y<∞.
这说明 X 和 Y 是相互独立的标准正态随机变量。
设随机变量 X1,X2,⋯,Xn 相互独立,且 Xi∼Exp(λi),试证:
P(Xi=min{X1,X2,⋯,Xn})=λ1+λ2+⋯+λnλi.
解
(X1,X2,⋯,Xn) 的联合密度为
p(x1,x2,⋯,xn)=j=1∏nλje−λjxj,
而事件
{Xi=min{X1,X2,⋯,Xn}}={X1≥Xi,⋯,Xi−1≥Xi, 0<Xi<∞, Xi+1≥Xi,⋯,Xn≥Xi},
从而该事件的概率为
P(Xi=min{X1,X2,⋯,Xn})=∫0∞∫xi∞⋯∫xi∞⋯∫xi∞j=1∏nλje−λjxjdx1⋯dxi−1dxi+1⋯dxndxi=∫0∞λie−(λ1+λ2+⋯+λn)xidxi=λ1+λ2+⋯+λnλi.
设连续随机变量 X1,X2,⋯,Xn 独立同分布,试证:
P(Xn>max{X1,X2,⋯,Xn−1})=n1.
解
设诸 Xi 的密度函数为 p(x),其联合密度函数为
p(x1,x2,⋯,xn)=i=1∏np(xi),
而事件
{Xn>max{X1,X2,⋯,Xn−1}}={X1<Xn, X2<Xn, ⋯, Xn−1<Xn, −∞<Xn<∞},
从而该事件的概率为
P(Xn>max{X1,X2,⋯,Xn−1})=∫−∞∞∫−∞xn⋯∫−∞xni=1∏np(xi)dx1⋯dxn−1dxn.
若记诸 Xi 的分布函数为
F(x)=∫−∞xp(t)dt,
则上式积分可化为
P(Xn>max{X1,X2,⋯,Xn−1})=∫−∞∞Fn−1(xn)dF(xn)=[n1Fn(xn)]−∞∞=n1.
§3.4 多维随机变量的特征数
- 多维随机变量函数的数学期望 若二维随机变量 (X,Y) 的分布用联合分布列
P(X=xi,Y=yj)
或用联合密度函数 p(x,y) 表示,则
Z=g(X,Y)
的数学期望(假设存在)为
E(Z)=⎩⎨⎧i∑j∑g(xi,yj)P(X=xi,Y=yj),∫−∞∞∫−∞∞g(x,y)p(x,y)dxdy,在离散场合,在连续场合.
对 n 维随机变量结论是类似的。
- 数学期望与方差的运算性质 以下均假定有关的期望和方差存在。
-
E(X1+X2+⋯+Xn)=E(X1)+E(X2)+⋯+E(Xn).
- 若随机变量 X1,X2,⋯,Xn 相互独立,则
E(X1X2⋯Xn)=E(X1)E(X2)⋯E(Xn).
Var(X1±X2±⋯±Xn)=Var(X1)+Var(X2)+⋯+Var(Xn).
- 协方差 若
E[(X−E(X))(Y−E(Y))]
存在,则称
Cov(X,Y)=E[(X−E(X))(Y−E(Y))]
为 X 与 Y 的协方差。
- 当 Cov(X,Y)>0 时,称 X 与 Y 正相关,即 X 与 Y 同时增加或同时减少;
- 当 Cov(X,Y)<0 时,称 X 与 Y 负相关,即 X 增加 Y 减少,或 X 减少 Y 增加;
- 当 Cov(X,Y)=0 时,称 X 与 Y 不相关。
- 协方差的性质
- Cov(X,Y)=Cov(Y,X);
-
Cov(X,Y)=E(XY)−E(X)E(Y).
- 若 X 与 Y 相互独立,则 Cov(X,Y)=0,反之不然;
-
Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z).
- 对任意的常数 a,有 Cov(X,a)=0;
- 对任意的常数 a,b,有
Cov(aX,bY)=abCov(X,Y).
- 对任意二维随机变量 (X,Y),有
Var(X±Y)=Var(X)+Var(Y)±2Cov(X,Y).
对任意 $n$ 个随机变量 $X_1,X_2,\cdots,X_n$,有
Var(i=1∑nXi)=i=1∑nVar(Xi)+2i=1∑nj=1∑i−1Cov(Xi,Xj).
- 施瓦茨不等式 对任意二维随机变量 (X,Y),若 X 与 Y 的方差都存在,则有
[Cov(X,Y)]2≤Var(X)Var(Y).
- 相关系数 设 (X,Y) 是一个二维随机变量,且
Var(X)>0,Var(Y)>0.
则称
Corr(X,Y)=Var(X)Var(Y)Cov(X,Y)=σXσYCov(X,Y)
为 X 与 Y 的(线性)相关系数。
-
相关系数的性质
-
−1≤Corr(X,Y)≤1;
-
Corr(X,Y) 与 Cov(X,Y) 同号,或同为零;
-
Corr(X,Y)=Cov(X∗,Y∗),
其中 X∗,Y∗ 分别为 X,Y 的标准化随机变量。
-
Corr(X,Y)=±1 的充要条件是 X 与 Y 间几乎处处有线性关系,即存在 a (a=0) 与 b,使得
P(Y=aX+b)=1.
其中当 $Corr(X,Y)=1$ 时,有 $a>0$;当 $Corr(X,Y)=-1$ 时,有 $a<0$。
- 在二维正态分布 N(μ1,μ2,σ12,σ22,ρ) 场合,不相关与独立是等价的。
- 随机向量的数学期望与协方差阵 记 n 维随机向量为
X=(X1,X2,⋯,Xn)T,
以下假设所涉及的数学期望、方差、协方差均存在。
- 随机向量 X 的数学期望向量为
E(X)=(E(X1),E(X2),⋯,E(Xn))T.
- 随机向量 X 的协方差阵为
E[(X−E(X))(X−E(X))T]=Var(X1)Cov(X2,X1)⋮Cov(Xn,X1)Cov(X1,X2)Var(X2)⋮Cov(Xn,X2)⋯⋯⋱⋯Cov(X1,Xn)Cov(X2,Xn)⋮Var(Xn).
也记以上的协方差阵为 $Cov(\bm{X})$,或记成 $\Sigma$。
- 随机向量 X 的协方差阵
Cov(X)=(Cov(Xi,Xj))n×n
是一个对称的非负定矩阵。
- n 元正态分布 设 n 维随机向量
X=(X1,X2,⋯,Xn)T
的协方差阵为 $\Sigma=Cov(\bm{X})$,数学期望向量为
a=(a1,a2,⋯,an)T.
又记
x=(x1,x2,⋯,xn)T,
则由密度函数
p(x1,x2,⋯,xn)=p(x)=(2π)n/2∣Σ∣1/21exp{−21(x−a)TΣ−1(x−a)}
定义的分布称为 $n$ 元正态分布,记为
X∼N(a,Σ).
习题与解答 3.4
掷一颗均匀的骰子 2 次,其最小点数记为 X,求 E(X)。
解
因为
XP111/3629/3637/3645/3653/3661/36
所以
E(X)=3691.
解
记 Xi 为第 i 颗骰子出现的点数,i=1,2,⋯,n,则 X1,X2,⋯,Xn 独立同分布,其共同的分布列为
XiP11/621/631/641/651/661/6
所以
E(Xi)=61(1+2+3+4+5+6)=27,
Var(Xi)=61(12+22+32+42+52+62)−449=1235.
由此得
E(i=1∑nXi)=i=1∑nE(Xi)=27n,
Var(i=1∑nXi)=i=1∑nVar(Xi)=1235n.
从数字 0,1,⋯,n 中任取两个不同的数字,求这两个数字之差的绝对值的数学期望。
解
记 X 与 Y 分别为第 1 次和第 2 次取出的数字,则
P(X=i,Y=j)=(n+1)n1,i,j=0,1,⋯,n,i=j.
所以
E(∣X−Y∣)=(n+1)n1i=0∑n{j=0∑i−1(i−j)+j=i+1∑n(j−i)}=(n+1)n1i=0∑n{2i(i+1)+2(n−i)[(n−i)+1]}=(n+1)n1i=0∑n{i2+2n(n+1)−in}=62n+1+2n+1−2n=3n+2.
设在区间 (0,1) 上随机取 n 个点,求相距最远的两点间的距离的数学期望。
解
解法一 分别记此 n 个点为 X1,X2,⋯,Xn,则 X1,X2,⋯,Xn 相互独立,且都服从区间 (0,1) 上的均匀分布 U(0,1)。我们的目的是求
E(max{X1,X2,⋯,Xn}−min{X1,X2,⋯,Xn}).
而
Z=max{X1,X2,⋯,Xn},T=min{X1,X2,⋯,Xn}
的密度函数分别为
pZ(z)={nzn−1,0,0<z<1,其他,pT(t)={n(1−t)n−1,0,0<t<1,其他.
又因为
E(Z)=∫01znzn−1dz=n+1n,E(T)=∫01tn(1−t)n−1dt=n+11,
所以
E(max{X1,X2,⋯,Xn}−min{X1,X2,⋯,Xn})=n+1n−n+11=n+1n−1.
解法二 n 个点把区间 (0,1) 分成 n+1 段,它们的长度依次记为 Y1,Y2,⋯,Yn+1。因为此 n 个点是随机取的,所以 Y1,Y2,⋯,Yn+1 具有相同的分布,从而有相同的数学期望。而
Y1+Y2+⋯+Yn+1=1,
因此
E(Y1)=E(Y2)=⋯=E(Yn+1)=n+11.
而相距最远的两点间的距离为 Y2+Y3+⋯+Yn,因此所求期望为
E(Y2+Y3+⋯+Yn)=n+1n−1.
盒中有 n 个不同的球,其上分别写有数字 1,2,⋯,n。每次随机抽出一个,记下其号码,放回去再抽。直到抽到有两个不同的数字为止。求平均抽球次数。
解
记 X 为抽球次数,则 X 的可能取值是 2,3,⋯,且有
P(X=k)=nk−1n−1=(n1)k−2nn−1,k=2,3,⋯.
又记
p=nn−1,
则
Y=X−1
服从参数为 p 的几何分布,因此
E(Y)=p1=n−1n,
由此得
E(X)=E(Y)+1=n−1n+1=n−12n−1.
设随机变量 (X,Y) 的联合分布列为
X\Y01200.10.250.1510.150.20.15
试求
Z=sin[2π(X+Y)]
的数学期望。
解
E(Z)=0.1sin0+0.15sin2π+0.25sin2π+0.2sinπ+0.15sinπ+0.15sin23π=0.15×1+0.25×1+0.15×(−1)=0.25.
随机变量 (X,Y) 服从以点 (0,1),(1,0),(1,1) 为顶点的三角形区域上的均匀分布,试求 E(X+Y) 和 Var(X+Y)。
解
记此三角形区域为 D(如图 3.15 阴影部分)。因为 D 的面积为 1/2,所以 (X,Y) 的联合密度函数为
pX,Y(x,y)={2,0,(x,y)∈D,(x,y)∈/D.
\FigureThreeFifteen
下求 X 和 Y 各自的边际密度函数。当 0<x<1 时,有
pX(x)=∫1−x12dy=2x.
这是贝塔分布 Be(2,1)。当 0<y<1 时,有
pY(y)=∫1−y12dx=2y.
这也是贝塔分布 Be(2,1)。即 X 与 Y 同分布。因此由贝塔分布的期望、方差公式可知
E(X)=E(Y)=32,Var(X)=Var(Y)=181.
由于 X 与 Y 不独立,所以先计算
E(XY)=∫01∫1−x12xydydx=125.
由此得
Cov(X,Y)=E(XY)−E(X)E(Y)=125−94=−361(负相关).
最后得
E(X+Y)=32+32=34,
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)=181+181−362=181.
设 X,Y 均为 (0,1) 上独立的均匀随机变量,试证:
E(∣X−Y∣α)=(α+1)(α+2)2,α>0.
解
因为 (X,Y) 的联合密度函数为
p(x,y)={1,0,0<x,y<1,其他,
所以
E(∣X−Y∣α)=∫01∫01∣x−y∣αdxdy=∫01∫0y(y−x)αdxdy+∫01∫y1(x−y)αdxdy=(α+1)(α+2)1+(α+1)(α+2)1=(α+1)(α+2)2.
设 X 与 Y 是独立同分布的随机变量,且
P(X=i)=m1,i=1,2,⋯,m.
试证:
E(∣X−Y∣)=3m(m−1)(m+1).
解
E(∣X−Y∣)=i=1∑mj=1∑m∣i−j∣⋅m21=m21i=1∑m(j=1∑i−1(i−j)+j=i+1∑m(j−i))=m21i=1∑m(i2−i−mi+2m2+2m)=m21[6m(m+1)(2m+1)−(m+1)2m(m+1)+2m3+2m2]=3m(m−1)(m+1).
设随机变量 X 与 Y 独立同分布,且 E(X)=μ,Var(X)=σ2,试求 E(X−Y)2.
解
因为 E(X−Y)=0,所以
E(X−Y)2=Var(X−Y)=2σ2.
设随机变量 (X,Y) 的联合密度函数为
p(x,y)=⎩⎨⎧4x(1+3y2),0,0<x<2, 0<y<1,其他.
试求 E(Y/X).
解
E(Y/X)=∫01dy∫02xy⋅4x(1+3y2)dx=∫012y(1+3y2)dy=85.
设 X1,X2,…,X5 是独立同分布的随机变量,其共同的密度函数
p(x)={2x,0,0<x<1,其他.
试求 Y=max{X1,X2,…,X5} 的密度函数、数学期望和方差.
解
先求 Xi 的分布函数.当 0<x<1 时,
F(x)=∫0x2tdt=x2,
所以当 0<y<1 时,Y 的密度函数为
pY(y)=5[F(y)]4p(y)=5y8×2y=10y9,
这是贝塔分布 Be(10,1),由此得
E(Y)=1110,Var(Y)=112×1210=7265.
系统由 n 个部件组成.记 Xi 为第 i 个部件能持续工作的时间,如果 X1,X2,…,Xn 独立同分布,且 Xi∼Exp(λ),试在以下情况下求系统持续工作的平均时间:
- 如果有一个部件停止工作,系统就不工作了;
- 如果至少有一个部件在工作,系统就工作.
解
因为 Xi∼Exp(λ),所以 Xi 的密度函数和分布函数分别为
p1(x)={λe−λx,0,x>0,x≤0,F1(x)={1−e−λx,0,x>0,x≤0.
(1) 根据题意,系统持续工作的时间为
T=min{X1,X2,…,Xn},
所以当 t≤0 时,T 的密度函数 pT(t)=0;而当 t>0 时,
pT(t)=np1(t)[1−F1(t)]n−1=nλe−λte−(n−1)λt=nλe−nλt,
这是参数为 nλ 的指数分布,所以
E(T)=nλ1.
(2) 根据题意,系统持续工作的时间为
T=max{X1,X2,…,Xn},
所以当 t>0 时
pT(t)=n[F1(t)]n−1p1(t)=n(1−e−λt)n−1λe−λt=i=0∑n−1(−1)inλ(in−1)e−(i+1)λt=i=0∑n−1(−1)i(i+1n)(i+1)λe−(i+1)λt,
所以系统持续工作的平均时间为
E(T)=i=0∑n−1(−1)i(i+1n)∫0∞t(i+1)λe−(i+1)λtdt=i=0∑n−1(−1)i(i+1n)(i+1)λ1=λn−(2n)2λ1+(3n)3λ1+⋯+(−1)n−1nλ1.
设 X,Y 独立同分布,都服从标准正态分布 N(0,1),求 E(max{X,Y}).
解
因为 X,Y 独立,都服从 N(0,1),所以 X−Y∼N(0,2).又因为
max{X,Y}=2X+Y+∣X−Y∣,
由于 X−Y∼N(0,2),所以
E(max{X,Y})=2E(X)+E(Y)+E(∣X−Y∣)=2E(∣X−Y∣)=22π21∫−∞∞∣t∣e−t2/4dt=2π21∫0∞te−t2/4dt=−π1∫0∞d(e−t2/4)=π1.
设随机变量 X1,X2,…,Xn 相互独立,且都服从 (0,θ) 上的均匀分布,记
Y=max{X1,X2,…,Xn},Z=min{X1,X2,…,Xn}.
试求 E(Y) 和 E(Z).
解
记 Xi 的密度函数和分布函数分别为
p1(x)={1/θ,0,0<x<θ,其他,F1(x)=⎩⎨⎧0,x/θ,1,x<0,0≤x<θ,x≥θ.
则当 0<t<θ 时,Y 与 Z 的密度函数分别为
pY(t)=n[F1(t)]n−1p1(t)=n(θt)n−1θ1,
pZ(t)=np1(t)[1−F1(t)]n−1=n(1−θt)n−1θ1.
所以
E(Y)=θnn∫0θtndt=n+1nθ,
E(Z)=θnn∫0θt(θ−t)n−1dt=n+1θ.
设随机变量 U 服从 (−2,2) 上的均匀分布,定义 X 和 Y 如下:
X={−1,1,若 U<−1,若 U≥−1,Y={−1,1,若 U<1,若 U≥1.
试求 Var(X+Y).
解
先求 X+Y 的分布列.因为 X+Y 的可能取值是 −2,0,2,所以
P(X+Y=−2)=P(X=−1,Y=−1)=P(U<−1)=41,
P(X+Y=2)=P(X=1,Y=1)=P(U≥−1,U≥1)=P(U≥1)=41,
P(X+Y=0)=1−P(X+Y=−2)−P(X+Y=2)=21.
综上可得 X+Y 的分布列
此分布对称,所以 E(X+Y)=0,从而得
Var(X+Y)=E(X+Y)2=2.
一商店经销某种商品,每周进货量 X 与顾客对这种商品的需求量 Y 是相互独立的随机变量,且都服从区间 (10,20) 上的均匀分布.商店每售出一单位商品可得利润 1000 元;若需求量超过了进货量,则可从其他商店调剂供应,这时每单位商品获利润为 500 元.试求此商店经销这种商品每周的平均利润.
解
记 Z 为此商店经销该种商品每周所得的利润,由题设知 Z=g(X,Y),其中
g(x,y)={1000y,1000x+500(y−x)=500(x+y),y≤x,y>x.
由题设条件知 (X,Y) 的联合概率密度为
pX,Y(x,y)={1/100,0,10≤x≤20, 10≤y≤20,其他.
于是
E(Z)=E(g(X,Y))=∬g(x,y)pX,Y(x,y)dxdy=∬y≤x1000ypX,Y(x,y)dxdy+∬y>x500(x+y)pX,Y(x,y)dxdy=10∫1020dy∫y20ydx+5∫1020dy∫10y(x+y)dx=320000+5×1500≈14166.67.
设随机变量 X 与 Y 独立,都服从正态分布 N(a,σ2),试证:
E(max{X,Y})=a+πσ.
解
记
X∗=σX−a,Y∗=σY−a,
则 X∗ 与 Y∗ 独立,都服从 N(0,1) 分布.所以由前面第 14 题知
E(max{X∗,Y∗})=π1.
又因为
E(max{X∗,Y∗})=E(max{σX−a,σY−a})=σE(max{X,Y})−a,
由此即得
E(max{X,Y})=a+σE(max{X∗,Y∗})=a+πσ.
设二维随机变量 (X,Y) 的联合分布列为
| X | Y | | |
|---|
| \cmidrule(lr){2-4} | −1 | 0 | 1 |
| 0 | 0.07 | 0.18 | 0.15 |
| 1 | 0.08 | 0.32 | 0.20 |
试求 X2 与 Y2 的协方差.
解
因为
所以得
E(X2)=0.6,E(Y2)=0.5,E(X2Y2)=0.28,
由此得
Cov(X2,Y2)=E(X2Y2)−E(X2)E(Y2)=0.28−0.6×0.5=−0.02.
把一颗骰子独立地掷 n 次,求 1 点出现的次数与 6 点出现次数的协方差及相关系数.
解
记
Xi={1,0,第 i 次投掷,出现 1 点,其他,Yi={1,0,第 i 次投掷,出现 6 点,其他.
则 1 点出现的次数
X=i=1∑nXi∼b(n,1/6),
6 点出现的次数
Y=j=1∑nYj∼b(n,1/6).
从而有
E(X)=E(Y)=6n,Var(X)=Var(Y)=365n.
我们的目的是求 Cov(X,Y),故下面先求 E(XY).由于
XY=(X1+X2+⋯+Xn)(Y1+Y2+⋯+Yn)=i=1∑nXiYi+2i<j∑XiYj,
且因为 Xi 和 Yi 均为仅取 0,1 值的随机变量,所以
{XiYi=1}={Xi=1,Yi=1}=∅
(第 i 次投掷时,不可能既出现 1 点,又出现 6 点),因此当 i=j 时,有
P(XiYi=1)=0,P(XiYi=0)=1.
由此得 E(XiYi)=0.而当 i=j 时,由于 Xi 与 Yj 相互独立,所以
E(XiYj)=E(Xi)E(Yj)=361.
综上可得
Cov(X,Y)=E(XY)−E(X)E(Y)=2i<j∑E(XiYj)−36n2=36n(n−1)−36n2=−36n,
Corr(X,Y)=Var(X)Var(Y)Cov(X,Y)=5n/36−n/36=−51.
解
记 X 为第一次掷出的点数,Y 为第二次掷出的点数,则 X 与 Y 独立同分布,即有 E(X)=E(Y),E(X2)=E(Y2).由此得
Cov(X+Y,X−Y)=E(X2−Y2)−E(X+Y)E(X−Y)=0.
某箱装 100 件产品,其中一、二和三等品分别为 80,10 和 10 件.现从中随机取一件,定义两个随机变量 X1,X2 如下
Xi={1,0,若抽到 i 等品,其他,i=1,2.
试求随机变量 X1 和 X2 的相关系数 Corr(X1,X2).
解
因为 X1∼b(1,0.8),X2∼b(1,0.1),所以有
E(X1)=0.8,Var(X1)=0.8×0.2=0.16;
E(X2)=0.1,Var(X2)=0.1×0.9=0.09.
由多项分布可导出 (X1,X2) 的联合分布列如下
| X1 | X2 | |
|---|
| \cmidrule(lr){2-3} | 0 | 1 |
| 0 | 0.1 | 0.1 |
| 1 | 0.8 | 0 |
譬如,
P(X1=1,X2=0)=1!0!0!1!⋅0.81×0.10×0.10=0.8.
由此获得乘积 X1X2 的分布列
所以 E(X1X2)=0,由此得
Cov(X1,X2)=E(X1X2)−E(X1)E(X2)=0−0.8×0.1=−0.08,
Corr(X1,X2)=Var(X1)Var(X2)Cov(X1,X2)=0.160.09−0.08=−32.
将一枚硬币重复掷 n 次,以 X 和 Y 分别表示正面向上和反面向上的次数,试求 X 和 Y 的协方差及相关系数.
解
因为 X+Y=n,且 X∼b(n,1/2),Y∼b(n,1/2),所以
Var(X)=Var(Y)=4n,
Cov(X,Y)=Cov(X,n−X)=−Cov(X,X)=−Var(X)=−4n,
Corr(X,Y)=Var(X)Var(Y)Cov(X,Y)=n/4−n/4=−1.
设随机变量 X 和 Y 独立同服从参数为 λ 的泊松分布,令
U=2X+Y,V=2X−Y.
求 U 和 V 的相关系数 Corr(U,V).
解
因为
Var(U)=Var(2X+Y)=4Var(X)+Var(Y)=5λ,
Var(V)=Var(2X−Y)=4Var(X)+Var(Y)=5λ.
所以
Cov(U,V)=Cov(2X+Y,2X−Y)=Cov(2X,2X)+Cov(Y,2X)−Cov(2X,Y)−Cov(Y,Y)=4Var(X)−Var(Y)=3λ,
由此得
Corr(U,V)=Var(U)Var(V)Cov(U,V)=5λ3λ=53.
在一个有 n 个人参加的晚会上,每个人带了一件礼物,且假定各人带的礼物都不相同.晚会期间各人从放在一起的 n 件礼物中随机抽取一件,试求抽中自己礼物的人数 X 的均值和方差.
解
记
Xi={1,0,第 i 个人恰好取出自己的礼物,第 i 个人取出别人的礼物,i=1,2,…,n.
则 X1,X2,…,Xn 是同分布的,但不独立.其共同分布为
P(Xi=1)=n1,P(Xi=0)=1−n1,i=1,2,…,n.
由此得
E(Xi)=n1,Var(Xi)=n1(1−n1),i=1,2,…,n.
又因为 X=X1+X2+⋯+Xn,所以
E(X)=E(X1)+E(X2)+⋯+E(Xn)=n⋅n1=1.
但因为 Xi 间不独立,所以
Var(X)=i=1∑nVar(Xi)+2i=1∑nj=i+1∑nCov(Xi,Xj).
为计算 Cov(Xi,Xj),先给出 XiXj 的分布列,注意到 XiXj 的可能取值为 0,1,且
P(XiXj=1)=P(Xi=1,Xj=1)=n1⋅n−11,
所以
E(XiXj)=0×P(XiXj=0)+1×P(XiXj=1)=n(n−1)1.
因此
Cov(Xi,Xj)=E(XiXj)−E(Xi)E(Xj)=n(n−1)1−(n1)2=n2(n−1)1.
由此得
Var(X)=nn−1+2(2n)n2(n−1)1=1.
设随机变量 X 和 Y 的数学期望分别为 −2 和 2,方差分别为 1 和 4,而它们的相关系数为 −0.5.试根据切比雪夫不等式,估计 P(∣X+Y∣≥6) 的上限.
解
因为
E(X+Y)=0,
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)=1+4+214×(−0.5)=3,
所以
P(∣X+Y∣≥6)≤62Var(X+Y)=363=121.
设二维随机变量 (X,Y) 的联合密度函数为
p(x,y)={1,0,∣y∣<x, 0<x<1,其他.
求 E(X),E(Y),Cov(X,Y).
解
E(X)=∫01∫−xxxdydx=∫012x2dx=32,
E(Y)=∫01∫−xxydydx=0,
E(XY)=∫01∫−xxxydydx=0,Cov(X,Y)=E(XY)−E(X)E(Y)=0.
讨论:这里 X 与 Y 的协方差为 0,故 X 与 Y 不相关,但 X 与 Y 也不独立,这是因为 p(x,y)=p(x)p(y),其中
p(x)={2x,0,0<x<1,其他,p(y)=⎩⎨⎧1+y,1−y,0,−1<y<0,0<y<1,其他.
设二维随机变量 (X,Y) 的联合密度函数为
p(x,y)={3x,0,0<y<x<1,其他.
求 X 与 Y 的相关系数.
解
先计算 X 与 Y 的期望、方差与协方差:
E(X)=∫01∫0x3x2dydx=∫013x3dx=43,
E(X2)=∫01∫0x3x3dydx=∫013x4dx=53,
E(Y)=∫01∫0x3xydydx=∫0123x3dx=83,
E(Y2)=∫01∫0x3xy2dydx=∫01x4dx=51,
所以
Var(X)=E(X2)−[E(X)]2=53−169=803,
Var(Y)=E(Y2)−[E(Y)]2=51−649=32019,
又因为
E(XY)=∫01∫0x3x2ydydx=∫0123x4dx=103,
所以
Cov(X,Y)=E(XY)−E(X)E(Y)=103−43×83=1603,
最后可得 X 与 Y 的相关系数
Corr(X,Y)=Var(X)Var(Y)Cov(X,Y)=3/8019/3203/160=573=0.397.
已知随机变量 X 与 Y 的相关系数为 ρ,求 X1=aX+b 与 Y1=cY+d 的相关系数,其中 a,b,c,d 均为非零常数.
解
先计算 X1 与 Y1 的方差与协方差:
Var(X1)=a2Var(X),Var(Y1)=c2Var(Y),Cov(X1,Y1)=acCov(X,Y).
然后计算 X1 与 Y1 的相关系数:
Corr(X1,Y1)=a2Var(X)c2Var(Y)acCov(X,Y).
所以当 a 与 c 同号时,
Corr(X1,Y1)=Var(X)Var(Y)Cov(X,Y)=ρ;
而当 a 与 c 异号时,
Corr(X1,Y1)=−Var(X)Var(Y)Cov(X,Y)=−ρ.
设随机变量 X1 与 X2 独立同分布,其共同分布为 Exp(λ).试求 Y1=4X1−3X2 与 Y2=3X1+X2 的相关系数.
解
先计算 Y1 与 Y2 的期望、方差与协方差:
E(X1)=E(X2)=λ1,Var(X1)=Var(X2)=λ21,
E(Y1)=4E(X1)−3E(X2)=λ1,Var(Y1)=16Var(X1)+9Var(X2)=λ225,
E(Y2)=3E(X1)+E(X2)=λ4,Var(Y2)=9Var(X1)+Var(X2)=λ210,
E(Y1Y2)=E[(4X1−3X2)(3X1+X2)]=E(12X12−5X1X2−3X22)=λ213,
Cov(Y1,Y2)=E(Y1Y2)−E(Y1)E(Y2)=λ213−λ24=λ29.
然后计算 Y1 与 Y2 的相关系数:
Corr(Y1,Y2)=Var(Y1)Var(Y2)Cov(Y1,Y2)=25/λ210/λ29/λ2=5109=0.5692.
设随机变量 X1 与 X2 独立同分布,其共同分布为 N(μ,σ2).试求 Y=aX1+bX2 与 Z=aX1−bX2 的相关系数,其中 a 与 b 为非零常数.
解
先计算 Y 与 Z 的期望、方差与协方差:
E(Y)=(a+b)μ,E(Z)=(a−b)μ,
Var(Y)=(a2+b2)σ2,Var(Z)=(a2+b2)σ2,
E(YZ)=E[(aX1+bX2)(aX1−bX2)]=E(a2X12−b2X22)=(a2−b2)(σ2+μ2),
Cov(Y,Z)=E(YZ)−E(Y)E(Z)=(a2−b2)σ2.
然后计算 Y 与 Z 的相关系数:
Corr(Y,Z)=Var(Y)Var(Z)Cov(Y,Z)=(a2+b2)σ2(a2−b2)σ2=a2+b2a2−b2.
设二维随机变量 (X,Y) 服从二维正态分布 N(0,0,1,1,ρ).
- 求 E(max{X,Y});
- 求 X−Y 与 XY 的协方差及相关系数.
解
(1) 由于
max{X,Y}=21(X+Y+∣X−Y∣),
所以
E(max{X,Y})=E[21(X+Y+∣X−Y∣)]=21E(∣X−Y∣).
因为 X−Y∼N(0,2(1−ρ)),所以
E(max{X,Y})=22π2(1−ρ)1∫−∞∞∣x∣exp{−4(1−ρ)x2}dx=π1−ρ.
(2) 因为
Cov(X−Y,XY)=Cov(X,XY)−Cov(Y,XY)
=E(X2Y)−E(X)E(XY)−E(XY2)+E(Y)E(XY).
所以由 E(X)=E(Y)=0,得
Cov(X−Y,XY)=E(X2Y)−E(XY2),
又由对称性 E(X2Y)=E(XY2),所以得
Cov(X−Y,XY)=0,Corr(X−Y,XY)=0.
这表明,当 (X,Y)∼N(0,0,1,1,ρ) 时,X−Y 与 XY 不相关.
设二维随机变量 (X,Y) 服从区域
D={(x,y):0<x<1, 0<x<y<1}
上的均匀分布,求 X 与 Y 的协方差及相关系数.
解
因为区域 D 的面积为 1/2,所以 (X,Y) 的联合密度函数为
pX,Y(x,y)={2,0,(x,y)∈D,(x,y)∈/D.
由此得 X 和 Y 各自的边际密度函数为
当 0<x<1 时,pX(x)=∫x12dy=2(1−x);
当 0<y<1 时,pY(y)=∫0y2dx=2y.
这表明 X∼Be(1,2),Y∼Be(2,1).由此可算得 X 与 Y 的期望与方差
E(X)=31,E(Y)=32,
E(X2)=61,E(Y2)=21,
Var(X)=181,Var(Y)=181.
另外还需计算 XY 的期望
E(XY)=∫01∫x12xydydx=41,
由此得 X 与 Y 的协方差及相关系数为
Cov(X,Y)=E(XY)−E(X)E(Y)=41−31×32=361,
Corr(X,Y)=Var(X)Var(Y)Cov(X,Y)=1/181/36=21.
设二维随机变量 (X,Y) 的联合密度函数为
p(x,y)=⎩⎨⎧76(x2+2xy),0,0<x<1, 0<y<2,其他.
求 X 与 Y 的协方差及相关系数.
解
先求 X 与 Y 的期望与方差
E(X)=∫01∫02x⋅76(x2+2xy)dydx=75,
E(Y)=∫01∫02y⋅76(x2+2xy)dydx=78,
E(X2)=∫01∫02x2⋅76(x2+2xy)dydx=7039,
E(Y2)=∫01∫02y2⋅76(x2+2xy)dydx=2134,
所以
Var(X)=7039−(75)2=49023,
Var(Y)=2134−(78)2=14746.
又因为
E(XY)=∫01∫02xy⋅76(x2+2xy)dydx=2117,
所以 X 与 Y 的协方差及相关系数为
Cov(X,Y)=E(XY)−E(X)E(Y)=2117−75×78=−1471,
Corr(X,Y)=Var(X)Var(Y)Cov(X,Y)=23/49046/147−1/147=−6915=−0.05613.
设二维随机变量 (X,Y) 在矩形
G={(x,y):0≤x≤2, 0≤y≤1}
上服从均匀分布,记
U={1,0,X>Y,X≤Y,V={1,0,X>2Y,X≤2Y.
求 U 和 V 的相关系数.
解
因为区域 G 的面积为 2,所以 (X,Y) 的联合密度函数为
pX,Y(x,y)={1/2,0,(x,y)∈G,(x,y)∈/G.
因此(如图 3.16)
P(U=0)=∫01dy∫0y21dx=41,P(U=1)=1−P(U=0)=43,
P(V=1)=∫02dx∫0x/221dy=21,P(V=0)=1−P(V=1)=21.
这说明:U∼b(1,3/4),V∼b(1,1/2),所以
Var(U)=43(1−43)=163,Var(V)=21(1−21)=41.
又因为
E(UV)=P(UV=1)=P(U=1,V=1)=P(X>Y,X>2Y)=P(X>2Y)=P(V=1)=21,
Cov(U,V)=21−43×21=81.
所以 U 和 V 的相关系数为
Corr(U,V)=Var(U)Var(V)Cov(U,V)=3/161/41/8=31=0.5774.
\FigureThreeSixteen
设二维随机变量 (X,Y) 的联合密度函数如下,试求 (X,Y) 的协方差矩阵:
1.
p1(x,y)={6xy2,0,0<x<1, 0<y<1,其他;
-
p2(x,y)=⎩⎨⎧8x+y,0,0<x<2, 0<y<2,其他.
解
(1) 因为 p1(x,y) 可分离变量,所以 X 与 Y 相互独立,由此知 Cov(X,Y)=0.又因为
E(X)=∫01∫01x⋅6xy2dxdy=32,E(X2)=∫01∫01x2⋅6xy2dxdy=21,
E(Y)=∫01∫01y⋅6xy2dxdy=43,E(Y2)=∫01∫01y2⋅6xy2dxdy=53,
所以
Var(X)=21−(32)2=181,Var(Y)=53−(43)2=803.
由此得 (X,Y) 的协方差矩阵为
Σ1=(1/18003/80).
(2) 利用 p2(x,y) 的对称性可得
E(X)=E(Y)=∫02∫02x⋅8x+ydydx=67,
E(X2)=E(Y2)=∫02∫02x2⋅8x+ydydx=35,
所以
Var(X)=Var(Y)=35−(67)2=3611.
又因为
E(XY)=∫02∫02xy⋅8x+ydydx=34,
所以
Cov(X,Y)=34−3649=−361.
由此得 (X,Y) 的协方差矩阵为
Σ2=(11/36−1/36−1/3611/36).
设 a 为区间 (0,1) 上的一个定点,随机变量 X 服从区间 (0,1) 上的均匀分布,以 Y 表示点 X 到 a 的距离.问 a 为何值时 X 与 Y 不相关.
解
由题设条件知 X∼U(0,1),Y=∣X−a∣,E(X)=1/2.又因为
E(Y)=∫01∣x−a∣dx=∫0a(a−x)dx+∫a1(x−a)dx=a2−a+21,
E(XY)=∫0ax(a−x)dx+∫a1x(x−a)dx=3a3−2a+31.
所以
Cov(X,Y)=3a3−2a2+121.
所以由 Cov(X,Y)=0 可得方程
4a3−6a2+1=0,
此方程等价于
(2a−1)(2a2−2a−1)=0,
从中解得在 (0,1) 内的实根为 a=0.5,即 a=0.5 时,X 与 Y 不相关.
设随机变量 (X1,X2,X3) 满足条件
aX1+bX2+cX3=0,
E(X1)=E(X2)=E(X3)=d,
Var(X1)=Var(X2)=Var(X3)=σ2.
其中 a,b,c,d,σ2 均为常数,求相关系数 ρ12,ρ23,ρ31.
解
对等式 aX1+bX2=−cX3 的两边求方差得
a2σ2+b2σ2+2abσ2ρ12=c2σ2,
由此解得
ρ12=2abc2−a2−b2.
同理,对等式 aX1+cX3=−bX2 的两边求方差可得
ρ13=2acb2−a2−c2,
同理,对等式 bX2+cX3=−aX1 的两边求方差可得
ρ23=2bca2−b2−c2.
进一步当 d=0 时,对等式 aX1+bX2+cX3=0 的两边求期望得 (a+b+c)d=0,所以有
a+b+c=0,
由此可得
c2=a2+b2+2ab,b2=a2+c2+2ac,a2=b2+c2+2bc,
将上面三个式子分别代入 ρ12,ρ13,ρ23 的表达式中,可得
ρ12=ρ13=ρ23=1.
设随机变量 X 与 Y 都只能取两个值,试证:X 与 Y 的独立性与不相关性是等价的.
解
因为独立必定不相关,所以只需证:若 X 与 Y 不相关,则 X 与 Y 独立.不失一般性,可设 X 与 Y 只取 0 与 1 两个值,否则可设 X 的可能取值为 a,b;Y 的可能取值为 c,d.又记
X1=b−aX−a,Y1=d−cY−c.
所以 X1 与 Y1 的可能取值均为 0,1.
由 X 与 Y 不相关可得(见前面第 29 题)X1 与 Y1 不相关.所以只需证 X1 与 Y1 是独立的.记 (X1,Y1) 的联合分布列与各自的边际分布如下表所示:
| X1 | Y1 | | |
|---|
| \cmidrule(lr){2-3} | 0 | 1 | |
| 0 | p11 | p12 | 1−α |
| 1 | p21 | p22 | α |
| 1−β | β | |
由此可得
E(X1)=α,E(Y1)=β,E(X1Y1)=P(X1=1,Y1=1)=p22.
由 X1 与 Y1 的不相关性可得:p22=αβ.将此代入联合分布列与边际分布列的关系式
⎩⎨⎧p11+p12=1−α,p21+αβ=α,p11+p21=1−β,p12+αβ=β,
即可得
p11=(1−α)(1−β),p12=(1−α)β,p21=α(1−β),p22=αβ,
即 X1 与 Y1 独立,从而证得 X 与 Y 独立.
设随机变量 X 服从区间 (−0.5,0.5) 上的均匀分布,Y=cosX,则 X 与 Y 有函数关系.试求 Cov(X,Y).
解
因为 E(X)=0,所以
Cov(X,Y)=E(XY)=E(XcosX)=∫−0.50.5xcosxdx=0.
即 X 与 Y 不相关.
设二维随机变量 (X,Y) 服从单位圆内的均匀分布,其联合密度函数为
p(x,y)=⎩⎨⎧π1,0,x2+y2<1,x2+y2≥1.
试证 X 与 Y 不独立且 X 与 Y 不相关.
解
先求边际密度函数 pX(x) 和 pY(y).
pX(x)=∫−1−x21−x2π1dy=π21−x2,−1<x<1,
pY(y)=∫−1−y21−y2π1dx=π21−y2,−1<y<1.
所以由 p(x,y)=pX(x)pY(y),知 X 与 Y 不独立.
又因为 pX(x) 和 pY(y) 在对称区间上是偶函数,故 E(X)=E(Y)=0,从而
Cov(X,Y)=E(XY)=π1∫−11∫−1−x21−x2xydydx=0,
所以 X 与 Y 不相关.
设随机向量 (X1,X2,X3) 的相关系数分别为 ρ12,ρ23,ρ31,证明
ρ122+ρ232+ρ312≤1+2ρ12ρ23ρ31.
解
记标准化变量为
Xi∗=Var(Xi)Xi−E(Xi),i=1,2,3.
因为 E(Xi∗)=0,Var(Xi∗)=1,所以(由前面第 29 题)
Corr(Xi,Xj)=Cov(Xi∗,Xj∗)=E(Xi∗Xj∗)=ρij,i,j=1,2,3, i=j.
考虑到 ρij=ρji,故 (X1∗,X2∗,X3∗) 的协方差阵的行列式为
∣Σ∣=1ρ12ρ13ρ121ρ23ρ13ρ231=1+2ρ12ρ23ρ13−ρ122−ρ132−ρ232.
再由协方差阵的非负定性,可得
1+2ρ12ρ23ρ13−ρ122−ρ132−ρ232≥0,
移项即得结论.
设随机向量 (X1,X2,X3) 的相关系数分别为 ρ12,ρ23,ρ31,且
E(X1)=E(X2)=E(X3)=0,Var(X1)=Var(X2)=Var(X3)=σ2,
令
Y1=X1+X2,Y2=X2+X3,Y3=X3+X1.
证明:Y1,Y2,Y3 两两不相关的充要条件为 ρ12+ρ23+ρ31=−1.
解
充分性:若 ρ12+ρ23+ρ31=−1,则
Cov(Y1,Y2)=Cov(X1+X2,X2+X3)=Cov(X1,X2)+Cov(X1,X3)+Cov(X2,X2)+Cov(X2,X3)=ρ12Var(X1)Var(X2)+ρ13Var(X1)Var(X3)+ρ23Var(X2)Var(X3)+Var(X2)=σ2(ρ12+ρ13+ρ23)+σ2=−σ2+σ2=0.
同理可得
Cov(Y1,Y3)=Cov(Y2,Y3)=0,
由此得 Y1,Y2,Y3 两两不相关.
必要性:若 Y1,Y2,Y3 两两不相关,则由上面的推导可知
Cov(Y1,Y2)=σ2(ρ12+ρ13+ρ23)+σ2=0,
由此得
ρ12+ρ13+ρ23=−1.
设随机变量 X∼N(0,1),Y 各以 0.5 的概率取值 ±1,且假定 X 与 Y 相互独立.令 Z=X⋅Y,证明:
- Z∼N(0,1);
- X 与 Z 不相关,但不独立.
解
(1) 由全概率公式可得
FZ(z)=P(XY≤z)=P(Y=1)P(XY≤z∣Y=1)+P(Y=−1)P(XY≤z∣Y=−1)=P(Y=1)P(X≤z)+P(Y=−1)P(X≥−z)=0.5Φ(z)+0.5(1−Φ(−z))=Φ(z),
所以
Z∼N(0,1).
(2) 因为 E(X)=0,E(Y)=0,且 X 与 Y 相互独立,所以
Cov(X,Z)=E(X2Y)−E(X)E(XY)=E(X2)E(Y)−E(X)E(XY)=0,
所以 X 与 Z 不相关.为证明 X 与 Z 是不独立的,我们考虑如下特定事件的概率,并对其使用全概率公式
P(X≤1,XY≥1)=P(Y=1)P(X≤1,XY≥1∣Y=1)+P(Y=−1)P(X≤1,XY≥1∣Y=−1)=0.5P(X≤1,X≥1)+0.5P(X≤1,−X≥1)=0.5P(X=1)+0.5P(X≤−1)=0.5(1−Φ(1)).
考虑到 Z=XY∼N(0,1),故有
P(X≤1)P(XY≥1)=Φ(1)(1−Φ(1)),
而 Φ(1)=0.5,所以
P(X≤1,XY≥1)=P(X≤1)P(XY≥1),
即 X 与 Z 不独立.
设随机变量 X 有密度函数 p(x),且密度函数 p(x) 是偶函数,假定 E(∣X∣3)<∞.证明:X 与 Y=X2 不相关,但不独立.
解
因为 p(x) 是偶函数,所以 E(X)=E(X3)=0,从而
Cov(X,X2)=0,
这表明 X 与 Y=X2 不相关.为证明 X 与 Y 不相互独立,特给定 a>0,使得 P(X≤a)<1.现考虑如下特定事件的概率
P(X≤a,X2≤a2)=P(−a≤X≤a)P(X≤a)P(−a≤X≤a)=P(X≤a)P(X2≤a2),
所以 X 与 Y=X2 不独立.
设二维随机向量 (X,Y) 服从二维正态分布,且
E(X)=E(Y)=0,E(XY)<0.
证明:对任意正常数 a,b 有
P(X≥a,Y≥b)≤P(X≥a)P(Y≥b).
解
记 (X,Y)∼N(0,0,σ12,σ22,ρ),则
P(X≥a,Y≥b)=2πσ1σ21−ρ21∫a∞∫b∞exp{−2(1−ρ2)1(σ12x2+σ22y2−σ1σ22ρxy)}dydx.
由条件知 ρ<0,所以
exp{2(1−ρ2)σ1σ22ρxy}≤1,
由此得
P(X≥a,Y≥b)≤2πσ1σ21−ρ21∫a∞∫b∞exp{−2(1−ρ2)1(σ12x2+σ22y2)}dydx.
令
u=1−ρ2x,v=1−ρ2y,
则 dydx=(1−ρ2)dvdu,所以
P(X≥a,Y≥b)≤2πσ1σ21−ρ2∫a′∞∫b′∞exp(−2σ12u2−2σ22v2)dvdu,
其中
a′=1−ρ2a,b′=1−ρ2b.
又由 ρ2≤1,知
P(X≥a,Y≥b)≤2πσ1σ21∫a′∞∫b′∞exp(−2σ12u2−2σ22v2)dvdu=P(U≥a′)P(V≥b′)=P(X≥a)P(Y≥b).
这就完成不等式的证明.
设随机向量 (X,Y) 满足
E(X)=E(Y)=0,Var(X)=Var(Y)=1,Cov(X,Y)=ρ.
证明:
E(max{X2,Y2})≤1+1−ρ2.
解
由 E(X)=E(Y)=0,E(X2)=E(Y2)=1,知 Corr(X,Y)=E(XY)=ρ,所以
E(max{X2,Y2})=21E(X2+Y2+∣X2−Y2∣)=1+21E(∣X2−Y2∣)=1+21E(∣X−Y∣∣X+Y∣)≤1+21E∣X+Y∣2⋅E∣X−Y∣2≤1+21[E(X2)+E(Y2)+2E(XY)][E(X2)+E(Y2)−2E(XY)]=1+214−4ρ2=1+1−ρ2.
设随机变量 X1,X2,…,Xn 中任意两个的相关系数都是 ρ,试证:ρ≥−n−11.
解
因为
0≤E[i=1∑n(Xi−E(Xi))]2
=i=1∑nVar(Xi)+2ρ1≤i<j≤n∑Var(Xi)Var(Xj)
≤i=1∑nVar(Xi)+ρ1≤i<j≤n∑[Var(Xi)+Var(Xj)]
=i=1∑nVar(Xi)[1+ρ(n−1)],
所以 1+ρ(n−1)≥0,由此得
ρ≥−n−11.
设 X1,X2,…,Xn 是独立同分布的正值随机变量,证明:
E(X1+X2+⋯+XnX1+X2+⋯+Xk)=nk(k≤n).
解
记
Yj=∑i=1nXiXj,
则 Yj 同分布,且由 ∣Yj∣≤1,知 E(Yj) 存在且相等,j=1,2,…,n.又因为
1=E(j=1∑nYj)=nE(Y1),
所以有
E(Yj)=n1,j=1,2,…,n.
由此得
E(X1+X2+⋯+XnX1+X2+⋯+Xk)=E(Y1+Y2+⋯+Yk)=kE(Y1)=nk.
补充习题及解答
设随机变量 X 与 Y 相互独立,且方差存在.证明:
Var(XY)=Var(X)⋅Var(Y)+[E(X)]2Var(Y)+[E(Y)]2Var(X).
解
Var(XY)=E(X2Y2)−[E(XY)]2=E(X2)⋅E(Y2)−[E(X)]2[E(Y)]2=[Var(X)+[E(X)]2][Var(Y)+[E(Y)]2]−[E(X)]2[E(Y)]2=Var(X)⋅Var(Y)+Var(X)[E(Y)]2+Var(Y)[E(X)]2.
讨论:
(1) 若 E(X)=E(Y)=0,则有
Var(XY)=Var(X)Var(Y).
(2) 若 E(X)=μ1,E(Y)=μ2,则有
Var[(X−μ1)(Y−μ2)]=Var(X−μ1)Var(Y−μ2).
(3) 一般场合下,若 E(Xi)=μi,i=1,2,…,n,则有
Var[i=1∏n(Xi−μi)]=i=1∏nVar(Xi).
设 (X1,X2,…,Xn) 为 n 维随机变量,其协方差矩阵 B=(bij) 存在.证明:若 ∣B∣=0,则以概率 1 在各分量之间存在线性关系,即存在一组不全为零的实数 c1,c2,…,cn,使得
P(c1X1+c2X2+⋯+cnXn=常数)=1.
解
由于 ∣B∣=0 意味着 B 非满秩,故存在一组不全为零的实数向量
CT=(c1,c2,…,cn),
使得 CTBC=0.
另一方面,
CTBC=1≤i,j≤n∑cicjE[(Xi−E(Xi))(Xj−E(Xj))]=E{1≤i,j≤n∑[ciXi−E(ciXi)][cjXj−E(cjXj)]}=E{i=1∑n[ciXi−E(ciXi)]}2=Var(i=1∑nciXi).
方差为零的随机变量必几乎处处为常数,故存在常数 a,使得
P(c1X1+c2X2+⋯+cnXn=a)=1.
设随机变量 X1,X2,…,Xn 相互独立、同服从 N(0,1),证明:
U=i=1∑naiXi,V=i=1∑nbiXi
相互独立的充要条件为
i=1∑naibi=0,
其中诸 ai 与 bi 均为实数.
解
由于正态随机变量的线性组合仍为正态变量,而两个正态变量相互独立的充要条件是其协方差为 0,即 Cov(U,V)=0,如今已知 E(U)=E(V)=0,故 Cov(U,V)=0 的充要条件为 E(UV)=0,实际上
E(UV)=E(i=1∑naiXi)(j=1∑nbjXj)=E(i=1∑naibiXi2)+Ei=j∑aibjXiXj=i=1∑naibi.
这表明:U 与 V 相互独立的充要条件是
i=1∑naibi=0.
应用:在 n=2 场合,该命题表明 X1+X2 与 X1−X2 相互独立;X1+2X2 与 2X1−X2 独立,但 X1+2X2 与 2X1+X2 相依.
考虑:对一般正态分布 N(μ,σ2),上述命题是否仍成立?
§3.5 条件分布与条件期望
条件分布是描述随机变量间相关关系的重要工具。条件期望是计算无条件期望的另一有效途径。要掌握重期望公式的使用方法。
1. 离散随机变量的条件分布
(1)条件分布列 对一切使 P(Y=yj)=p⋅j=∑i=1∞pij>0 的 yj,称
pi∣j=P(X=xi∣Y=yj)=P(Y=yj)P(X=xi,Y=yj)=p⋅jpij,i=1,2,…
为给定 Y=yj 条件下 X 的条件分布列.
同理,对一切使 P(X=xi)=pi⋅=∑j=1∞pij>0 的 xi,称
pj∣i=P(Y=yj∣X=xi)=P(X=xi)P(X=xi,Y=yj)=pi⋅pij,j=1,2,…
为给定 X=xi 条件下 Y 的条件分布列.
(2)条件分布函数 给定 Y=yj 条件下 X 的条件分布函数为
F(x∣yj)=xi≤x∑P(X=xi∣Y=yj)=xi≤x∑pi∣j,
给定 X=xi 条件下 Y 的条件分布函数为
F(y∣xi)=yj≤y∑P(Y=yj∣X=xi)=yj≤y∑pj∣i.
2. 连续随机变量的条件分布 对一切使 pY(y)>0 的 y,给定 Y=y 条件下 X 的条件密度函数和条件分布函数分别为
p(x∣y)=pY(y)p(x,y),F(x∣y)=∫−∞xp(u∣y)du=∫−∞xpY(y)p(u,y)du.
类似对一切使 pX(x)>0 的 x,给定 X=x 条件下 Y 的条件密度函数和条件分布函数分别为
p(y∣x)=pX(x)p(x,y),F(y∣x)=∫−∞yp(v∣x)dv=∫−∞ypX(x)p(x,v)dv.
3. 连续场合的全概率公式和贝叶斯公式
(1)全概率公式的密度函数形式:
pY(y)=∫−∞∞pX(x)p(y∣x)dx,pX(x)=∫−∞∞pY(y)p(x∣y)dy.
(2)贝叶斯公式的密度函数形式:
p(x∣y)=∫−∞∞pX(x)p(y∣x)dxpX(x)p(y∣x),p(y∣x)=∫−∞∞pY(y)p(x∣y)dypY(y)p(x∣y).
4. 条件数学期望 条件分布的数学期望(若存在)称为条件期望,其定义如下:
E(X∣Y=y)={∑xiP(X=xi∣Y=y),∫−∞∞xp(x∣y)dx,(X,Y) 为二维离散随机变量,(X,Y) 为二维连续随机变量,
E(Y∣X=x)={∑yjP(Y=yj∣X=x),∫−∞∞yp(y∣x)dy,(X,Y) 为二维离散随机变量,(X,Y) 为二维连续随机变量.
- 条件期望具有数学期望的一切性质.
- 条件期望 E(X∣Y=y) 是 y 的函数,记为 g(y),它是另一个随机变量 g(Y)=E(X∣Y) 的取值.E(X∣Y) 与 E(X∣Y=y) 虽都称为条件期望,但含义不同.前者是特定的随机变量,后者是其取值.
5. 重期望公式 设 (X,Y) 是二维随机变量,若 E(X) 存在,则
E(X)=E[E(X∣Y)].
注意:该公式中里面的期望是用条件分布 p(x∣y) 计算的,外面的期望是用 y 的分布 p(y) 计算的.
6. 二维正态分布 N(μ1,μ2,σ12,σ22,ρ) 的两个条件分布仍是正态分布,即
X∣Y=y∼N(g1(y),σ12(1−ρ2)),
其中
g1(y)=E(X∣Y=y)=μ1+ρσ2σ1(y−μ2).
Y∣X=x∼N(g2(x),σ22(1−ρ2)),
其中
g2(x)=E(Y∣X=x)=μ2+ρσ1σ2(x−μ1).
可见,在二维正态分布中,一个变量的条件期望是另一个变量取值的线性函数,常称为一元线性回归方程.
习题与解答 3.5
以 X 记某医院一天内诞生婴儿的个数,以 Y 记其中男婴的个数.设 X 与 Y 的联合分布为
P(X=n,Y=m)=m!(n−m)!e−14(7.14)m(6.86)n−m,m=0,1,…,n,n=0,1,2,…
试求条件分布列 P(Y=m∣X=n).
解
先求 X 的边际分布列
P(X=n)=m=0∑nm!(n−m)!e−14(7.14)m(6.86)n−m=n!14ne−14m=0∑n(mn)(147.14)m(146.86)n−m.
P(X=n)=n!14ne−14,n=0,1,…
所以 X 服从参数为 14 的泊松分布.由此得
P(Y=m∣X=n)=P(X=n)P(X=n,Y=m)=m!(n−m)!e−14(7.14)m(6.86)n−m⋅14ne−14n!=(mn)(147.14)m(146.86)n−m,m=0,1,…,n.
这是二项分布 b(n,0.51).
一射手单发命中目标的概率为 p(0<p<1),射击进行到命中目标两次为止.设 X 为第一次命中目标所需的射击次数,Y 为总共进行的射击次数,求 (X,Y) 的联合分布和条件分布.
解
只论命中与不命中的试验是伯努利试验.在一伯努利试验序列中,首次命中的射击次数 X 服从几何分布 Ge(p),即
P(X=x)=(1−p)x−1p,x=1,2,…,
其中 p 为命中概率;第二次命中目标的射击次数 Y 服从负二项分布 Nb(2,p),即
P(Y=y)=(1y−1)(1−p)y−2p2,y=2,3,….
由于 X 与 Y−X 相互独立,所以条件分布
P(Y=y∣X=x)=P(Y−X=y−x∣X=x)=P(Y−X=y−x)=(1−p)y−x−1p,x=1,2,…,y−1, y=2,3,….
从而 (X,Y) 的联合分布列为
P(X=x,Y=y)=P(X=x)P(Y=y∣X=x)=P(X=x)P(Y−X=y−x)=(1−p)x−1p⋅(1−p)y−x−1p=(1−p)y−2p2,x=1,2,…,y−1, y=2,3,….
另一条件分布
P(X=x∣Y=y)=P(Y=y)P(X=x,Y=y)=(y−1)(1−p)y−2p2(1−p)y−2p2=y−11,y=2,3,….
注:从以上条件分布列 P(X=x∣Y=y) 可知:在已知第二次命中目标的射击次数为 y 的条件下,第一次命中目标的射击次数 X 是在前面 y−1 次射击中等可能的.
已知 (X,Y) 的联合分布列如下:
P(X=1,Y=1)=P(X=2,Y=1)=81,
P(X=1,Y=2)=41,P(X=2,Y=2)=21.
试求:
- 已知 Y=i 的条件下,X 的条件分布列,i=1,2;
- X 与 Y 是否独立?
解
- 因为
P(Y=1)=P(X=1,Y=1)+P(X=2,Y=1)=41,
P(Y=2)=P(X=1,Y=2)+P(X=2,Y=2)=43.
所以在给定 Y=1 的条件下,X 的条件分布列为
P(X=1∣Y=1)=1/41/8=21,
P(X=2∣Y=1)=1/41/8=21.
在给定 Y=2 的条件下,X 的条件分布列为
P(X=1∣Y=2)=3/41/4=31,
P(X=2∣Y=2)=3/41/2=32.
- 因为
P(X=1)=P(X=1,Y=1)+P(X=1,Y=2)=81+41=83,
所以由
P(X=1,Y=1)=81=P(X=1)P(Y=1)=83⋅41
知 X 与 Y 不独立.
设随机变量 X 与 Y 独立同分布,试在以下情形下求 P(X=k∣X+Y=m):
- X 与 Y 都服从参数为 p 的几何分布;
- X 与 Y 都服从参数为 (n,p) 的二项分布.
解
- 因为 X+Y 服从负二项分布 Nb(2,p),所以
P(X+Y=m)=(m−1)(1−p)m−2p2.
由此得,当 m=2,3,…,k=1,2,…,m−1 时,
P(X=k∣X+Y=m)=P(X+Y=m)P(X=k,X+Y=m)=(m−1)(1−p)m−2p2(1−p)m−2p2=m−11.
注:与本节第 2 题一样,在 X+Y=m 的条件下,X 等可能地取值 1,2,…,m−1.
- 因为 X+Y∼b(2n,p),所以
P(X=k∣X+Y=m)=P(X+Y=m)P(X=k,Y=m−k)=(m2n)pm(1−p)2n−m(kn)pk(1−p)n−k(m−kn)pm−k(1−p)n−m+k=(m2n)(kn)(m−kn),
其中
m=0,1,2,…,2n,k=0,1,2,…,min{n,m}.
注:此题说明,在 X+Y=m 的条件下,X 服从超几何分布.如果将此题改成
X∼b(n1,p),Y∼b(n2,p),
且 X 与 Y 相互独立,则可得
P(X=k∣X+Y=m)=(mn1+n2)(kn1)(m−kn2),
其中
m=0,1,2,…,n1+n2,k=0,1,…,min{n1,m}.
设二维连续随机变量 (X,Y) 的联合密度函数为
p(x,y)={3x,0,0<x<1, 0<y<x,其他.
试求条件密度函数 p(y∣x).
解
因为当 0<x<1 时,
pX(x)=∫0x3xdy=3x2,
所以当 0<x<1 时,
p(y∣x)=pX(x)p(x,y)=⎩⎨⎧x1,0,0<y<x,其他.
这是均匀分布 U(0,x),其中 0<x<1.可见,这里的条件分布实质上是一族均匀分布.
设二维连续随机变量 (X,Y) 的联合密度函数为
p(x,y)={1,0,∣y∣<x, 0<x<1,其他.
求条件密度函数 p(x∣y).
解
因为 p(x,y) 的非零区域为图 3.17 的阴影部分,所以当 −1<y<0 时,
pY(y)=∫−y1dx=1+y=1−∣y∣;
而当 0<y<1 时,
pY(y)=∫y1dx=1−y=1−∣y∣.
由此得
p(x∣y)=pY(y)p(x,y)=⎩⎨⎧1−∣y∣1,0,∣y∣<x<1,其他.
这是均匀分布 U(∣y∣,1),其中 ∣y∣<1.
\FigureThreeSeventeen
设二维连续随机变量 (X,Y) 的联合密度函数为
p(x,y)=⎩⎨⎧421x2y,0,x2≤y≤1,其他.
求条件概率 P(Y≥0.75∣X=0.5).
解
因为
P(Y≥0.75∣X=0.5)=∫0.751p(y∣x=0.5)dy,
故先求 p(y∣x).
而 p(x,y) 的非零区域为图 3.18 的阴影部分,所以当 −1<x<1 时,
pX(x)=∫x21421x2ydy=821x2(1−x4).
因而当 −1<x<1 时,
p(y∣x)=pX(x)p(x,y)=⎩⎨⎧1−x42y,0,x2<y<1,其他.
所以当 0<y<1 时,
p(y∣x=0.5)=1532y.
由此得
P(Y≥0.75∣X=0.5)=∫0.7511532ydy=157.
\FigureThreeEighteen
已知随机变量 Y 的密度函数为
pY(y)={5y4,0,0<y<1,其他,
在给定 Y=y 条件下,随机变量 X 的条件密度函数为
p(x∣y)=⎩⎨⎧y33x2,0,0<x<y<1,其他.
求概率 P(X>0.5).
解
因为
p(x,y)=pY(y)p(x∣y)={15x2y,0,0<x<y<1,其他,
所以
P(X>0.5)=∫0.51∫x115x2ydydx=∫0.51215x2(1−x2)dx=6447.
设随机变量 X 服从 (1,2) 上的均匀分布,在 X=x 的条件下,随机变量 Y 的条件分布是参数为 x 的指数分布,证明:XY 服从参数为 1 的指数分布.
解
因为
X∼U(1,2),Y∣X=x∼Exp(x),
所以
p(x,y)=pX(x)p(y∣x)=xe−xy,1<x<2, y>0.
令
{U=XY,V=X,则{u=xy,v=x,
其逆变换为
{x=v,y=vu.
此变换的雅可比行列式为
J=∂u∂x∂u∂y∂v∂x∂v∂y=0v11−v2u=−v1.
所以 (U,V) 的联合密度函数为
pU,V(u,v)=pX,Y(v,vu)−v1=ve−v⋅u/v⋅v1=e−u,1<v<2, u>0.
由此得 U=XY 的边际密度函数为
pU(u)=∫12e−udv=e−u,u>0.
这表明:U=XY 服从参数为 1 的指数分布.
设二维离散随机变量 (X,Y) 的联合分布列为
X\Y012345000.010.030.050.070.0910.010.020.040.050.060.0820.010.030.050.050.050.0630.010.020.040.060.060.05
试求 E(X∣Y=2) 和 E(Y∣X=0).
解
因为
P(X=i∣Y=2)=P(Y=2)P(X=i,Y=2),
所以用 Y=2 这一列的各个概率 (P(X=i,Y=2)) 除以此列的总和 (P(Y=2)=0.25),得
X∣Y=2P00.0410.1220.2030.2040.2050.24
由此得
E(X∣Y=2)=1×0.12+2×0.20+3×0.20+4×0.20+5×0.24=3.12.
同理,用 X=0 这一行的各个概率 (P(X=0,Y=j)) 除以此行的总和 (P(X=0)=0.03),得
Y∣X=0P00131231331
由此得
E(Y∣X=0)=1×31+2×31+3×31=2.
注:这个二维离散随机变量的联合分布列含有 2 个边际分布、10 个条件分布.可见,多维联合分布含有丰富的信息,可根据需要从中提取之.这个习题只涉及其中两个条件分布的数学期望.
设随机变量 X 与 Y 相互独立,分别服从参数为 λ1 和 λ2 的泊松分布,试求 E(X∣X+Y=n).
解
因为 X+Y∼P(λ1+λ2),所以
P(X=i∣X+Y=n)=P(X+Y=n)P(X=i,X+Y=n)=P(X+Y=n)P(X=i)P(Y=n−i)=n!(λ1+λ2)ne−(λ1+λ2)i!λ1ie−λ1⋅(n−i)!λ2n−ie−λ2=(in)(λ1+λ2λ1)i(λ1+λ2λ2)n−i,i=0,1,…,n.
这说明:X∣X+Y=n 服从二项分布 b(n,p),其中
p=λ1+λ2λ1,
所以
E(X∣X+Y=n)=np=λ1+λ2nλ1.
设二维连续随机变量 (X,Y) 的联合密度函数为
p(x,y)={x+y,0,0<x, y<1,其他.
试求 E(X∣Y=0.5).
解
先求条件密度函数 p(x∣y).当 0<y<1 时,
pY(y)=∫01(x+y)dx=0.5+y.
所以
p(x∣y=0.5)={x+0.5,0,0<x<1,其他.
由此得
E(X∣Y=0.5)=∫01x(x+0.5)dx=127.
设二维连续随机变量 (X,Y) 的联合密度函数为
p(x,y)={24(1−x)y,0,0<y<x<1,其他.
试在 0<y<1 时,求 E(X∣Y=y).
解
先求条件密度函数 p(x∣y).当 0<y<1 时,
pY(y)=∫y124(1−x)ydx=12y(1−y)2.
所以
p(x∣y)=pY(y)p(x,y)=⎩⎨⎧(1−y)22(1−x),0,0<y<x<1,其他.
由此得,在 0<y<1 时,
E(X∣Y=y)=∫−∞∞xp(x∣y)dx=∫y1x⋅(1−y)22(1−x)dx=32y+1.
设 E(Y),E[h(Y)] 存在,试证:E[h(Y)∣Y]=h(Y).
解
因为 E[h(Y)∣Y] 是随机变量 Y 的函数,记
g(Y)=E[h(Y)∣Y],
它仍是随机变量.在离散场合,当 Y=yi 时,g(yi) 以概率 P(Y=yi) 取
g(yi)=E[h(yi)∣Y=yi].
由于在 Y 取固定值 yi 时,h(yi) 也是常数,故有
g(yi)=E[h(yi)∣Y=yi]=h(yi)⋅E(1∣Y=yi)=h(yi),i=1,2,….
上式对 Y 的任一取值都成立,即
E[h(Y)∣Y]=h(Y).
在连续场合也有类似解释,所以在一般场合有
E[h(Y)∣Y]=h(Y).
设以下所涉及的数学期望均存在,试证:
- E[g(X)Y∣X]=g(X)E(Y∣X);
- E(XY)=E[XE(Y∣X)];
- Cov[X,E(Y∣X)]=Cov(X,Y).
解
- 由
E[g(X)Y∣X=x]=g(x)E(Y∣X=x)
知
E[g(X)Y∣X]=g(X)E(Y∣X).
- 因为
E(XY)=E[E(XY∣X)],
又由(1)知
E(XY∣X)=XE(Y∣X),
所以有
E(XY)=E[XE(Y∣X)].
-
Cov[X,E(Y∣X)]=E[X⋅E(Y∣X)]−E(X)⋅E(Y)=E(XY)−E(X)⋅E(Y)=Cov(X,Y).
设随机变量 X 与 Y 独立同分布,都服从参数为 λ 的指数分布.令
Z={3X+1,6Y,X≥Y,X<Y.
求 E(Z).
解
此题有两种计算方法,现分述如下:
解法一 直接按照二元函数期望公式计算
E(Z)=∬x≥y(3x+1)λ2e−λ(x+y)dxdy+∬x<y6yλ2e−λ(x+y)dxdy=∫0∞(3x+1)λe−λxdx∫0xλe−λydy+∫0∞6yλe−λydy∫0yλe−λxdx=∫0∞(3x+1)λe−λx(1−e−λx)dx+∫0∞6yλe−λy(1−e−λy)dy=∫0∞(3x+1)λe−λx(1−e−λx)dx+∫0∞6xλe−λx(1−e−λx)dx=∫0∞(9x+1)λe−λx(1−e−λx)dx=∫0∞(9x+1)λe−λxdx−∫0∞(9x+1)λe−2λxdx=λ9+1−21∫0∞(9x+1)2λe−2λxdx=λ9+1−21(2λ9+1)=21+4λ27.
解法二 利用条件期望计算
在 X=x 给定时,
Z={3x+1,6Y,x≥Y,x<Y,
是关于 Y 的函数.于是
E(Z∣X=x)=∫0x(3x+1)λe−λydy+∫x∞6yλe−λydy=(3x+1)(1−e−λx)+6xe−λx+λ6e−λx=3x+1+e−λx(3x+λ6−1).
因此
E(Z)=E[E(Z∣X)]=E[3X+1+e−λX(3X+λ6−1)]=3E(X)+1+∫0∞λe−2λx(3x+λ6−1)dx=λ3+1+21∫0∞2λe−2λx(3x+λ6−1)dx=λ3+1+21(2λ3+λ6−1)=21+4λ27.
设随机变量 X∼N(μ,1),Y∼N(0,1),且 X 与 Y 相互独立,令
I={1,0,Y<X,X≤Y.
试证明:
- E(I∣X=x)=Φ(x);
- E[Φ(X)]=P(Y<X);
- E[Φ(X)]=Φ(μ/2).
(提示:X−Y 的分布是什么?)
解
1.
E(I∣X=x)=P(I=1∣X=x)=P(Y<X∣X=x)=P(Y<x)=Φ(x).
- 由(1)知,Φ(X)=E(I∣X),所以
E[Φ(X)]=E[E(I∣X)]=E(I)=P(I=1)=P(Y<X).
- 由(2)知
E[Φ(X)]=P(Y<X)=P(X−Y>0).
因为 X 与 Y 相互独立,所以
X−Y∼N(μ,2),
由此得
P(X−Y>0)=1−Φ(−μ/2)=Φ(μ/2).
设 X1,X2,… 为独立同分布的随机变量序列,且方差存在.随机变量 N 只取正整数值,Var(N) 存在,且 N 与 {Xn} 独立.证明:
Var(i=1∑NXi)=Var(N)[E(X1)]2+E(N)Var(X1).
解
因为
E(i=1∑NXi)=n=1∑∞E(i=1∑nXi)P(N=n)=n=1∑∞nE(X1)P(N=n)=E(X1)E(N),
并且
E(i=1∑NXi)2=n=1∑∞E(i=1∑nXi)2P(N=n)=n=1∑∞{nE(X12)+n(n−1)[E(X1)]2}P(N=n)=n=1∑∞{nVar(X1)+n2[E(X1)]2}P(N=n)=E(N)Var(X1)+E(N2)[E(X1)]2.
所以
Var(i=1∑NXi)=E(N)Var(X1)+E(N2)[E(X1)]2−[E(X1)]2[E(N)]2=Var(N)[E(X1)]2+E(N)Var(X1).
评论
支持 Markdown 和 LaTeX 数学公式。