§3.5 条件分布与条件期望
依赖于
被以下题目直接调用
正文部分
§3.5 条件分布与条件期望
条件分布是描述随机变量间相关关系的重要工具。条件期望是计算无条件期望的另一有效途径。要掌握重期望公式的使用方法。
1. 离散随机变量的条件分布
(1)条件分布列 对一切使 P(Y=yj)=p⋅j=∑i=1∞pij>0 的 yj,称
pi∣j=P(X=xi∣Y=yj)=P(Y=yj)P(X=xi,Y=yj)=p⋅jpij,i=1,2,…
为给定 Y=yj 条件下 X 的条件分布列.
同理,对一切使 P(X=xi)=pi⋅=∑j=1∞pij>0 的 xi,称
pj∣i=P(Y=yj∣X=xi)=P(X=xi)P(X=xi,Y=yj)=pi⋅pij,j=1,2,…
为给定 X=xi 条件下 Y 的条件分布列.
(2)条件分布函数 给定 Y=yj 条件下 X 的条件分布函数为
F(x∣yj)=xi≤x∑P(X=xi∣Y=yj)=xi≤x∑pi∣j,
给定 X=xi 条件下 Y 的条件分布函数为
F(y∣xi)=yj≤y∑P(Y=yj∣X=xi)=yj≤y∑pj∣i.
2. 连续随机变量的条件分布 对一切使 pY(y)>0 的 y,给定 Y=y 条件下 X 的条件密度函数和条件分布函数分别为
p(x∣y)=pY(y)p(x,y),F(x∣y)=∫−∞xp(u∣y)du=∫−∞xpY(y)p(u,y)du.
类似对一切使 pX(x)>0 的 x,给定 X=x 条件下 Y 的条件密度函数和条件分布函数分别为
p(y∣x)=pX(x)p(x,y),F(y∣x)=∫−∞yp(v∣x)dv=∫−∞ypX(x)p(x,v)dv.
3. 连续场合的全概率公式和贝叶斯公式
(1)全概率公式的密度函数形式:
pY(y)=∫−∞∞pX(x)p(y∣x)dx,pX(x)=∫−∞∞pY(y)p(x∣y)dy.
(2)贝叶斯公式的密度函数形式:
p(x∣y)=∫−∞∞pX(x)p(y∣x)dxpX(x)p(y∣x),p(y∣x)=∫−∞∞pY(y)p(x∣y)dypY(y)p(x∣y).
4. 条件数学期望 条件分布的数学期望(若存在)称为条件期望,其定义如下:
E(X∣Y=y)={∑xiP(X=xi∣Y=y),∫−∞∞xp(x∣y)dx,(X,Y) 为二维离散随机变量,(X,Y) 为二维连续随机变量,
E(Y∣X=x)={∑yjP(Y=yj∣X=x),∫−∞∞yp(y∣x)dy,(X,Y) 为二维离散随机变量,(X,Y) 为二维连续随机变量.
- 条件期望具有数学期望的一切性质.
- 条件期望 E(X∣Y=y) 是 y 的函数,记为 g(y),它是另一个随机变量 g(Y)=E(X∣Y) 的取值.E(X∣Y) 与 E(X∣Y=y) 虽都称为条件期望,但含义不同.前者是特定的随机变量,后者是其取值.
5. 重期望公式 设 (X,Y) 是二维随机变量,若 E(X) 存在,则
E(X)=E[E(X∣Y)].
注意:该公式中里面的期望是用条件分布 p(x∣y) 计算的,外面的期望是用 y 的分布 p(y) 计算的.
6. 二维正态分布 N(μ1,μ2,σ12,σ22,ρ) 的两个条件分布仍是正态分布,即
X∣Y=y∼N(g1(y),σ12(1−ρ2)),
其中
g1(y)=E(X∣Y=y)=μ1+ρσ2σ1(y−μ2).
Y∣X=x∼N(g2(x),σ22(1−ρ2)),
其中
g2(x)=E(Y∣X=x)=μ2+ρσ1σ2(x−μ1).
可见,在二维正态分布中,一个变量的条件期望是另一个变量取值的线性函数,常称为一元线性回归方程.
习题与解答 3.5
以 X 记某医院一天内诞生婴儿的个数,以 Y 记其中男婴的个数.设 X 与 Y 的联合分布为
P(X=n,Y=m)=m!(n−m)!e−14(7.14)m(6.86)n−m,m=0,1,…,n,n=0,1,2,…
试求条件分布列 P(Y=m∣X=n).
解
先求 X 的边际分布列
P(X=n)=m=0∑nm!(n−m)!e−14(7.14)m(6.86)n−m=n!14ne−14m=0∑n(mn)(147.14)m(146.86)n−m.
P(X=n)=n!14ne−14,n=0,1,…
所以 X 服从参数为 14 的泊松分布.由此得
P(Y=m∣X=n)=P(X=n)P(X=n,Y=m)=m!(n−m)!e−14(7.14)m(6.86)n−m⋅14ne−14n!=(mn)(147.14)m(146.86)n−m,m=0,1,…,n.
这是二项分布 b(n,0.51).
一射手单发命中目标的概率为 p(0<p<1),射击进行到命中目标两次为止.设 X 为第一次命中目标所需的射击次数,Y 为总共进行的射击次数,求 (X,Y) 的联合分布和条件分布.
解
只论命中与不命中的试验是伯努利试验.在一伯努利试验序列中,首次命中的射击次数 X 服从几何分布 Ge(p),即
P(X=x)=(1−p)x−1p,x=1,2,…,
其中 p 为命中概率;第二次命中目标的射击次数 Y 服从负二项分布 Nb(2,p),即
P(Y=y)=(1y−1)(1−p)y−2p2,y=2,3,….
由于 X 与 Y−X 相互独立,所以条件分布
P(Y=y∣X=x)=P(Y−X=y−x∣X=x)=P(Y−X=y−x)=(1−p)y−x−1p,x=1,2,…,y−1, y=2,3,….
从而 (X,Y) 的联合分布列为
P(X=x,Y=y)=P(X=x)P(Y=y∣X=x)=P(X=x)P(Y−X=y−x)=(1−p)x−1p⋅(1−p)y−x−1p=(1−p)y−2p2,x=1,2,…,y−1, y=2,3,….
另一条件分布
P(X=x∣Y=y)=P(Y=y)P(X=x,Y=y)=(y−1)(1−p)y−2p2(1−p)y−2p2=y−11,y=2,3,….
注:从以上条件分布列 P(X=x∣Y=y) 可知:在已知第二次命中目标的射击次数为 y 的条件下,第一次命中目标的射击次数 X 是在前面 y−1 次射击中等可能的.
已知 (X,Y) 的联合分布列如下:
P(X=1,Y=1)=P(X=2,Y=1)=81,
P(X=1,Y=2)=41,P(X=2,Y=2)=21.
试求:
- 已知 Y=i 的条件下,X 的条件分布列,i=1,2;
- X 与 Y 是否独立?
解
- 因为
P(Y=1)=P(X=1,Y=1)+P(X=2,Y=1)=41,
P(Y=2)=P(X=1,Y=2)+P(X=2,Y=2)=43.
所以在给定 Y=1 的条件下,X 的条件分布列为
P(X=1∣Y=1)=1/41/8=21,
P(X=2∣Y=1)=1/41/8=21.
在给定 Y=2 的条件下,X 的条件分布列为
P(X=1∣Y=2)=3/41/4=31,
P(X=2∣Y=2)=3/41/2=32.
- 因为
P(X=1)=P(X=1,Y=1)+P(X=1,Y=2)=81+41=83,
所以由
P(X=1,Y=1)=81=P(X=1)P(Y=1)=83⋅41
知 X 与 Y 不独立.
设随机变量 X 与 Y 独立同分布,试在以下情形下求 P(X=k∣X+Y=m):
- X 与 Y 都服从参数为 p 的几何分布;
- X 与 Y 都服从参数为 (n,p) 的二项分布.
解
- 因为 X+Y 服从负二项分布 Nb(2,p),所以
P(X+Y=m)=(m−1)(1−p)m−2p2.
由此得,当 m=2,3,…,k=1,2,…,m−1 时,
P(X=k∣X+Y=m)=P(X+Y=m)P(X=k,X+Y=m)=(m−1)(1−p)m−2p2(1−p)m−2p2=m−11.
注:与本节第 2 题一样,在 X+Y=m 的条件下,X 等可能地取值 1,2,…,m−1.
- 因为 X+Y∼b(2n,p),所以
P(X=k∣X+Y=m)=P(X+Y=m)P(X=k,Y=m−k)=(m2n)pm(1−p)2n−m(kn)pk(1−p)n−k(m−kn)pm−k(1−p)n−m+k=(m2n)(kn)(m−kn),
其中
m=0,1,2,…,2n,k=0,1,2,…,min{n,m}.
注:此题说明,在 X+Y=m 的条件下,X 服从超几何分布.如果将此题改成
X∼b(n1,p),Y∼b(n2,p),
且 X 与 Y 相互独立,则可得
P(X=k∣X+Y=m)=(mn1+n2)(kn1)(m−kn2),
其中
m=0,1,2,…,n1+n2,k=0,1,…,min{n1,m}.
设二维连续随机变量 (X,Y) 的联合密度函数为
p(x,y)={3x,0,0<x<1, 0<y<x,其他.
试求条件密度函数 p(y∣x).
解
因为当 0<x<1 时,
pX(x)=∫0x3xdy=3x2,
所以当 0<x<1 时,
p(y∣x)=pX(x)p(x,y)=⎩⎨⎧x1,0,0<y<x,其他.
这是均匀分布 U(0,x),其中 0<x<1.可见,这里的条件分布实质上是一族均匀分布.
设二维连续随机变量 (X,Y) 的联合密度函数为
p(x,y)={1,0,∣y∣<x, 0<x<1,其他.
求条件密度函数 p(x∣y).
解
因为 p(x,y) 的非零区域为图 3.17 的阴影部分,所以当 −1<y<0 时,
pY(y)=∫−y1dx=1+y=1−∣y∣;
而当 0<y<1 时,
pY(y)=∫y1dx=1−y=1−∣y∣.
由此得
p(x∣y)=pY(y)p(x,y)=⎩⎨⎧1−∣y∣1,0,∣y∣<x<1,其他.
这是均匀分布 U(∣y∣,1),其中 ∣y∣<1.
\FigureThreeSeventeen
设二维连续随机变量 (X,Y) 的联合密度函数为
p(x,y)=⎩⎨⎧421x2y,0,x2≤y≤1,其他.
求条件概率 P(Y≥0.75∣X=0.5).
解
因为
P(Y≥0.75∣X=0.5)=∫0.751p(y∣x=0.5)dy,
故先求 p(y∣x).
而 p(x,y) 的非零区域为图 3.18 的阴影部分,所以当 −1<x<1 时,
pX(x)=∫x21421x2ydy=821x2(1−x4).
因而当 −1<x<1 时,
p(y∣x)=pX(x)p(x,y)=⎩⎨⎧1−x42y,0,x2<y<1,其他.
所以当 0<y<1 时,
p(y∣x=0.5)=1532y.
由此得
P(Y≥0.75∣X=0.5)=∫0.7511532ydy=157.
\FigureThreeEighteen
已知随机变量 Y 的密度函数为
pY(y)={5y4,0,0<y<1,其他,
在给定 Y=y 条件下,随机变量 X 的条件密度函数为
p(x∣y)=⎩⎨⎧y33x2,0,0<x<y<1,其他.
求概率 P(X>0.5).
解
因为
p(x,y)=pY(y)p(x∣y)={15x2y,0,0<x<y<1,其他,
所以
P(X>0.5)=∫0.51∫x115x2ydydx=∫0.51215x2(1−x2)dx=6447.
设随机变量 X 服从 (1,2) 上的均匀分布,在 X=x 的条件下,随机变量 Y 的条件分布是参数为 x 的指数分布,证明:XY 服从参数为 1 的指数分布.
解
因为
X∼U(1,2),Y∣X=x∼Exp(x),
所以
p(x,y)=pX(x)p(y∣x)=xe−xy,1<x<2, y>0.
令
{U=XY,V=X,则{u=xy,v=x,
其逆变换为
{x=v,y=vu.
此变换的雅可比行列式为
J=∂u∂x∂u∂y∂v∂x∂v∂y=0v11−v2u=−v1.
所以 (U,V) 的联合密度函数为
pU,V(u,v)=pX,Y(v,vu)−v1=ve−v⋅u/v⋅v1=e−u,1<v<2, u>0.
由此得 U=XY 的边际密度函数为
pU(u)=∫12e−udv=e−u,u>0.
这表明:U=XY 服从参数为 1 的指数分布.
设二维离散随机变量 (X,Y) 的联合分布列为
X\Y012345000.010.030.050.070.0910.010.020.040.050.060.0820.010.030.050.050.050.0630.010.020.040.060.060.05
试求 E(X∣Y=2) 和 E(Y∣X=0).
解
因为
P(X=i∣Y=2)=P(Y=2)P(X=i,Y=2),
所以用 Y=2 这一列的各个概率 (P(X=i,Y=2)) 除以此列的总和 (P(Y=2)=0.25),得
X∣Y=2P00.0410.1220.2030.2040.2050.24
由此得
E(X∣Y=2)=1×0.12+2×0.20+3×0.20+4×0.20+5×0.24=3.12.
同理,用 X=0 这一行的各个概率 (P(X=0,Y=j)) 除以此行的总和 (P(X=0)=0.03),得
Y∣X=0P00131231331
由此得
E(Y∣X=0)=1×31+2×31+3×31=2.
注:这个二维离散随机变量的联合分布列含有 2 个边际分布、10 个条件分布.可见,多维联合分布含有丰富的信息,可根据需要从中提取之.这个习题只涉及其中两个条件分布的数学期望.
设随机变量 X 与 Y 相互独立,分别服从参数为 λ1 和 λ2 的泊松分布,试求 E(X∣X+Y=n).
解
因为 X+Y∼P(λ1+λ2),所以
P(X=i∣X+Y=n)=P(X+Y=n)P(X=i,X+Y=n)=P(X+Y=n)P(X=i)P(Y=n−i)=n!(λ1+λ2)ne−(λ1+λ2)i!λ1ie−λ1⋅(n−i)!λ2n−ie−λ2=(in)(λ1+λ2λ1)i(λ1+λ2λ2)n−i,i=0,1,…,n.
这说明:X∣X+Y=n 服从二项分布 b(n,p),其中
p=λ1+λ2λ1,
所以
E(X∣X+Y=n)=np=λ1+λ2nλ1.
设二维连续随机变量 (X,Y) 的联合密度函数为
p(x,y)={x+y,0,0<x, y<1,其他.
试求 E(X∣Y=0.5).
解
先求条件密度函数 p(x∣y).当 0<y<1 时,
pY(y)=∫01(x+y)dx=0.5+y.
所以
p(x∣y=0.5)={x+0.5,0,0<x<1,其他.
由此得
E(X∣Y=0.5)=∫01x(x+0.5)dx=127.
设二维连续随机变量 (X,Y) 的联合密度函数为
p(x,y)={24(1−x)y,0,0<y<x<1,其他.
试在 0<y<1 时,求 E(X∣Y=y).
解
先求条件密度函数 p(x∣y).当 0<y<1 时,
pY(y)=∫y124(1−x)ydx=12y(1−y)2.
所以
p(x∣y)=pY(y)p(x,y)=⎩⎨⎧(1−y)22(1−x),0,0<y<x<1,其他.
由此得,在 0<y<1 时,
E(X∣Y=y)=∫−∞∞xp(x∣y)dx=∫y1x⋅(1−y)22(1−x)dx=32y+1.
设 E(Y),E[h(Y)] 存在,试证:E[h(Y)∣Y]=h(Y).
解
因为 E[h(Y)∣Y] 是随机变量 Y 的函数,记
g(Y)=E[h(Y)∣Y],
它仍是随机变量.在离散场合,当 Y=yi 时,g(yi) 以概率 P(Y=yi) 取
g(yi)=E[h(yi)∣Y=yi].
由于在 Y 取固定值 yi 时,h(yi) 也是常数,故有
g(yi)=E[h(yi)∣Y=yi]=h(yi)⋅E(1∣Y=yi)=h(yi),i=1,2,….
上式对 Y 的任一取值都成立,即
E[h(Y)∣Y]=h(Y).
在连续场合也有类似解释,所以在一般场合有
E[h(Y)∣Y]=h(Y).
设以下所涉及的数学期望均存在,试证:
- E[g(X)Y∣X]=g(X)E(Y∣X);
- E(XY)=E[XE(Y∣X)];
- Cov[X,E(Y∣X)]=Cov(X,Y).
解
- 由
E[g(X)Y∣X=x]=g(x)E(Y∣X=x)
知
E[g(X)Y∣X]=g(X)E(Y∣X).
- 因为
E(XY)=E[E(XY∣X)],
又由(1)知
E(XY∣X)=XE(Y∣X),
所以有
E(XY)=E[XE(Y∣X)].
Cov[X,E(Y∣X)]=E[X⋅E(Y∣X)]−E(X)⋅E(Y)=E(XY)−E(X)⋅E(Y)=Cov(X,Y).
设随机变量 X 与 Y 独立同分布,都服从参数为 λ 的指数分布.令
Z={3X+1,6Y,X≥Y,X<Y.
求 E(Z).
解
此题有两种计算方法,现分述如下:
解法一 直接按照二元函数期望公式计算
E(Z)=∬x≥y(3x+1)λ2e−λ(x+y)dxdy+∬x<y6yλ2e−λ(x+y)dxdy=∫0∞(3x+1)λe−λxdx∫0xλe−λydy+∫0∞6yλe−λydy∫0yλe−λxdx=∫0∞(3x+1)λe−λx(1−e−λx)dx+∫0∞6yλe−λy(1−e−λy)dy=∫0∞(3x+1)λe−λx(1−e−λx)dx+∫0∞6xλe−λx(1−e−λx)dx=∫0∞(9x+1)λe−λx(1−e−λx)dx=∫0∞(9x+1)λe−λxdx−∫0∞(9x+1)λe−2λxdx=λ9+1−21∫0∞(9x+1)2λe−2λxdx=λ9+1−21(2λ9+1)=21+4λ27.
解法二 利用条件期望计算
在 X=x 给定时,
Z={3x+1,6Y,x≥Y,x<Y,
是关于 Y 的函数.于是
E(Z∣X=x)=∫0x(3x+1)λe−λydy+∫x∞6yλe−λydy=(3x+1)(1−e−λx)+6xe−λx+λ6e−λx=3x+1+e−λx(3x+λ6−1).
因此
E(Z)=E[E(Z∣X)]=E[3X+1+e−λX(3X+λ6−1)]=3E(X)+1+∫0∞λe−2λx(3x+λ6−1)dx=λ3+1+21∫0∞2λe−2λx(3x+λ6−1)dx=λ3+1+21(2λ3+λ6−1)=21+4λ27.
设随机变量 X∼N(μ,1),Y∼N(0,1),且 X 与 Y 相互独立,令
I={1,0,Y<X,X≤Y.
试证明:
- E(I∣X=x)=Φ(x);
- E[Φ(X)]=P(Y<X);
- E[Φ(X)]=Φ(μ/2).
(提示:X−Y 的分布是什么?)
解
- E(I∣X=x)=P(I=1∣X=x)=P(Y<X∣X=x)=P(Y<x)=Φ(x).
- 由(1)知,Φ(X)=E(I∣X),所以
E[Φ(X)]=E[E(I∣X)]=E(I)=P(I=1)=P(Y<X).
- 由(2)知
E[Φ(X)]=P(Y<X)=P(X−Y>0).
因为 X 与 Y 相互独立,所以
X−Y∼N(μ,2),
由此得
P(X−Y>0)=1−Φ(−μ/2)=Φ(μ/2).
设 X1,X2,… 为独立同分布的随机变量序列,且方差存在.随机变量 N 只取正整数值,Var(N) 存在,且 N 与 {Xn} 独立.证明:
Var(i=1∑NXi)=Var(N)[E(X1)]2+E(N)Var(X1).
解
因为
E(i=1∑NXi)=n=1∑∞E(i=1∑nXi)P(N=n)=n=1∑∞nE(X1)P(N=n)=E(X1)E(N),
并且
E(i=1∑NXi)2=n=1∑∞E(i=1∑nXi)2P(N=n)=n=1∑∞{nE(X12)+n(n−1)[E(X1)]2}P(N=n)=n=1∑∞{nVar(X1)+n2[E(X1)]2}P(N=n)=E(N)Var(X1)+E(N2)[E(X1)]2.
所以
Var(i=1∑NXi)=E(N)Var(X1)+E(N2)[E(X1)]2−[E(X1)]2[E(N)]2=Var(N)[E(X1)]2+E(N)Var(X1).
评论
支持 Markdown 和 LaTeX 数学公式。