§3.4 多维随机变量的特征数
依赖于
被以下题目直接调用
正文部分
§3.4 多维随机变量的特征数
- 多维随机变量函数的数学期望 若二维随机变量 (X,Y) 的分布用联合分布列
P(X=xi,Y=yj)
或用联合密度函数 p(x,y) 表示,则
Z=g(X,Y)
的数学期望(假设存在)为
E(Z)=⎩⎨⎧i∑j∑g(xi,yj)P(X=xi,Y=yj),∫−∞∞∫−∞∞g(x,y)p(x,y)dxdy,在离散场合,在连续场合.
对 n 维随机变量结论是类似的。
- 数学期望与方差的运算性质 以下均假定有关的期望和方差存在。
- E(X1+X2+⋯+Xn)=E(X1)+E(X2)+⋯+E(Xn).
- 若随机变量 X1,X2,⋯,Xn 相互独立,则
E(X1X2⋯Xn)=E(X1)E(X2)⋯E(Xn).
Var(X1±X2±⋯±Xn)=Var(X1)+Var(X2)+⋯+Var(Xn).
- 协方差 若
E[(X−E(X))(Y−E(Y))]
存在,则称
Cov(X,Y)=E[(X−E(X))(Y−E(Y))]
为 X 与 Y 的协方差。
- 当 Cov(X,Y)>0 时,称 X 与 Y 正相关,即 X 与 Y 同时增加或同时减少;
- 当 Cov(X,Y)<0 时,称 X 与 Y 负相关,即 X 增加 Y 减少,或 X 减少 Y 增加;
- 当 Cov(X,Y)=0 时,称 X 与 Y 不相关。
- 协方差的性质
- Cov(X,Y)=Cov(Y,X);
- Cov(X,Y)=E(XY)−E(X)E(Y).
- 若 X 与 Y 相互独立,则 Cov(X,Y)=0,反之不然;
- Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z).
- 对任意的常数 a,有 Cov(X,a)=0;
- 对任意的常数 a,b,有
Cov(aX,bY)=abCov(X,Y).
- 对任意二维随机变量 (X,Y),有
Var(X±Y)=Var(X)+Var(Y)±2Cov(X,Y).
对任意 n 个随机变量 X1,X2,⋯,Xn,有
Var(i=1∑nXi)=i=1∑nVar(Xi)+2i=1∑nj=1∑i−1Cov(Xi,Xj).
- 施瓦茨不等式 对任意二维随机变量 (X,Y),若 X 与 Y 的方差都存在,则有
[Cov(X,Y)]2≤Var(X)Var(Y).
- 相关系数 设 (X,Y) 是一个二维随机变量,且
Var(X)>0,Var(Y)>0.
则称
Corr(X,Y)=Var(X)Var(Y)Cov(X,Y)=σXσYCov(X,Y)
为 X 与 Y 的(线性)相关系数。
- 相关系数的性质
- −1≤Corr(X,Y)≤1;
- Corr(X,Y) 与 Cov(X,Y) 同号,或同为零;
- Corr(X,Y)=Cov(X∗,Y∗),
其中 X∗,Y∗ 分别为 X,Y 的标准化随机变量。
- Corr(X,Y)=±1 的充要条件是 X 与 Y 间几乎处处有线性关系,即存在 a (a=0) 与 b,使得
P(Y=aX+b)=1.
其中当 Corr(X,Y)=1 时,有 a>0;当 Corr(X,Y)=−1 时,有 a<0。
- 在二维正态分布 N(μ1,μ2,σ12,σ22,ρ) 场合,不相关与独立是等价的。
- 随机向量的数学期望与协方差阵 记 n 维随机向量为
X=(X1,X2,⋯,Xn)T,
以下假设所涉及的数学期望、方差、协方差均存在。
- 随机向量 X 的数学期望向量为
E(X)=(E(X1),E(X2),⋯,E(Xn))T.
- 随机向量 X 的协方差阵为
E[(X−E(X))(X−E(X))T]=Var(X1)Cov(X2,X1)⋮Cov(Xn,X1)Cov(X1,X2)Var(X2)⋮Cov(Xn,X2)⋯⋯⋱⋯Cov(X1,Xn)Cov(X2,Xn)⋮Var(Xn).
也记以上的协方差阵为 Cov(X),或记成 Σ。
- 随机向量 X 的协方差阵
Cov(X)=(Cov(Xi,Xj))n×n
是一个对称的非负定矩阵。
- n 元正态分布 设 n 维随机向量
X=(X1,X2,⋯,Xn)T
的协方差阵为 Σ=Cov(X),数学期望向量为
a=(a1,a2,⋯,an)T.
又记
x=(x1,x2,⋯,xn)T,
则由密度函数
p(x1,x2,⋯,xn)=p(x)=(2π)n/2∣Σ∣1/21exp{−21(x−a)TΣ−1(x−a)}
定义的分布称为 n 元正态分布,记为
X∼N(a,Σ).
习题与解答 3.4
掷一颗均匀的骰子 2 次,其最小点数记为 X,求 E(X)。
解
因为
XP111/3629/3637/3645/3653/3661/36
所以
E(X)=3691.
解
记 Xi 为第 i 颗骰子出现的点数,i=1,2,⋯,n,则 X1,X2,⋯,Xn 独立同分布,其共同的分布列为
XiP11/621/631/641/651/661/6
所以
E(Xi)=61(1+2+3+4+5+6)=27,
Var(Xi)=61(12+22+32+42+52+62)−449=1235.
由此得
E(i=1∑nXi)=i=1∑nE(Xi)=27n,
Var(i=1∑nXi)=i=1∑nVar(Xi)=1235n.
从数字 0,1,⋯,n 中任取两个不同的数字,求这两个数字之差的绝对值的数学期望。
解
记 X 与 Y 分别为第 1 次和第 2 次取出的数字,则
P(X=i,Y=j)=(n+1)n1,i,j=0,1,⋯,n,i=j.
所以
E(∣X−Y∣)=(n+1)n1i=0∑n{j=0∑i−1(i−j)+j=i+1∑n(j−i)}=(n+1)n1i=0∑n{2i(i+1)+2(n−i)[(n−i)+1]}=(n+1)n1i=0∑n{i2+2n(n+1)−in}=62n+1+2n+1−2n=3n+2.
设在区间 (0,1) 上随机取 n 个点,求相距最远的两点间的距离的数学期望。
解
解法一 分别记此 n 个点为 X1,X2,⋯,Xn,则 X1,X2,⋯,Xn 相互独立,且都服从区间 (0,1) 上的均匀分布 U(0,1)。我们的目的是求
E(max{X1,X2,⋯,Xn}−min{X1,X2,⋯,Xn}).
而
Z=max{X1,X2,⋯,Xn},T=min{X1,X2,⋯,Xn}
的密度函数分别为
pZ(z)={nzn−1,0,0<z<1,其他,pT(t)={n(1−t)n−1,0,0<t<1,其他.
又因为
E(Z)=∫01znzn−1dz=n+1n,E(T)=∫01tn(1−t)n−1dt=n+11,
所以
E(max{X1,X2,⋯,Xn}−min{X1,X2,⋯,Xn})=n+1n−n+11=n+1n−1.
解法二 n 个点把区间 (0,1) 分成 n+1 段,它们的长度依次记为 Y1,Y2,⋯,Yn+1。因为此 n 个点是随机取的,所以 Y1,Y2,⋯,Yn+1 具有相同的分布,从而有相同的数学期望。而
Y1+Y2+⋯+Yn+1=1,
因此
E(Y1)=E(Y2)=⋯=E(Yn+1)=n+11.
而相距最远的两点间的距离为 Y2+Y3+⋯+Yn,因此所求期望为
E(Y2+Y3+⋯+Yn)=n+1n−1.
盒中有 n 个不同的球,其上分别写有数字 1,2,⋯,n。每次随机抽出一个,记下其号码,放回去再抽。直到抽到有两个不同的数字为止。求平均抽球次数。
解
记 X 为抽球次数,则 X 的可能取值是 2,3,⋯,且有
P(X=k)=nk−1n−1=(n1)k−2nn−1,k=2,3,⋯.
又记
p=nn−1,
则
Y=X−1
服从参数为 p 的几何分布,因此
E(Y)=p1=n−1n,
由此得
E(X)=E(Y)+1=n−1n+1=n−12n−1.
设随机变量 (X,Y) 的联合分布列为
X\Y01200.10.250.1510.150.20.15
试求
Z=sin[2π(X+Y)]
的数学期望。
解
E(Z)=0.1sin0+0.15sin2π+0.25sin2π+0.2sinπ+0.15sinπ+0.15sin23π=0.15×1+0.25×1+0.15×(−1)=0.25.
随机变量 (X,Y) 服从以点 (0,1),(1,0),(1,1) 为顶点的三角形区域上的均匀分布,试求 E(X+Y) 和 Var(X+Y)。
解
记此三角形区域为 D(如图 3.15 阴影部分)。因为 D 的面积为 1/2,所以 (X,Y) 的联合密度函数为
pX,Y(x,y)={2,0,(x,y)∈D,(x,y)∈/D.
\FigureThreeFifteen
下求 X 和 Y 各自的边际密度函数。当 0<x<1 时,有
pX(x)=∫1−x12dy=2x.
这是贝塔分布 Be(2,1)。当 0<y<1 时,有
pY(y)=∫1−y12dx=2y.
这也是贝塔分布 Be(2,1)。即 X 与 Y 同分布。因此由贝塔分布的期望、方差公式可知
E(X)=E(Y)=32,Var(X)=Var(Y)=181.
由于 X 与 Y 不独立,所以先计算
E(XY)=∫01∫1−x12xydydx=125.
由此得
Cov(X,Y)=E(XY)−E(X)E(Y)=125−94=−361(负相关).
最后得
E(X+Y)=32+32=34,
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)=181+181−362=181.
设 X,Y 均为 (0,1) 上独立的均匀随机变量,试证:
E(∣X−Y∣α)=(α+1)(α+2)2,α>0.
解
因为 (X,Y) 的联合密度函数为
p(x,y)={1,0,0<x,y<1,其他,
所以
E(∣X−Y∣α)=∫01∫01∣x−y∣αdxdy=∫01∫0y(y−x)αdxdy+∫01∫y1(x−y)αdxdy=(α+1)(α+2)1+(α+1)(α+2)1=(α+1)(α+2)2.
设 X 与 Y 是独立同分布的随机变量,且
P(X=i)=m1,i=1,2,⋯,m.
试证:
E(∣X−Y∣)=3m(m−1)(m+1).
解
E(∣X−Y∣)=i=1∑mj=1∑m∣i−j∣⋅m21=m21i=1∑m(j=1∑i−1(i−j)+j=i+1∑m(j−i))=m21i=1∑m(i2−i−mi+2m2+2m)=m21[6m(m+1)(2m+1)−(m+1)2m(m+1)+2m3+2m2]=3m(m−1)(m+1).
设随机变量 X 与 Y 独立同分布,且 E(X)=μ,Var(X)=σ2,试求 E(X−Y)2.
解
因为 E(X−Y)=0,所以
E(X−Y)2=Var(X−Y)=2σ2.
设随机变量 (X,Y) 的联合密度函数为
p(x,y)=⎩⎨⎧4x(1+3y2),0,0<x<2, 0<y<1,其他.
试求 E(Y/X).
解
E(Y/X)=∫01dy∫02xy⋅4x(1+3y2)dx=∫012y(1+3y2)dy=85.
设 X1,X2,…,X5 是独立同分布的随机变量,其共同的密度函数
p(x)={2x,0,0<x<1,其他.
试求 Y=max{X1,X2,…,X5} 的密度函数、数学期望和方差.
解
先求 Xi 的分布函数.当 0<x<1 时,
F(x)=∫0x2tdt=x2,
所以当 0<y<1 时,Y 的密度函数为
pY(y)=5[F(y)]4p(y)=5y8×2y=10y9,
这是贝塔分布 Be(10,1),由此得
E(Y)=1110,Var(Y)=112×1210=7265.
系统由 n 个部件组成.记 Xi 为第 i 个部件能持续工作的时间,如果 X1,X2,…,Xn 独立同分布,且 Xi∼Exp(λ),试在以下情况下求系统持续工作的平均时间:
- 如果有一个部件停止工作,系统就不工作了;
- 如果至少有一个部件在工作,系统就工作.
解
因为 Xi∼Exp(λ),所以 Xi 的密度函数和分布函数分别为
p1(x)={λe−λx,0,x>0,x≤0,F1(x)={1−e−λx,0,x>0,x≤0.
(1) 根据题意,系统持续工作的时间为
T=min{X1,X2,…,Xn},
所以当 t≤0 时,T 的密度函数 pT(t)=0;而当 t>0 时,
pT(t)=np1(t)[1−F1(t)]n−1=nλe−λte−(n−1)λt=nλe−nλt,
这是参数为 nλ 的指数分布,所以
E(T)=nλ1.
(2) 根据题意,系统持续工作的时间为
T=max{X1,X2,…,Xn},
所以当 t>0 时
pT(t)=n[F1(t)]n−1p1(t)=n(1−e−λt)n−1λe−λt=i=0∑n−1(−1)inλ(in−1)e−(i+1)λt=i=0∑n−1(−1)i(i+1n)(i+1)λe−(i+1)λt,
所以系统持续工作的平均时间为
E(T)=i=0∑n−1(−1)i(i+1n)∫0∞t(i+1)λe−(i+1)λtdt=i=0∑n−1(−1)i(i+1n)(i+1)λ1=λn−(2n)2λ1+(3n)3λ1+⋯+(−1)n−1nλ1.
设 X,Y 独立同分布,都服从标准正态分布 N(0,1),求 E(max{X,Y}).
解
因为 X,Y 独立,都服从 N(0,1),所以 X−Y∼N(0,2).又因为
max{X,Y}=2X+Y+∣X−Y∣,
由于 X−Y∼N(0,2),所以
E(max{X,Y})=2E(X)+E(Y)+E(∣X−Y∣)=2E(∣X−Y∣)=22π21∫−∞∞∣t∣e−t2/4dt=2π21∫0∞te−t2/4dt=−π1∫0∞d(e−t2/4)=π1.
设随机变量 X1,X2,…,Xn 相互独立,且都服从 (0,θ) 上的均匀分布,记
Y=max{X1,X2,…,Xn},Z=min{X1,X2,…,Xn}.
试求 E(Y) 和 E(Z).
解
记 Xi 的密度函数和分布函数分别为
p1(x)={1/θ,0,0<x<θ,其他,F1(x)=⎩⎨⎧0,x/θ,1,x<0,0≤x<θ,x≥θ.
则当 0<t<θ 时,Y 与 Z 的密度函数分别为
pY(t)=n[F1(t)]n−1p1(t)=n(θt)n−1θ1,
pZ(t)=np1(t)[1−F1(t)]n−1=n(1−θt)n−1θ1.
所以
E(Y)=θnn∫0θtndt=n+1nθ,
E(Z)=θnn∫0θt(θ−t)n−1dt=n+1θ.
设随机变量 U 服从 (−2,2) 上的均匀分布,定义 X 和 Y 如下:
X={−1,1,若 U<−1,若 U≥−1,Y={−1,1,若 U<1,若 U≥1.
试求 Var(X+Y).
解
先求 X+Y 的分布列.因为 X+Y 的可能取值是 −2,0,2,所以
P(X+Y=−2)=P(X=−1,Y=−1)=P(U<−1)=41,
P(X+Y=2)=P(X=1,Y=1)=P(U≥−1,U≥1)=P(U≥1)=41,
P(X+Y=0)=1−P(X+Y=−2)−P(X+Y=2)=21.
综上可得 X+Y 的分布列
此分布对称,所以 E(X+Y)=0,从而得
Var(X+Y)=E(X+Y)2=2.
一商店经销某种商品,每周进货量 X 与顾客对这种商品的需求量 Y 是相互独立的随机变量,且都服从区间 (10,20) 上的均匀分布.商店每售出一单位商品可得利润 1000 元;若需求量超过了进货量,则可从其他商店调剂供应,这时每单位商品获利润为 500 元.试求此商店经销这种商品每周的平均利润.
解
记 Z 为此商店经销该种商品每周所得的利润,由题设知 Z=g(X,Y),其中
g(x,y)={1000y,1000x+500(y−x)=500(x+y),y≤x,y>x.
由题设条件知 (X,Y) 的联合概率密度为
pX,Y(x,y)={1/100,0,10≤x≤20, 10≤y≤20,其他.
于是
E(Z)=E(g(X,Y))=∬g(x,y)pX,Y(x,y)dxdy=∬y≤x1000ypX,Y(x,y)dxdy+∬y>x500(x+y)pX,Y(x,y)dxdy=10∫1020dy∫y20ydx+5∫1020dy∫10y(x+y)dx=320000+5×1500≈14166.67.
设随机变量 X 与 Y 独立,都服从正态分布 N(a,σ2),试证:
E(max{X,Y})=a+πσ.
解
记
X∗=σX−a,Y∗=σY−a,
则 X∗ 与 Y∗ 独立,都服从 N(0,1) 分布.所以由前面第 14 题知
E(max{X∗,Y∗})=π1.
又因为
E(max{X∗,Y∗})=E(max{σX−a,σY−a})=σE(max{X,Y})−a,
由此即得
E(max{X,Y})=a+σE(max{X∗,Y∗})=a+πσ.
设二维随机变量 (X,Y) 的联合分布列为
| X | Y | | |
|---|
| \cmidrule(lr){2-4} | −1 | 0 | 1 |
| 0 | 0.07 | 0.18 | 0.15 |
| 1 | 0.08 | 0.32 | 0.20 |
试求 X2 与 Y2 的协方差.
解
因为
所以得
E(X2)=0.6,E(Y2)=0.5,E(X2Y2)=0.28,
由此得
Cov(X2,Y2)=E(X2Y2)−E(X2)E(Y2)=0.28−0.6×0.5=−0.02.
把一颗骰子独立地掷 n 次,求 1 点出现的次数与 6 点出现次数的协方差及相关系数.
解
记
Xi={1,0,第 i 次投掷,出现 1 点,其他,Yi={1,0,第 i 次投掷,出现 6 点,其他.
则 1 点出现的次数
X=i=1∑nXi∼b(n,1/6),
6 点出现的次数
Y=j=1∑nYj∼b(n,1/6).
从而有
E(X)=E(Y)=6n,Var(X)=Var(Y)=365n.
我们的目的是求 Cov(X,Y),故下面先求 E(XY).由于
XY=(X1+X2+⋯+Xn)(Y1+Y2+⋯+Yn)=i=1∑nXiYi+2i<j∑XiYj,
且因为 Xi 和 Yi 均为仅取 0,1 值的随机变量,所以
{XiYi=1}={Xi=1,Yi=1}=∅
(第 i 次投掷时,不可能既出现 1 点,又出现 6 点),因此当 i=j 时,有
P(XiYi=1)=0,P(XiYi=0)=1.
由此得 E(XiYi)=0.而当 i=j 时,由于 Xi 与 Yj 相互独立,所以
E(XiYj)=E(Xi)E(Yj)=361.
综上可得
Cov(X,Y)=E(XY)−E(X)E(Y)=2i<j∑E(XiYj)−36n2=36n(n−1)−36n2=−36n,
Corr(X,Y)=Var(X)Var(Y)Cov(X,Y)=5n/36−n/36=−51.
解
记 X 为第一次掷出的点数,Y 为第二次掷出的点数,则 X 与 Y 独立同分布,即有 E(X)=E(Y),E(X2)=E(Y2).由此得
Cov(X+Y,X−Y)=E(X2−Y2)−E(X+Y)E(X−Y)=0.
某箱装 100 件产品,其中一、二和三等品分别为 80,10 和 10 件.现从中随机取一件,定义两个随机变量 X1,X2 如下
Xi={1,0,若抽到 i 等品,其他,i=1,2.
试求随机变量 X1 和 X2 的相关系数 Corr(X1,X2).
解
因为 X1∼b(1,0.8),X2∼b(1,0.1),所以有
E(X1)=0.8,Var(X1)=0.8×0.2=0.16;
E(X2)=0.1,Var(X2)=0.1×0.9=0.09.
由多项分布可导出 (X1,X2) 的联合分布列如下
| X1 | X2 | |
|---|
| \cmidrule(lr){2-3} | 0 | 1 |
| 0 | 0.1 | 0.1 |
| 1 | 0.8 | 0 |
譬如,
P(X1=1,X2=0)=1!0!0!1!⋅0.81×0.10×0.10=0.8.
由此获得乘积 X1X2 的分布列
所以 E(X1X2)=0,由此得
Cov(X1,X2)=E(X1X2)−E(X1)E(X2)=0−0.8×0.1=−0.08,
Corr(X1,X2)=Var(X1)Var(X2)Cov(X1,X2)=0.160.09−0.08=−32.
将一枚硬币重复掷 n 次,以 X 和 Y 分别表示正面向上和反面向上的次数,试求 X 和 Y 的协方差及相关系数.
解
因为 X+Y=n,且 X∼b(n,1/2),Y∼b(n,1/2),所以
Var(X)=Var(Y)=4n,
Cov(X,Y)=Cov(X,n−X)=−Cov(X,X)=−Var(X)=−4n,
Corr(X,Y)=Var(X)Var(Y)Cov(X,Y)=n/4−n/4=−1.
设随机变量 X 和 Y 独立同服从参数为 λ 的泊松分布,令
U=2X+Y,V=2X−Y.
求 U 和 V 的相关系数 Corr(U,V).
解
因为
Var(U)=Var(2X+Y)=4Var(X)+Var(Y)=5λ,
Var(V)=Var(2X−Y)=4Var(X)+Var(Y)=5λ.
所以
Cov(U,V)=Cov(2X+Y,2X−Y)=Cov(2X,2X)+Cov(Y,2X)−Cov(2X,Y)−Cov(Y,Y)=4Var(X)−Var(Y)=3λ,
由此得
Corr(U,V)=Var(U)Var(V)Cov(U,V)=5λ3λ=53.
在一个有 n 个人参加的晚会上,每个人带了一件礼物,且假定各人带的礼物都不相同.晚会期间各人从放在一起的 n 件礼物中随机抽取一件,试求抽中自己礼物的人数 X 的均值和方差.
解
记
Xi={1,0,第 i 个人恰好取出自己的礼物,第 i 个人取出别人的礼物,i=1,2,…,n.
则 X1,X2,…,Xn 是同分布的,但不独立.其共同分布为
P(Xi=1)=n1,P(Xi=0)=1−n1,i=1,2,…,n.
由此得
E(Xi)=n1,Var(Xi)=n1(1−n1),i=1,2,…,n.
又因为 X=X1+X2+⋯+Xn,所以
E(X)=E(X1)+E(X2)+⋯+E(Xn)=n⋅n1=1.
但因为 Xi 间不独立,所以
Var(X)=i=1∑nVar(Xi)+2i=1∑nj=i+1∑nCov(Xi,Xj).
为计算 Cov(Xi,Xj),先给出 XiXj 的分布列,注意到 XiXj 的可能取值为 0,1,且
P(XiXj=1)=P(Xi=1,Xj=1)=n1⋅n−11,
所以
E(XiXj)=0×P(XiXj=0)+1×P(XiXj=1)=n(n−1)1.
因此
Cov(Xi,Xj)=E(XiXj)−E(Xi)E(Xj)=n(n−1)1−(n1)2=n2(n−1)1.
由此得
Var(X)=nn−1+2(2n)n2(n−1)1=1.
设随机变量 X 和 Y 的数学期望分别为 −2 和 2,方差分别为 1 和 4,而它们的相关系数为 −0.5.试根据切比雪夫不等式,估计 P(∣X+Y∣≥6) 的上限.
解
因为
E(X+Y)=0,
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)=1+4+214×(−0.5)=3,
所以
P(∣X+Y∣≥6)≤62Var(X+Y)=363=121.
设二维随机变量 (X,Y) 的联合密度函数为
p(x,y)={1,0,∣y∣<x, 0<x<1,其他.
求 E(X),E(Y),Cov(X,Y).
解
E(X)=∫01∫−xxxdydx=∫012x2dx=32,
E(Y)=∫01∫−xxydydx=0,
E(XY)=∫01∫−xxxydydx=0,Cov(X,Y)=E(XY)−E(X)E(Y)=0.
讨论:这里 X 与 Y 的协方差为 0,故 X 与 Y 不相关,但 X 与 Y 也不独立,这是因为 p(x,y)=p(x)p(y),其中
p(x)={2x,0,0<x<1,其他,p(y)=⎩⎨⎧1+y,1−y,0,−1<y<0,0<y<1,其他.
设二维随机变量 (X,Y) 的联合密度函数为
p(x,y)={3x,0,0<y<x<1,其他.
求 X 与 Y 的相关系数.
解
先计算 X 与 Y 的期望、方差与协方差:
E(X)=∫01∫0x3x2dydx=∫013x3dx=43,
E(X2)=∫01∫0x3x3dydx=∫013x4dx=53,
E(Y)=∫01∫0x3xydydx=∫0123x3dx=83,
E(Y2)=∫01∫0x3xy2dydx=∫01x4dx=51,
所以
Var(X)=E(X2)−[E(X)]2=53−169=803,
Var(Y)=E(Y2)−[E(Y)]2=51−649=32019,
又因为
E(XY)=∫01∫0x3x2ydydx=∫0123x4dx=103,
所以
Cov(X,Y)=E(XY)−E(X)E(Y)=103−43×83=1603,
最后可得 X 与 Y 的相关系数
Corr(X,Y)=Var(X)Var(Y)Cov(X,Y)=3/8019/3203/160=573=0.397.
已知随机变量 X 与 Y 的相关系数为 ρ,求 X1=aX+b 与 Y1=cY+d 的相关系数,其中 a,b,c,d 均为非零常数.
解
先计算 X1 与 Y1 的方差与协方差:
Var(X1)=a2Var(X),Var(Y1)=c2Var(Y),Cov(X1,Y1)=acCov(X,Y).
然后计算 X1 与 Y1 的相关系数:
Corr(X1,Y1)=a2Var(X)c2Var(Y)acCov(X,Y).
所以当 a 与 c 同号时,
Corr(X1,Y1)=Var(X)Var(Y)Cov(X,Y)=ρ;
而当 a 与 c 异号时,
Corr(X1,Y1)=−Var(X)Var(Y)Cov(X,Y)=−ρ.
设随机变量 X1 与 X2 独立同分布,其共同分布为 Exp(λ).试求 Y1=4X1−3X2 与 Y2=3X1+X2 的相关系数.
解
先计算 Y1 与 Y2 的期望、方差与协方差:
E(X1)=E(X2)=λ1,Var(X1)=Var(X2)=λ21,
E(Y1)=4E(X1)−3E(X2)=λ1,Var(Y1)=16Var(X1)+9Var(X2)=λ225,
E(Y2)=3E(X1)+E(X2)=λ4,Var(Y2)=9Var(X1)+Var(X2)=λ210,
E(Y1Y2)=E[(4X1−3X2)(3X1+X2)]=E(12X12−5X1X2−3X22)=λ213,
Cov(Y1,Y2)=E(Y1Y2)−E(Y1)E(Y2)=λ213−λ24=λ29.
然后计算 Y1 与 Y2 的相关系数:
Corr(Y1,Y2)=Var(Y1)Var(Y2)Cov(Y1,Y2)=25/λ210/λ29/λ2=5109=0.5692.
设随机变量 X1 与 X2 独立同分布,其共同分布为 N(μ,σ2).试求 Y=aX1+bX2 与 Z=aX1−bX2 的相关系数,其中 a 与 b 为非零常数.
解
先计算 Y 与 Z 的期望、方差与协方差:
E(Y)=(a+b)μ,E(Z)=(a−b)μ,
Var(Y)=(a2+b2)σ2,Var(Z)=(a2+b2)σ2,
E(YZ)=E[(aX1+bX2)(aX1−bX2)]=E(a2X12−b2X22)=(a2−b2)(σ2+μ2),
Cov(Y,Z)=E(YZ)−E(Y)E(Z)=(a2−b2)σ2.
然后计算 Y 与 Z 的相关系数:
Corr(Y,Z)=Var(Y)Var(Z)Cov(Y,Z)=(a2+b2)σ2(a2−b2)σ2=a2+b2a2−b2.
设二维随机变量 (X,Y) 服从二维正态分布 N(0,0,1,1,ρ).
- 求 E(max{X,Y});
- 求 X−Y 与 XY 的协方差及相关系数.
解
(1) 由于
max{X,Y}=21(X+Y+∣X−Y∣),
所以
E(max{X,Y})=E[21(X+Y+∣X−Y∣)]=21E(∣X−Y∣).
因为 X−Y∼N(0,2(1−ρ)),所以
E(max{X,Y})=22π2(1−ρ)1∫−∞∞∣x∣exp{−4(1−ρ)x2}dx=π1−ρ.
(2) 因为
Cov(X−Y,XY)=Cov(X,XY)−Cov(Y,XY)
=E(X2Y)−E(X)E(XY)−E(XY2)+E(Y)E(XY).
所以由 E(X)=E(Y)=0,得
Cov(X−Y,XY)=E(X2Y)−E(XY2),
又由对称性 E(X2Y)=E(XY2),所以得
Cov(X−Y,XY)=0,Corr(X−Y,XY)=0.
这表明,当 (X,Y)∼N(0,0,1,1,ρ) 时,X−Y 与 XY 不相关.
设二维随机变量 (X,Y) 服从区域
D={(x,y):0<x<1, 0<x<y<1}
上的均匀分布,求 X 与 Y 的协方差及相关系数.
解
因为区域 D 的面积为 1/2,所以 (X,Y) 的联合密度函数为
pX,Y(x,y)={2,0,(x,y)∈D,(x,y)∈/D.
由此得 X 和 Y 各自的边际密度函数为
当 0<x<1 时,pX(x)=∫x12dy=2(1−x);
当 0<y<1 时,pY(y)=∫0y2dx=2y.
这表明 X∼Be(1,2),Y∼Be(2,1).由此可算得 X 与 Y 的期望与方差
E(X)=31,E(Y)=32,
E(X2)=61,E(Y2)=21,
Var(X)=181,Var(Y)=181.
另外还需计算 XY 的期望
E(XY)=∫01∫x12xydydx=41,
由此得 X 与 Y 的协方差及相关系数为
Cov(X,Y)=E(XY)−E(X)E(Y)=41−31×32=361,
Corr(X,Y)=Var(X)Var(Y)Cov(X,Y)=1/181/36=21.
设二维随机变量 (X,Y) 的联合密度函数为
p(x,y)=⎩⎨⎧76(x2+2xy),0,0<x<1, 0<y<2,其他.
求 X 与 Y 的协方差及相关系数.
解
先求 X 与 Y 的期望与方差
E(X)=∫01∫02x⋅76(x2+2xy)dydx=75,
E(Y)=∫01∫02y⋅76(x2+2xy)dydx=78,
E(X2)=∫01∫02x2⋅76(x2+2xy)dydx=7039,
E(Y2)=∫01∫02y2⋅76(x2+2xy)dydx=2134,
所以
Var(X)=7039−(75)2=49023,
Var(Y)=2134−(78)2=14746.
又因为
E(XY)=∫01∫02xy⋅76(x2+2xy)dydx=2117,
所以 X 与 Y 的协方差及相关系数为
Cov(X,Y)=E(XY)−E(X)E(Y)=2117−75×78=−1471,
Corr(X,Y)=Var(X)Var(Y)Cov(X,Y)=23/49046/147−1/147=−6915=−0.05613.
设二维随机变量 (X,Y) 在矩形
G={(x,y):0≤x≤2, 0≤y≤1}
上服从均匀分布,记
U={1,0,X>Y,X≤Y,V={1,0,X>2Y,X≤2Y.
求 U 和 V 的相关系数.
解
因为区域 G 的面积为 2,所以 (X,Y) 的联合密度函数为
pX,Y(x,y)={1/2,0,(x,y)∈G,(x,y)∈/G.
因此(如图 3.16)
P(U=0)=∫01dy∫0y21dx=41,P(U=1)=1−P(U=0)=43,
P(V=1)=∫02dx∫0x/221dy=21,P(V=0)=1−P(V=1)=21.
这说明:U∼b(1,3/4),V∼b(1,1/2),所以
Var(U)=43(1−43)=163,Var(V)=21(1−21)=41.
又因为
E(UV)=P(UV=1)=P(U=1,V=1)=P(X>Y,X>2Y)=P(X>2Y)=P(V=1)=21,
Cov(U,V)=21−43×21=81.
所以 U 和 V 的相关系数为
Corr(U,V)=Var(U)Var(V)Cov(U,V)=3/161/41/8=31=0.5774.
\FigureThreeSixteen
设二维随机变量 (X,Y) 的联合密度函数如下,试求 (X,Y) 的协方差矩阵:
1.
p1(x,y)={6xy2,0,0<x<1, 0<y<1,其他;
p2(x,y)=⎩⎨⎧8x+y,0,0<x<2, 0<y<2,其他.
解
(1) 因为 p1(x,y) 可分离变量,所以 X 与 Y 相互独立,由此知 Cov(X,Y)=0.又因为
E(X)=∫01∫01x⋅6xy2dxdy=32,E(X2)=∫01∫01x2⋅6xy2dxdy=21,
E(Y)=∫01∫01y⋅6xy2dxdy=43,E(Y2)=∫01∫01y2⋅6xy2dxdy=53,
所以
Var(X)=21−(32)2=181,Var(Y)=53−(43)2=803.
由此得 (X,Y) 的协方差矩阵为
Σ1=(1/18003/80).
(2) 利用 p2(x,y) 的对称性可得
E(X)=E(Y)=∫02∫02x⋅8x+ydydx=67,
E(X2)=E(Y2)=∫02∫02x2⋅8x+ydydx=35,
所以
Var(X)=Var(Y)=35−(67)2=3611.
又因为
E(XY)=∫02∫02xy⋅8x+ydydx=34,
所以
Cov(X,Y)=34−3649=−361.
由此得 (X,Y) 的协方差矩阵为
Σ2=(11/36−1/36−1/3611/36).
设 a 为区间 (0,1) 上的一个定点,随机变量 X 服从区间 (0,1) 上的均匀分布,以 Y 表示点 X 到 a 的距离.问 a 为何值时 X 与 Y 不相关.
解
由题设条件知 X∼U(0,1),Y=∣X−a∣,E(X)=1/2.又因为
E(Y)=∫01∣x−a∣dx=∫0a(a−x)dx+∫a1(x−a)dx=a2−a+21,
E(XY)=∫0ax(a−x)dx+∫a1x(x−a)dx=3a3−2a+31.
所以
Cov(X,Y)=3a3−2a2+121.
所以由 Cov(X,Y)=0 可得方程
4a3−6a2+1=0,
此方程等价于
(2a−1)(2a2−2a−1)=0,
从中解得在 (0,1) 内的实根为 a=0.5,即 a=0.5 时,X 与 Y 不相关.
设随机变量 (X1,X2,X3) 满足条件
aX1+bX2+cX3=0,
E(X1)=E(X2)=E(X3)=d,
Var(X1)=Var(X2)=Var(X3)=σ2.
其中 a,b,c,d,σ2 均为常数,求相关系数 ρ12,ρ23,ρ31.
解
对等式 aX1+bX2=−cX3 的两边求方差得
a2σ2+b2σ2+2abσ2ρ12=c2σ2,
由此解得
ρ12=2abc2−a2−b2.
同理,对等式 aX1+cX3=−bX2 的两边求方差可得
ρ13=2acb2−a2−c2,
同理,对等式 bX2+cX3=−aX1 的两边求方差可得
ρ23=2bca2−b2−c2.
进一步当 d=0 时,对等式 aX1+bX2+cX3=0 的两边求期望得 (a+b+c)d=0,所以有
a+b+c=0,
由此可得
c2=a2+b2+2ab,b2=a2+c2+2ac,a2=b2+c2+2bc,
将上面三个式子分别代入 ρ12,ρ13,ρ23 的表达式中,可得
ρ12=ρ13=ρ23=1.
设随机变量 X 与 Y 都只能取两个值,试证:X 与 Y 的独立性与不相关性是等价的.
解
因为独立必定不相关,所以只需证:若 X 与 Y 不相关,则 X 与 Y 独立.不失一般性,可设 X 与 Y 只取 0 与 1 两个值,否则可设 X 的可能取值为 a,b;Y 的可能取值为 c,d.又记
X1=b−aX−a,Y1=d−cY−c.
所以 X1 与 Y1 的可能取值均为 0,1.
由 X 与 Y 不相关可得(见前面第 29 题)X1 与 Y1 不相关.所以只需证 X1 与 Y1 是独立的.记 (X1,Y1) 的联合分布列与各自的边际分布如下表所示:
| X1 | Y1 | | |
|---|
| \cmidrule(lr){2-3} | 0 | 1 | |
| 0 | p11 | p12 | 1−α |
| 1 | p21 | p22 | α |
| 1−β | β | |
由此可得
E(X1)=α,E(Y1)=β,E(X1Y1)=P(X1=1,Y1=1)=p22.
由 X1 与 Y1 的不相关性可得:p22=αβ.将此代入联合分布列与边际分布列的关系式
⎩⎨⎧p11+p12=1−α,p21+αβ=α,p11+p21=1−β,p12+αβ=β,
即可得
p11=(1−α)(1−β),p12=(1−α)β,p21=α(1−β),p22=αβ,
即 X1 与 Y1 独立,从而证得 X 与 Y 独立.
设随机变量 X 服从区间 (−0.5,0.5) 上的均匀分布,Y=cosX,则 X 与 Y 有函数关系.试求 Cov(X,Y).
解
因为 E(X)=0,所以
Cov(X,Y)=E(XY)=E(XcosX)=∫−0.50.5xcosxdx=0.
即 X 与 Y 不相关.
设二维随机变量 (X,Y) 服从单位圆内的均匀分布,其联合密度函数为
p(x,y)=⎩⎨⎧π1,0,x2+y2<1,x2+y2≥1.
试证 X 与 Y 不独立且 X 与 Y 不相关.
解
先求边际密度函数 pX(x) 和 pY(y).
pX(x)=∫−1−x21−x2π1dy=π21−x2,−1<x<1,
pY(y)=∫−1−y21−y2π1dx=π21−y2,−1<y<1.
所以由 p(x,y)=pX(x)pY(y),知 X 与 Y 不独立.
又因为 pX(x) 和 pY(y) 在对称区间上是偶函数,故 E(X)=E(Y)=0,从而
Cov(X,Y)=E(XY)=π1∫−11∫−1−x21−x2xydydx=0,
所以 X 与 Y 不相关.
设随机向量 (X1,X2,X3) 的相关系数分别为 ρ12,ρ23,ρ31,证明
ρ122+ρ232+ρ312≤1+2ρ12ρ23ρ31.
解
记标准化变量为
Xi∗=Var(Xi)Xi−E(Xi),i=1,2,3.
因为 E(Xi∗)=0,Var(Xi∗)=1,所以(由前面第 29 题)
Corr(Xi,Xj)=Cov(Xi∗,Xj∗)=E(Xi∗Xj∗)=ρij,i,j=1,2,3, i=j.
考虑到 ρij=ρji,故 (X1∗,X2∗,X3∗) 的协方差阵的行列式为
∣Σ∣=1ρ12ρ13ρ121ρ23ρ13ρ231=1+2ρ12ρ23ρ13−ρ122−ρ132−ρ232.
再由协方差阵的非负定性,可得
1+2ρ12ρ23ρ13−ρ122−ρ132−ρ232≥0,
移项即得结论.
设随机向量 (X1,X2,X3) 的相关系数分别为 ρ12,ρ23,ρ31,且
E(X1)=E(X2)=E(X3)=0,Var(X1)=Var(X2)=Var(X3)=σ2,
令
Y1=X1+X2,Y2=X2+X3,Y3=X3+X1.
证明:Y1,Y2,Y3 两两不相关的充要条件为 ρ12+ρ23+ρ31=−1.
解
充分性:若 ρ12+ρ23+ρ31=−1,则
Cov(Y1,Y2)=Cov(X1+X2,X2+X3)=Cov(X1,X2)+Cov(X1,X3)+Cov(X2,X2)+Cov(X2,X3)=ρ12Var(X1)Var(X2)+ρ13Var(X1)Var(X3)+ρ23Var(X2)Var(X3)+Var(X2)=σ2(ρ12+ρ13+ρ23)+σ2=−σ2+σ2=0.
同理可得
Cov(Y1,Y3)=Cov(Y2,Y3)=0,
由此得 Y1,Y2,Y3 两两不相关.
必要性:若 Y1,Y2,Y3 两两不相关,则由上面的推导可知
Cov(Y1,Y2)=σ2(ρ12+ρ13+ρ23)+σ2=0,
由此得
ρ12+ρ13+ρ23=−1.
设随机变量 X∼N(0,1),Y 各以 0.5 的概率取值 ±1,且假定 X 与 Y 相互独立.令 Z=X⋅Y,证明:
- Z∼N(0,1);
- X 与 Z 不相关,但不独立.
解
(1) 由全概率公式可得
FZ(z)=P(XY≤z)=P(Y=1)P(XY≤z∣Y=1)+P(Y=−1)P(XY≤z∣Y=−1)=P(Y=1)P(X≤z)+P(Y=−1)P(X≥−z)=0.5Φ(z)+0.5(1−Φ(−z))=Φ(z),
所以
Z∼N(0,1).
(2) 因为 E(X)=0,E(Y)=0,且 X 与 Y 相互独立,所以
Cov(X,Z)=E(X2Y)−E(X)E(XY)=E(X2)E(Y)−E(X)E(XY)=0,
所以 X 与 Z 不相关.为证明 X 与 Z 是不独立的,我们考虑如下特定事件的概率,并对其使用全概率公式
P(X≤1,XY≥1)=P(Y=1)P(X≤1,XY≥1∣Y=1)+P(Y=−1)P(X≤1,XY≥1∣Y=−1)=0.5P(X≤1,X≥1)+0.5P(X≤1,−X≥1)=0.5P(X=1)+0.5P(X≤−1)=0.5(1−Φ(1)).
考虑到 Z=XY∼N(0,1),故有
P(X≤1)P(XY≥1)=Φ(1)(1−Φ(1)),
而 Φ(1)=0.5,所以
P(X≤1,XY≥1)=P(X≤1)P(XY≥1),
即 X 与 Z 不独立.
设随机变量 X 有密度函数 p(x),且密度函数 p(x) 是偶函数,假定 E(∣X∣3)<∞.证明:X 与 Y=X2 不相关,但不独立.
解
因为 p(x) 是偶函数,所以 E(X)=E(X3)=0,从而
Cov(X,X2)=0,
这表明 X 与 Y=X2 不相关.为证明 X 与 Y 不相互独立,特给定 a>0,使得 P(X≤a)<1.现考虑如下特定事件的概率
P(X≤a,X2≤a2)=P(−a≤X≤a)P(X≤a)P(−a≤X≤a)=P(X≤a)P(X2≤a2),
所以 X 与 Y=X2 不独立.
设二维随机向量 (X,Y) 服从二维正态分布,且
E(X)=E(Y)=0,E(XY)<0.
证明:对任意正常数 a,b 有
P(X≥a,Y≥b)≤P(X≥a)P(Y≥b).
解
记 (X,Y)∼N(0,0,σ12,σ22,ρ),则
P(X≥a,Y≥b)=2πσ1σ21−ρ21∫a∞∫b∞exp{−2(1−ρ2)1(σ12x2+σ22y2−σ1σ22ρxy)}dydx.
由条件知 ρ<0,所以
exp{2(1−ρ2)σ1σ22ρxy}≤1,
由此得
P(X≥a,Y≥b)≤2πσ1σ21−ρ21∫a∞∫b∞exp{−2(1−ρ2)1(σ12x2+σ22y2)}dydx.
令
u=1−ρ2x,v=1−ρ2y,
则 dydx=(1−ρ2)dvdu,所以
P(X≥a,Y≥b)≤2πσ1σ21−ρ2∫a′∞∫b′∞exp(−2σ12u2−2σ22v2)dvdu,
其中
a′=1−ρ2a,b′=1−ρ2b.
又由 ρ2≤1,知
P(X≥a,Y≥b)≤2πσ1σ21∫a′∞∫b′∞exp(−2σ12u2−2σ22v2)dvdu=P(U≥a′)P(V≥b′)=P(X≥a)P(Y≥b).
这就完成不等式的证明.
设随机向量 (X,Y) 满足
E(X)=E(Y)=0,Var(X)=Var(Y)=1,Cov(X,Y)=ρ.
证明:
E(max{X2,Y2})≤1+1−ρ2.
解
由 E(X)=E(Y)=0,E(X2)=E(Y2)=1,知 Corr(X,Y)=E(XY)=ρ,所以
E(max{X2,Y2})=21E(X2+Y2+∣X2−Y2∣)=1+21E(∣X2−Y2∣)=1+21E(∣X−Y∣∣X+Y∣)≤1+21E∣X+Y∣2⋅E∣X−Y∣2≤1+21[E(X2)+E(Y2)+2E(XY)][E(X2)+E(Y2)−2E(XY)]=1+214−4ρ2=1+1−ρ2.
设随机变量 X1,X2,…,Xn 中任意两个的相关系数都是 ρ,试证:ρ≥−n−11.
解
因为
0≤E[i=1∑n(Xi−E(Xi))]2
=i=1∑nVar(Xi)+2ρ1≤i<j≤n∑Var(Xi)Var(Xj)
≤i=1∑nVar(Xi)+ρ1≤i<j≤n∑[Var(Xi)+Var(Xj)]
=i=1∑nVar(Xi)[1+ρ(n−1)],
所以 1+ρ(n−1)≥0,由此得
ρ≥−n−11.
设 X1,X2,…,Xn 是独立同分布的正值随机变量,证明:
E(X1+X2+⋯+XnX1+X2+⋯+Xk)=nk(k≤n).
解
记
Yj=∑i=1nXiXj,
则 Yj 同分布,且由 ∣Yj∣≤1,知 E(Yj) 存在且相等,j=1,2,…,n.又因为
1=E(j=1∑nYj)=nE(Y1),
所以有
E(Yj)=n1,j=1,2,…,n.
由此得
E(X1+X2+⋯+XnX1+X2+⋯+Xk)=E(Y1+Y2+⋯+Yk)=kE(Y1)=nk.
补充习题及解答
设随机变量 X 与 Y 相互独立,且方差存在.证明:
Var(XY)=Var(X)⋅Var(Y)+[E(X)]2Var(Y)+[E(Y)]2Var(X).
解
Var(XY)=E(X2Y2)−[E(XY)]2=E(X2)⋅E(Y2)−[E(X)]2[E(Y)]2=[Var(X)+[E(X)]2][Var(Y)+[E(Y)]2]−[E(X)]2[E(Y)]2=Var(X)⋅Var(Y)+Var(X)[E(Y)]2+Var(Y)[E(X)]2.
讨论:
(1) 若 E(X)=E(Y)=0,则有
Var(XY)=Var(X)Var(Y).
(2) 若 E(X)=μ1,E(Y)=μ2,则有
Var[(X−μ1)(Y−μ2)]=Var(X−μ1)Var(Y−μ2).
(3) 一般场合下,若 E(Xi)=μi,i=1,2,…,n,则有
Var[i=1∏n(Xi−μi)]=i=1∏nVar(Xi).
设 (X1,X2,…,Xn) 为 n 维随机变量,其协方差矩阵 B=(bij) 存在.证明:若 ∣B∣=0,则以概率 1 在各分量之间存在线性关系,即存在一组不全为零的实数 c1,c2,…,cn,使得
P(c1X1+c2X2+⋯+cnXn=常数)=1.
解
由于 ∣B∣=0 意味着 B 非满秩,故存在一组不全为零的实数向量
CT=(c1,c2,…,cn),
使得 CTBC=0.
另一方面,
CTBC=1≤i,j≤n∑cicjE[(Xi−E(Xi))(Xj−E(Xj))]=E{1≤i,j≤n∑[ciXi−E(ciXi)][cjXj−E(cjXj)]}=E{i=1∑n[ciXi−E(ciXi)]}2=Var(i=1∑nciXi).
方差为零的随机变量必几乎处处为常数,故存在常数 a,使得
P(c1X1+c2X2+⋯+cnXn=a)=1.
设随机变量 X1,X2,…,Xn 相互独立、同服从 N(0,1),证明:
U=i=1∑naiXi,V=i=1∑nbiXi
相互独立的充要条件为
i=1∑naibi=0,
其中诸 ai 与 bi 均为实数.
解
由于正态随机变量的线性组合仍为正态变量,而两个正态变量相互独立的充要条件是其协方差为 0,即 Cov(U,V)=0,如今已知 E(U)=E(V)=0,故 Cov(U,V)=0 的充要条件为 E(UV)=0,实际上
E(UV)=E(i=1∑naiXi)(j=1∑nbjXj)=E(i=1∑naibiXi2)+Ei=j∑aibjXiXj=i=1∑naibi.
这表明:U 与 V 相互独立的充要条件是
i=1∑naibi=0.
应用:在 n=2 场合,该命题表明 X1+X2 与 X1−X2 相互独立;X1+2X2 与 2X1−X2 独立,但 X1+2X2 与 2X1+X2 相依.
考虑:对一般正态分布 N(μ,σ2),上述命题是否仍成立?
评论
支持 Markdown 和 LaTeX 数学公式。