§5.4 三大抽样分布
依赖于
被以下题目直接调用
正文部分
§5.4 三大抽样分布
1. 三大抽样分布:χ2 分布,F 分布,t 分布
设 x1,x2,⋯,xn 和 y1,y2,⋯,ym 是来自标准正态分布的两个相互独立的样本,则此三个统计量的构造及其抽样分布如下表所示。
\small
\renewcommand{\arraystretch}{1.45}
| 统计量的构造 | 抽样分布密度函数 | 期望 | 方差 |
|---|
| χ2=x12+x22+⋯+xn2 | p(y)=Γ(2n)2n/21y2n−1e−y/2,(y>0) | n | 2n |
| F=(x12+x22+⋯+xn2)/n(y12+y22+⋯+ym2)/m | p(y)=Γ(2m)Γ(2n)Γ(2m+n)(nm)m/2y2m−1(1+nmy)−2m+n | n−2n \newline (n>2) | m(n−2)2(n−4)2n2(m+n−2) \newline (n>4) |
| t=(x12+x22+⋯+xn2)/ny1 | p(y)=nπΓ(2n)Γ(2n+1)(1+ny2)−2n+1,(−∞<y<∞) | 0 \newline (n>1) | n−2n \newline (n>2) |
正态总体参数的置信区间与假设检验大多将基于这三大抽样分布获得。
2. 一个重要定理
设 x1,x2,⋯,xn 是来自正态总体 N(μ,σ2) 的一个样本,其样本均值和样本方差分别为
xˉ=n1i=1∑nxi,s2=n−11i=1∑n(xi−xˉ)2,
则有
- xˉ 与 s2 相互独立;
- xˉ∼N(μ,σ2/n);
- σ2(n−1)s2∼χ2(n−1)。
3. 两个重要推论
(1)设 x1,x2,⋯,xn 是来自正态总体 N(μ,σ2) 的样本,则有
t=sn(xˉ−μ)∼t(n−1),
其中 xˉ 为样本均值,s 为样本标准差。
(2)设 x1,x2,⋯,xm 是来自 N(μ1,σ12) 的样本,y1,y2,⋯,yn 是来自 N(μ2,σ22) 的样本,且此两样本相互独立,则有
F=sy2/σ22sx2/σ12∼F(m−1,n−1),
其中 sx2,sy2 分别是两个样本方差。若 σ12=σ22,则
F=sy2sx2∼F(m−1,n−1).
4. 三个说明
- t(n) 分布的密度函数呈“中间高,两边低,左右对称”,与标准正态曲线类似,但峰比 N(0,1) 低,两侧尾部概率比 N(0,1) 大。当自由度 n→∞ 时,t(n) 分布趋向 N(0,1) 分布;当 n>30 时,两者相差已不大,可用 N(0,1) 近似 t(n) 分布。
- 关于 t(n) 分布分位数有 tα(n)+t1−α(n)=0(互为相反数);关于 F(m,n) 分布分位数有 Fα(m,n)⋅F1−α(n,m)=1(互为倒数)。
- t2(n)=F(1,n)。
习题与解答 5.4
在总体 N(7.6,4) 中抽取容量为 n 的样本,如果要求样本均值落在 (5.6,9.6) 内的概率不小于 0.95,则 n 至少为多少?
解
样本均值 xˉ∼N(7.6,n4),按题意可建立如下不等式
P(5.6<xˉ<9.6)=P(4/n5.6−7.6<4/nxˉ−7.6<4/n9.6−7.6)≥0.95.
即
2Φ(n)−1≥0.95,
所以
Φ(n)≥0.975.
查表得 Φ(1.96)=0.975,故 n≥1.96,或 n≥3.84,即样本量 n 至少为 4。
设 x1,x2,⋯,xn 是来自 N(μ,16) 的样本,问 n 多大时才能使得
P(∣xˉ−μ∣<1)≥0.95
成立?
解
样本均值
xˉ∼N(μ,n16),
因而
P(∣xˉ−μ∣<1)=P(16/nxˉ−μ<16/n1)=2Φ(4n)−1≥0.95.
所以
Φ(4n)≥0.975,4n≥1.96.
这给出
n≥61.47,
即 n 至少为 62 时,上述概率不等式成立。
由正态总体 N(100,4) 抽取两个独立样本,样本均值分别为 xˉ,yˉ,样本容量分别为 15,20,试求
P(∣xˉ−yˉ∣>0.2).
解
由条件得
xˉ∼N(100,154),yˉ∼N(100,204),
且 xˉ 和 yˉ 相互独立,从而
xˉ−yˉ∼N(0,154+204)=N(0,157).
于是
P(∣xˉ−yˉ∣>0.2)=P(7/15xˉ−yˉ>7/150.2)=2(1−Φ(0.29))=0.7718.
由正态总体 N(μ,σ2) 抽取容量为 20 的样本,试求
P(10σ2≤i=1∑20(xi−μ)2≤30σ2).
解
因为
xi∼N(μ,σ2),
所以
σxi−μ∼N(0,1),i=1∑20σ2(xi−μ)2∼χ2(20).
用 k20(x) 表示服从 χ2(20) 的随机变量的分布函数,则
P(10σ2≤i=1∑20(xi−μ)2≤30σ2)=P(10≤i=1∑20σ2(xi−μ)2≤30)=k20(30)−k20(10).
利用统计软件可计算上式。譬如,可使用 MATLAB 软件计算上式:在命令行输入 \texttt{chi2cdf(30,20)} 则给出 0.9301,输入 \texttt{chi2cdf(10,20)} 则给出 0.0318,直接输入 \texttt{chi2cdf(30,20)-chi2cdf(10,20)} 则一次性给出 0.8983。这里的 \texttt{chi2cdf(x,k)} 就表示自由度为 k 的 χ2 分布在 x 处的分布函数值。于是有
P(10σ2≤i=1∑20(xi−μ)2≤30σ2)=0.8983.
设 x1,x2,⋯,x16 是来自 N(μ,σ2) 的样本,经计算 xˉ=9,s2=5.32,试求
P(∣xˉ−μ∣<0.6).
解
因为
sn(xˉ−μ)=(n−1)s2/σ2/(n−1)(xˉ−μ)/(σ/n)∼t(n−1),
用 t15(x) 表示服从 t(15) 的随机变量的分布函数,注意到 t 分布是对称的,故
P(∣xˉ−μ∣<0.6)=P(s4∣xˉ−μ∣<s4×0.6)=2t15(1.0405)−1.
利用统计软件可计算上式。譬如,使用 MATLAB 软件在命令行输入 \texttt{tcdf(1.0405,15)} 则给出 0.8427,直接输入 \texttt{2*tcdf(1.0405,15)-1} 则给出 0.6854。这里的 \texttt{tcdf(x,k)} 就表示自由度为 k 的 t 分布在 x 处的分布函数值。于是有
P(∣xˉ−μ∣<0.6)=2×0.8427−1=0.6854.
设 x1,x2,⋯,xn 是来自 N(μ,1) 的样本,试确定最大的常数 c,使得对任意的 μ≥0,有
P(∣xˉ∣<c)≤α.
解
由于
xˉ∼N(μ,n1),
所以 P(∣xˉ∣<c) 的值依赖于 μ,它是 μ 的函数,记为 g(μ),于是
g(μ)=Pμ(∣xˉ∣<c)=P(−c<xˉ<c)=Φ(n(c−μ))−Φ(n(−c−μ)),
其导数为
g′(μ)=−n[φ(n(c−μ))−φ(n(−c−μ))],
其中 φ(x) 表示 N(0,1) 的密度函数,由于 c≥0,μ≥0,故 ∣−c−μ∣≥∣c−μ∣,从而
φ(n(−c−μ))≤φ(n(c−μ)),
这说明 g′(μ)≤0,g(μ) 为减函数,并在 μ=0 处取最大值,即
μ≥0max{Φ(n(c−μ))−Φ(n(−c−μ))}=Φ(nc)−Φ(−nc)=2Φ(nc)−1.
于是,只要
2Φ(nc)−1≤α,
即
(0≤)c≤nu(1+α)/2,
就可保证对任意的 μ≥0,有
P(∣xˉ∣<c)≤α.
最大的常数为
c=nu(1+α)/2.
设随机变量 X∼F(n,n),证明 P(X<1)=0.5。
解
证 若随机变量 X∼F(n,n),则 Y=1/X 也服从 F(n,n),从而
P(X<1)=P(Y<1)=P(1/X<1)=P(X>1).
而
P(X<1)+P(X>1)=1.
这就证明了
P(X<1)=0.5.
设随机变量 X∼F(n,m),证明:
Z=1+mnXmnX
服从贝塔分布,并指出其参数。
解
证 若 X∼F(n,m),则 X 的密度函数为
pX(x)=Γ(2n)Γ(2m)Γ(2m+n)(mn)n/2x2n−1(1+mnx)−2m+n.
由
z=mnx/(1+mnx)
在 (0,∞) 上是严格单调增函数,其反函数为
x=n(1−z)mz,dzdx=n(1−z)2m.
故 Z 的密度函数为
pZ(z)=Γ(2n)Γ(2m)Γ(2m+n)(mn)n/2(n(1−z)mz)2n−1(1+1−zz)−2m+nn(1−z)2m=Γ(2n)Γ(2m)Γ(2m+n)z2n−1(1−z)2m−1,0<z<1.
这说明
Z∼Be(2n,2m),
其两个参数分别为 F 分布两个自由度的一半。
设 x1,x2 是来自 N(0,σ2) 的样本,试求
Y=(x1−x2x1+x2)2
的分布。
解
由条件,
x1+x2∼N(0,2σ2),x1−x2∼N(0,2σ2),
又
Cov(x1+x2,x1−x2)=Var(x1)−Var(x2)=0,
且 x1+x2 与 x1−x2 服从二元正态分布,故 x1+x2 与 x1−x2 独立,于是
(2σx1+x2)2∼χ2(1),(2σx1−x2)2∼χ2(1),
从而
Y=(x1−x2x1+x2)2=((x1−x2)/2σ)2((x1+x2)/2σ)2∼F(1,1).
设总体为 N(0,1),x1,x2 为样本,试求常数 k,使得
P((x1−x2)2+(x1+x2)2(x1+x2)2>k)=0.05.
解
由上题,
Y=(x1−x2x1+x2)2∼F(1,1),
又令
Z=(x1−x2)2+(x1+x2)2(x1+x2)2=1+YY.
由于 Z 取值于 (0,1),故所需要求有 0<k<1,从而
P(Z>k)=P(1+YY>k)=P(Y>1−kk)=0.05.
于是
1−kk=F0.95(1,1)=161.45,
这给出
k=1+161.45161.45=0.9938.
设 x1,x2,⋯,xn 是来自 N(μ1,σ2) 的样本,y1,y2,⋯,ym 是来自 N(μ2,σ2) 的样本,c,d 是任意两个不为 0 的常数,证明:
t=swnc2+md2c(xˉ−μ1)+d(yˉ−μ2)∼t(n+m−2),
其中
sw2=n+m−2(n−1)sx2+(m−1)sy2,
sx2 与 sy2 分别是两个样本方差。
解
由条件有
c(xˉ−μ1)∼N(0,nc2σ2),d(yˉ−μ2)∼N(0,md2σ2),
σ2(n−1)sx2∼χ2(n−1),σ2(m−1)sy2∼χ2(m−1),
且 xˉ,yˉ,sx2,sy2 相互独立,故
c(xˉ−μ1)+d(yˉ−μ2)∼N(0,nc2σ2+md2σ2),
σ2(n+m−2)sw2=σ2(n−1)sx2+σ2(m−1)sy2∼χ2(n+m−2).
于是
t=n+m−2(n+m−2)sw2/σ2[c(xˉ−μ1)+d(yˉ−μ2)]/nc2σ2+md2σ2∼t(n+m−2).
设 x1,x2,⋯,xn,xn+1 是来自 N(μ,σ2) 的样本,
xˉn=n1i=1∑nxi,sn2=n−11i=1∑n(xi−xˉn)2,
试求常数 c 使得
tc=csnxn+1−xˉn
服从 t 分布,并指出分布的自由度。
解
由条件:
xn+1∼N(μ,σ2),xˉn∼N(μ,nσ2),σ2(n−1)sn2∼χ2(n−1),
且 xn+1,xˉn,sn2 相互独立,因而
xn+1−xˉn∼N(0,σ2+nσ2)=N(0,nn+1σ2),
故
n−1(n−1)sn2/σ2(xn+1−xˉn)nn+1/nn+1σ2∼t(n−1).
这说明当
c=n+1n
时,
tc=csnxn+1−xˉn∼t(n−1),
自由度为 n−1。
设从方差相等的两个独立正态总体中分别抽取容量为 15,20 的样本,其样本方差分别为 s12,s22,试求
P(s22s12>2).
解
不妨设正态总体的方差为 σ2,则有
σ214s12∼χ2(14),σ219s22∼χ2(19),
于是
F=s22s12∼F(14,19).
利用统计软件计算可算出
P(s22s12>2)=P(F>2)=0.0798.
譬如,可使用 MATLAB 软件计算上式:在命令行输入 \texttt{1-fcdf(2,14,19)} 则给出 0.0798,这里的 \texttt{fcdf(x,k_1,k_2)} 就表示自由度为 (k1,k2) 的 F 分布在 x 处的分布函数。
设 x1,x2,⋯,x15 是总体 N(0,σ2) 的一个样本,求
y=2(x112+x122+⋯+x152)x12+x22+⋯+x102
的分布。
解
由于 xi/σ 为独立同分布的 N(0,1) 随机变量,故
σ21(x12+x22+⋯+x102)∼χ2(10),
σ21(x112+x122+⋯+x152)∼χ2(5),
且两者独立,故
y=σ21(x112+x122+⋯+x152)/5σ21(x12+x22+⋯+x102)/10∼F(10,5).
设 (x1,x2,⋯,x17) 是来自正态分布 N(μ,σ2) 的一个样本,xˉ 与 s2 分别是样本均值与样本方差。求 k,使得
P(xˉ>μ+ks)=0.95.
解
在正态总体下,
sn(xˉ−μ)∼t(n−1),
所以
P(xˉ>μ+ks)=P(sxˉ−μ>k)=P(sn(xˉ−μ)>kn)=0.95,
即
P(sn(xˉ−μ)≤kn)=0.05.
故 kn 是自由度为 n−1 的 t 分布 t(n−1) 的 0.05 分位数,即
kn=t0.05(n−1).
如令 n=17,查表知
t0.05(16)=−1.7459,
从而
k=17−1.7459=−0.4234.
设总体 X 服从 N(μ,σ2),σ2>0,从该总体中抽取样本 x1,x2,⋯,x2n (n≥1),其样本均值为
xˉ=2n1i=1∑2nxi,
求统计量
y=i=1∑n(xi+xn+i−2xˉ)2
的数学期望。
解
记
yi=xi+xn+i,i=1,2,⋯,n,
则 y1,y2,⋯,yn 可看成来自 N(2μ,2σ2) 样本,而
y=i=1∑n(xi+xn+i−2xˉ)2=i=1∑n(yi−yˉ)2.
由《概率论与数理统计教程(第三版)》中定理 5.4.1,
2σ2y∼χ2(n−1),
从而
E(y)=2(n−1)σ2.
证明:若随机变量 T∼t(k),则对 r<k 有
E(Tr)=⎩⎨⎧0,πΓ(2k)kr/2Γ(2r+1)Γ(2k−r),r 为奇数,r 为偶数,
并由此写出 E(T) 与 Var(T)。
解
证 由 T 变量的结构知,T 变量可表示为
T=V/kU=k1/2U⋅V−1/2,
其中 U∼N(0,1),V∼χ2(k)=Ga(2k,21),且 U 与 V 独立,从而有
E(Tr)=kr/2E(Ur)E(V−r/2).
由于
E(Ur)=⎩⎨⎧0,π2r/2Γ(2r+1),r 为奇数,r 为偶数,
以及
E(V−r/2)=Γ(k/2)2−k/2∫0∞v−r/2vk/2−1e−v/2dv=Γ(k/2)2−r/2Γ(2k−r),r<k,
将两者代回可知,在 r<k 时,若 r 为奇数,则 E(Tr)=0,若 r 为偶数,则
E(Tr)=πΓ(2k)kr/2Γ(2r+1)Γ(2k−r).
证明完成。
进一步,当 r=1 时,
E(T)=0
(此时要求 k>1,否则均值不存在);当 r=2 时,
Var(T)=E(T2)=k−2k
(此时要求 k>2,否则方差不存在)。
证明:若随机变量 F∼F(k,m),则当
−2k<r<2m
时有
E(Fr)=krΓ(2k)Γ(2m)mrΓ(2k+r)Γ(2m−r),
由此写出 E(F) 与 Var(F)。
解
证 由 F 变量的构造知
F=w/mv/k=kmv⋅w−1,
其中 v∼χ2(k),w∼χ2(m),且 v 与 w 相互独立,因此 F 变量的 r 阶矩为
E(Fr)=krmrE(vr)E(w−r).
由于 χ2(k)=Ga(2k,21),容易算得
E(vr)=(1/2)rΓ(2k)Γ(2k+r),r>−2k,
E(w−r)=(1/2)−rΓ(2m)Γ(2m−r),r<2m,
从而可得
E(Fr)=krΓ(2k)Γ(2m)mrΓ(2k+r)Γ(2m−r),−2k<r<2m,
在其他场合,E(Fr) 不存在。
当 r=1 时,由于 k>0,只要 m>2,就有
E(F)=kΓ(2k)Γ(2m)mΓ(2k+1)Γ(2m−1)=m−2m.
当 r=2 时,只要 m>4,就有
E(F2)=k2Γ(2k)Γ(2m)m2Γ(2k+2)Γ(2m−2)=k(m−2)(m−4)m2(k+2).
从而
Var(F)=E(F2)−(E(F))2=k(m−2)2(m−4)2m2(k+m−2).
设 x1,x2,⋯,xn 是来自某连续总体的一个样本。该总体的分布函数 F(x) 是连续严格增函数,证明:统计量
T=−2i=1∑nlnF(xi)
服从 χ2(2n)。
解
证 分几步进行:
(1)若 X∼F(x),且 F(x) 为连续严格增函数,则
Y=F(X)∼U(0,1).
这是因为 F(x) 的反函数 F−1 也存在。于是 Y=F(X) 的分布函数为
FY(y)=P(F(X)≤y)=P(X≤F−1(y))=F(F−1(y))=y,
其中 y∈(0,1),当 y≤0 时,FY(y)=0,当 y≥1 时,FY(y)=1,所以 F(X)∼U(0,1)。
(2)若 Y∼U(0,1),则
Z=−2lnY∼χ2(2).
这是由于 Y 仅在 (0,1) 上取值,故 Z=−2lnY 仅在 (0,∞) 上取值,所以当 z≤0 时,FZ(z)=0;当 z>0 时,有
FZ(z)=P(−2lnY≤z)=P(Y≥e−z/2)=1−e−z/2.
这是自由度为 2 的 χ2 分布函数,即 Z=−2lnY∼χ2(2)。
(3)由 X1,X2,⋯,Xn 的相互独立性可知 F(X1),F(X2),⋯,F(Xn) 相互独立,由(1)与(2)可知
T=−2i=1∑nlnF(xi)∼χ2(2n).
设 x1,x2,⋯,xn 是来自正态总体 N(μ,σ2) 的一个样本,
sn2=n−11i=1∑n(xi−xˉ)2
是样本方差,试求满足
P(σ2sn2≤1.5)≥0.95
的最小 n 值。
解
由于
σ2(n−1)sn2∼χ2(n−1),
所以要使
P(σ2sn2≤1.5)≥0.95,
等价于要使 χ2(n−1) 分布的 0.95 分位数 χ0.952(n−1) 不大于 1.5(n−1),即
χ0.952(n−1)≤1.5(n−1).
满足上述不等式的最小 n 可用搜索法获得,如下表:
n2510χ0.952(n−1)3.84159.487716.91901.5(n−1)1.5613.5
| n | χ0.952(n−1) | 1.5(n−1) |
|---|
| 15 | 23.6848 | 21 |
| 20 | 30.1435 | 28.5 |
| 25 | 36.4150 | 36 |
| 26 | 37.6525 | 37.5 |
| 27 | 38.8851 | 39 |
| 28 | 40.1133 | 40.5 |
由此可见,当 n≥27 时,就可使上述不等式成立。
设 x1,x2,…,xn 独立同分布服从 N(μ,σ2),
xˉ=n1i=1∑nxi,s2=n−11i=1∑n(xi−xˉ)2,
记
ξ=sx1−xˉ.
试找出 ξ 与 t 分布的联系(提示:作正交变换
y1=nxˉ,y2=n−1n(x1−xˉ),yi=j=1∑ncijxj, i=3,4,…,n
)。
解
x1,x2,…,xn 的联合密度函数为
p(x1,x2,…,xn)=(2πσ2)−n/2exp{−2σ21i=1∑n(xi−μ)2}=(2πσ2)−n/2exp{−2σ2∑i=1nxi2−2nxˉμ+nμ2}.
记 X=(x1,x2,…,xn)T,取一个 n 维正交矩阵 A,其第一行为元素全为 1/n,第二行为
(nn−1,−n(n−1)1,−n(n−1)1,…,−n(n−1)1),
其余元素只要满足正交性即可。令 Y=AX,则该变换的雅可比行列式为 1,且注意到
y1=nxˉ,y2=n−1n(x1−xˉ),i=1∑nyi2=YTY=XTATAX=i=1∑nxi2.
于是 y1,y2,…,yn 的联合密度函数为
p(y1,y2,…,yn)=(2πσ2)−n/2exp{−2σ2∑i=2nyi2−2nμy1+nμ2}=(2πσ2)−n/2exp{−2σ2∑i=2nyi2+(y1−nμ)2}.
由此,y2,y3,…,yn 独立同分布于 N(0,σ2),且
(n−1)s2=i=2∑nyi2.
令
t=(y32+⋯+yn2)/(n−2)y2=[(n−1)s2−y22]/(n−2)y2,
则 t∼t(n−2),而
ξ=sx1−xˉ=nn−1⋅(n−1)s2y2
=nn−1⋅[(n−1)s2−y22]/(n−2)(n−1)s2[(n−1)s2−y22]/(n−2)y2
=nn−1⋅n−2+t2t.
这就建立了 ξ 与 t 分布的联系。
设 x1,x2,…,xm 相互独立,xi 服从 χ2(ni),i=1,2,…,m。令
U1=x1+x2x1,U2=x1+x2+x3x1+x2,…,Um−1=x1+⋯+xmx1+⋯+xm−1.
证明:U1,U2,…,Um−1 相互独立,且
Ui∼Be(2n1+n2+⋯+ni,2ni+1),i=1,2,…,m−1.
(提示:令 Um=x1+x2+⋯+xm,作变换
x1=U1U2⋯Um,x2=U2U3⋯Um−U1U2⋯Um,…,xm=Um−Um−1Um
。)
解
令 Um=x1+x2+⋯+xm,则
⎩⎨⎧x1x2xm=U1⋯Um,=U2⋯Um−U1⋯Um, ⋮=Um−Um−1Um.
再令
St=UtUt+1⋯Um,t=1,2,…,m,
则
⎩⎨⎧x1x2xm=S1,=S2−S1, ⋮=Sm−Sm−1.
所以变换的雅可比行列式为
J=∂(u1,u2,…,um)∂(x1,x2,…,xm)=u1s1−u1s10⋮0u2s1u2s2−s1−u2s2⋮0u3s1u3s2−s1u3s3−s2⋮0⋯⋯⋯⋱⋯ums1ums2−s1ums3−s2⋮umsm−sm−1.
计算该行列式,可得
J=i=2∏muii−1.
因为
p(x1,x2,…,xm)=i=1∏m2ni/2Γ(2ni)1exp{−21i=1∑mxi}i=1∏mxini/2−1,
把雅可比行列式代入上式可得
p(u1,u2,…,um)=i=1∏m2ni/2Γ(2ni)1exp{−21um}um2n1+n2+⋯+nm−1⋅i=1∏m−1ui2n1+n2+⋯+ni−1(1−ui)2ni+1−1.
由此可知 U1,U2,…,Um−1 相互独立,且
Ui∼Be(2n1+n2+⋯+ni,2ni+1),i=1,2,…,m−1.
补充习题及解答
设 (xi,yi),i=1,2,…,n 是取自二维正态分布
N(μ1,μ2,σ12,σ22,ρ) 的样本,记
xˉ=n1i=1∑nxi,yˉ=n1i=1∑nyi,
sx2=n−11i=1∑n(xi−xˉ)2,sy2=n−11i=1∑n(yi−yˉ)2,
r=∑i=1n(xi−xˉ)2⋅∑i=1n(yi−yˉ)2∑i=1n(xi−xˉ)(yi−yˉ).
试求统计量
T=nsx2+sy2−2rsxsyxˉ−yˉ−(μ1−μ2)
的分布。
解
容易看出 xˉ−yˉ 仍服从正态分布,且
E(xˉ−yˉ)=μ1−μ2,Var(xˉ−yˉ)=nσ12+nσ22−n2ρσ1σ2.
所以
nσ12+σ22−2ρσ1σ2xˉ−yˉ−(μ1−μ2)∼N(0,1).
另外,
(n−1)(sx2+sy2−2rsxsy)=i=1∑n(xi−xˉ)2+i=1∑n(yi−yˉ)2−2i=1∑n(xi−xˉ)(yi−yˉ)=i=1∑n[(xi−yi)−(xˉ−yˉ)]2.
类似于一维正态变量场合,可证:
(n−1)(sx2+sy2−2rsxsy)
与 xˉ−yˉ 相互独立,且
σ12+σ22−2ρσ1σ2(n−1)(sx2+sy2−2rsxsy)∼χ2(n−1).
于是根据 t 变量的构造可知
(σ12+σ22−2ρσ1σ2)(n−1)(n−1)(sx2+sy2−2rsxsy)σ12+σ22−2ρσ1σ2n[xˉ−yˉ−(μ1−μ2)]=nsx2+sy2−2rsxsyxˉ−yˉ−(μ1−μ2)∼t(n−1).
这就是我们要求的分布。
设 Tn 是自由度为 n 的 t 变量,试证:Tn 的渐近分布为标准正态分布 N(0,1)。
解
据自由度为 n 的 t 变量的构造知
Tn=Y/nX,
其中 X∼N(0,1),Y∼χ2(n),且 X 与 Y 相互独立。由 Y 的特征函数为
(1−2it)−n/2,
故 Y/n 的特征函数为
(1−n2it)−n/2.
考察其极限知
n→∞lim(1−n2it)−n/2=n→∞lim(1−n2it)−n/(2it)=eit.
由特征函数性质知
nYP1,
从而由
nYP1,
再按依概率收敛性知
Tn=XY/n1PX,
这就证明了 Tn 的渐近分布为标准正态分布 N(0,1)。
注:此结论也可从自由度为 n 的 t 分布的密度函数直接导出,只是推算稍微复杂一些。
评论
支持 Markdown 和 LaTeX 数学公式。