§6.4 最小方差无偏估计
依赖于
被以下题目直接调用
正文部分
§6.4 最小方差无偏估计
- 均方误差 设 θ^ 是 θ 的一个估计(无偏的或有偏的),则称
MSE(θ^)=E(θ^−θ)2=Var(θ^)+[E(θ^)−θ]2
为 θ^ 的均方误差。均方误差较小意味着:θ^ 不仅方差较小,而且偏差 E(θ^)−θ 也小,所以均方误差是评价点估计的一般标准。
- 使均方误差一致最小的估计量一般是不存在的,但两个估计的优劣可用均方误差评估;
- 在无偏估计类中使均方误差最小就是使方差最小。
- 一致最小方差无偏估计 设 θ^ 是 θ 的一个无偏估计,如果对另外任意一个 θ 的无偏估计 θ~,在参数空间 Θ={θ} 上都有
Varθ(θ^)≤Varθ(θ~),
则称 θ^ 是 θ 的一致最小方差无偏估计,简记为 UMVUE。
- 判断准则 设 θ^=θ^(x1,x2,⋯,xn) 是 θ 的一个无偏估计,Var(θ^)<∞。如果对任意一个满足
E(φ(x1,x2,⋯,xn))=0
和
Var(φ(x1,x2,⋯,xn))<∞
的 φ,都有
Covθ(θ^,φ)=0,∀θ∈Θ,
则 θ^ 是 θ 的 UMVUE。
- 充分性原则
- 任一参数 θ 的 UMVUE 不一定存在,若存在,则它一定可表示为充分统计量的函数;
- 若 θ 的某个无偏估计 θ^ 不是充分统计量 T=T(x1,x2,⋯,xn) 的函数,则通过条件期望可以获得一个新的无偏估计 θ~=E(θ^∣T),且方差不超过原估计的方差;
- 考虑 θ 的估计时,只需要在其充分统计量的函数中寻找即可,这说法对所有统计推断都是正确的,这便是充分性原则。
- 费希尔信息量 I(θ) 设总体的概率函数 p(x;θ),θ∈Θ 满足下列条件:
- 参数空间 Θ 是直线上的一个开区间;
- 支撑 S={x:p(x;θ)>0} 与 θ 无关;
- 导数 ∂θ∂p(x;θ) 对一切 θ∈Θ 都存在;
- 对 p(x;θ),积分与微分运算可交换次序,即
∂θ∂∫−∞∞p(x;θ)dx=∫−∞∞∂θ∂p(x;θ)dx;
- 期望
I(θ)=E[∂θ∂lnp(x;θ)]2
存在。
则称该期望 I(θ) 为总体分布的费希尔信息量。若二阶导数对一切 θ∈Θ 都存在,则 I(θ) 还可用下式计算:
I(θ)=−E[∂θ2∂2lnp(x;θ)].
- 常用分布的费希尔信息量
- 二点分布 b(1,p) 的费希尔信息量 I(p)=[p(1−p)]−1;
- 泊松分布 p(λ) 的费希尔信息量 I(λ)=λ−1;
- 指数分布 Exp(λ) 的费希尔信息量 I(λ)=λ2;
- 正态分布 N(μ,1) 的费希尔信息量 I(μ)=1;
- 正态分布 N(0,σ2) 的费希尔信息量 I(σ2)=2σ41;
- 正态分布 N(μ,σ2) 的费希尔信息量(信息矩阵)
I(μ,σ2)=(1/σ2001/(2σ4)).
- C-R 不等式 设 T=T(x1,x2,⋯,xn) 是未知参数 g(θ) 的一个无偏估计,若
g′(θ)=∂θ∂g(θ)
存在,则在费希尔信息量 I(θ) 也存在的条件下有
Var(T)≥nI(θ)[g′(θ)]2.
上式称为克拉默—拉奥(C-R)不等式,nI(θ)[g′(θ)]2 称为 g(θ) 的无偏估计的方差的 C-R 下界,简称 g(θ) 的 C-R 下界。特别,对 θ 的无偏估计 θ^,有
Var(θ^)≥[nI(θ)]−1.
注:g(θ) 的 C-R 下界并不是对任意参数函数 g(θ) 的无偏估计的方差都可达到,但能达到 C-R 下界的 g(θ) 的估计 T=T(x1,x2,⋯,xn) 一定是 g(θ) 的 UMVUE。方差达到 C-R 下界的无偏估计称为有效估计。
习题与解答 6.4
设总体概率函数是 p(x;θ),x1,x2,⋯,xn 是其样本,T=T(x1,x2,⋯,xn) 是 θ 的充分统计量,则对 g(θ) 的任何一个估计 g^,令
g~=E(g^∣T),
证明:
MSE(g~)≤MSE(g^).
这说明,在均方误差准则下,人们只需要考虑基于充分统计量的估计。
解
我们将均方误差作如下分解
MSE(g^)=E(g^−g(θ))2=E(g^−g~+g~−g(θ))2=E(g^−g~)2+MSE(g~)+2E[(g^−g~)(g~−g(θ))].
注意到 g~=E(g^∣T),这说明
E[(g^−g~)∣T]=E(g^∣T)−E[E(g^∣T)∣T]=E(g^∣T)−E(g^∣T)=0,
于是
E[(g^−g~)(g~−g(θ))]=E{E[(g^−g~)(g~−g(θ))∣T]}=E{(g~−g(θ))E[(g^−g~)∣T]}=0.
因而
MSE(g^)=E(g^−g~)2+MSE(g~)≥MSE(g~).
设 T1,T2 分别是 θ1,θ2 的 UMVUE,证明:对任意的(非零)常数 a,b,aT1+bT2 是 aθ1+bθ2 的 UMVUE。
解
由于 T1,T2 分别是 θ1,θ2 的 UMVUE,故
E(Ti)=θi,i=1,2.
且对任意一个 ϕ(x),满足 E(ϕ)=0,由判断准则知
Cov(Ti,ϕ)=0,i=1,2.
于是
E(aT1+bT2)=aθ1+bθ2,
Cov(aT1+bT2,ϕ)=aCov(T1,ϕ)+bCov(T2,ϕ)=0.
因此 aT1+bT2 是 aθ1+bθ2 的 UMVUE。
设 T 是 g(θ) 的 UMVUE,g^ 是 g(θ) 的无偏估计,证明:若 Var(g^)<∞,则
Cov(T,g^)≥0.
解
因为 T 是 g(θ) 的 UMVUE,g^ 是 g(θ) 的无偏估计,故其差
T−g^
是 0 的无偏估计,即
E(T−g^)=0,
且
Var(T−g^)<∞.
由判断准则知
Cov(T,T−g^)=0,
这说明
Var(T)−Cov(T,g^)=0,
即
Cov(T,g^)=Var(T)≥0.
设总体 X∼N(μ,σ2),x1,x2,⋯,xn 为样本,证明,
xˉ=n1i=1∑nxi,s2=n−11i=1∑n(xi−xˉ)2
分别为 μ,σ2 的 UMVUE。
解
大家知道:xˉ,s2 分别是 μ,σ2 的无偏估计,设 φ(x1,x2,⋯,xn) 是 0 的任一无偏估计,则
E(φ)=∫−∞∞⋯∫−∞∞φ⋅i=1∏n2πσ1exp{−2σ2(xi−μ)2}dx1⋯dxn=0,
即
∫−∞∞⋯∫−∞∞φ⋅(2πσ2)−n/2exp{−2σ21i=1∑nxi2+σ2nxˉμ−2σ2nμ2}dx1⋯dxn=0.(1)
将 (1) 式两端对 μ 求导,并注意到 E(φ)=0,有
∫−∞∞⋯∫−∞∞σ2nxˉφ⋅(2πσ2)−n/2exp{−2σ21i=1∑nxi2+σ2nxˉμ−2σ2nμ2}dx1⋯dxn=0.(2)
这说明
E(σ2nxˉφ)=0,
即
E(xˉφ)=0,
于是
Cov(xˉ,φ)=E(xˉφ)−E(xˉ)E(φ)=0,
从而 xˉ 是 μ 的 UMVUE。
为证明 s2 是 σ2 的 UMVUE,我们将 (2) 式的两端再对 μ 求导,得
∫−∞∞⋯∫−∞∞(σ2nxˉ)2φ⋅(2πσ2)−2nexp{−2σ21i=1∑nxi2+σ2nxˉμ−2σ2nμ2}dx1⋯dxn
−∫−∞∞⋯∫−∞∞σ2nxˉ⋅σ2nμφ⋅(2πσ2)−2nexp{−2σ21i=1∑nxi2+σ2nxˉμ−2σ2nμ2}dx1⋯dxn=0,
由此可以得到 E(xˉ2φ)=0。下一步,将 ① 式两端对 σ2 求导,略去几个前面已经指出积分为 0 的项,有
∫−∞∞⋯∫−∞∞i=1∑nxi2φ⋅(2πσ2)−2nexp{−2σ21i=1∑nxi2+σ2nxˉμ−2σ2nμ2}dx1⋯dxn=0.
这表明 E(φ∑i=1nxi2)=0,由此可得到 E(s2φ)=0,因而
Cov(s2,φ)=E(s2φ)−E(s2)E(φ)=0.
这就证明了 s2 是 σ2 的 UMVUE。
设总体 p(x;θ) 的费希尔信息量存在,若二阶导数 ∂θ2∂2p(x;θ) 对一切的 θ∈Θ 存在,证明费希尔信息量
I(θ)=−E(∂θ2∂2lnp(x;θ)).
解
记
Sθ=∂θ∂lnp(x;θ),
则
E(Sθ)=∫−∞∞p(x;θ)1⋅∂θ∂p(x;θ)⋅p(x;θ)dx=∫−∞∞∂θ∂p(x;θ)dx=∂θ∂∫−∞∞p(x;θ)dx=0,
所以
∂θ∂E(Sθ)=0.
另一方面,
∂θ∂E(Sθ)=∂θ∂∫−∞∞Sθp(x;θ)dx=∫−∞∞∂θ∂(Sθp(x;θ))dx=∫−∞∞(∂θ∂Sθ⋅p(x;θ)+Sθ⋅∂θ∂p(x;θ))dx=∫−∞∞∂θ2∂2lnp(x;θ)⋅p(x;θ)dx+∫−∞∞(∂θ∂lnp(x;θ))2p(x;θ)dx=E(∂θ2∂2lnp(x;θ))+E(Sθ2)=E(∂θ2∂2lnp(x;θ))+I(θ).
这就证明了
I(θ)=−E(∂θ2∂2lnp(x;θ)).
设总体密度函数为
p(x;θ)=θxθ−1,0<x<1, θ>0,
x1,x2,⋯,xn 是样本。
- 求 g(θ)=1/θ 的最大似然估计;
- 求 g(θ) 的有效估计。
解
**(1)**似然函数为
L(θ)=i=1∏nθxiθ−1,
对数似然函数为
lnL(θ)=nlnθ+(θ−1)i=1∑nlnxi=−nlng(θ)+(g(θ)1−1)i=1∑nlnxi.
将对数似然函数求导并令其为 0,得似然方程
∂g(θ)∂lnL(θ)=−g(θ)n−g2(θ)1i=1∑nlnxi=0.
解之得
g^(θ)=−n1i=1∑nlnxi.
**(2)**令 Y=−lnX,则
P(Y<y)=P(−lnX<y)=P(X>e−y)=∫e−y1θxθ−1dx=1−e−θy,
因此
Y∼Exp(θ)=Ga(1,θ),
从而有
g^(θ)∼Ga(n,nθ).
于是
E(g^)=nθn=θ1=g(θ),Var(g^)=(nθ)2n=nθ21.
为求有效估计,需求出 θ 的费希尔信息量。注意到
lnp(x;θ)=lnθ+(θ−1)lnx,
∂θ∂lnp(x;θ)=θ1+lnx,∂θ2∂2lnp(x;θ)=−θ21,
于是
I(θ)=−E(∂θ2∂2lnp(x;θ))=θ21.
而
g′(θ)=−θ−2,
于是 g(θ) 的任一无偏估计的 C-R 下界为
nI(θ)[g′(θ)]2=nθ21.
从而 g^(θ)=−n1∑i=1nlnxi 是 g(θ) 的无偏估计,且方差达到了 C-R 下界,所以 g^(θ)=−n1∑i=1nlnxi 是 g(θ) 的有效估计。
设总体密度函数为
p(x;θ)=x32θe−θ/x2,x>0, θ>0,
求 θ 的费希尔信息量 I(θ)。
解
对数密度函数为
lnp(x;θ)=ln2+lnθ−3lnx−θ/x2,
于是
∂θ∂lnp(x;θ)=θ1−x21,∂θ2∂2lnp(x;θ)=−θ21,
由此给出
I(θ)=−E(∂θ2∂2lnp(x;θ))=θ21.
设总体密度函数为
p(x;θ)=θcθx−(θ+1),x>c, c>0 已知, θ>0,
求 θ 的费希尔信息量 I(θ)。
解
对数密度函数为
lnp(x;θ)=lnθ+θlnc−(θ+1)lnx,
将上式对 θ 求导,得到
∂θ∂lnp(x;θ)=θ1+lnc−lnx,
二阶导函数为
∂θ2∂2lnp(x;θ)=−θ21,
于是
I(θ)=−E(∂θ2∂2lnp(x;θ))=θ21.
设总体分布列为
P(X=x)=(x−1)θ2(1−θ)x−2,x=2,3,⋯, 0<θ<1,
求 θ 的费希尔信息量 I(θ)。
解
对数分布列为
lnP(X=x)=ln(x−1)+2lnθ+(x−2)ln(1−θ).
求一、二阶导数,有
∂θ∂lnP(X=x)=θ2−1−θx−2,∂θ2∂2lnP(X=x)=−θ22−(1−θ)2x−2.
在本章 6.2 节第 3 题中,我们已经算得
E(x)=θ2,
于是
I(θ)=−E(∂θ2∂2lnP(X=x))=θ22+(1−θ)2E(x)−2=θ2(1−θ)2.
设 x1,x2,⋯,xn 是来自 Ga(α,λ) 的样本,α>0 已知,试证明 xˉ/α 是 g(λ)=1/λ 的有效估计,从而也是 UMVUE。
解
总体 Ga(α,λ) 的密度函数为
p(x;λ)=Γ(α)λαxα−1e−λx,x>0,
于是
lnp(x;λ)=αlnλ−lnΓ(α)+(α−1)lnx−λx,
∂λ∂lnp(x;λ)=λα−x,∂λ2∂2lnp(x;λ)=−λ2α.
所以 λ 的费希尔信息量为
I(λ)=λ2α,
这就是说 g(λ)=λ1 的任一无偏估计的 C-R 下界为
nI(λ)[g′(λ)]2=nαλ21.
又
E(αxˉ)=α1⋅λα=λ1,Var(αxˉ)=α21⋅n1⋅λ2α=nαλ21.
这就证明了 xˉ/α 是 g(λ)=1/λ 的有效估计,从而也是 UMVUE。
设 x1,x2,⋯,xm i.i.d.∼N(a,σ2),y1,y2,⋯,yn i.i.d.∼N(a,2σ2),求 a 和 σ2 的 UMVUE。
解
直观上,可考虑 xˉ 和 yˉ 的凸线性组合
a^l=lxˉ+(1−l)yˉ,
易知 a^l 为 a 的无偏估计,且当
l=2m+n2m
时,Var(a^l) 达到最小。下证
a^=2m+n2mxˉ+nyˉ
为 a 的 UMVUE。
(x1,x2,⋯,xm,y1,y2,⋯,yn) 的联合密度函数为
p(x1,⋯,xm,y1,⋯,yn,a,σ2)=(2πσ1)m+n2−2nexp{−i=1∑m2σ2(xi−a)2−i=1∑n4σ2(yi−a)2}=(2πσ1)m+n2−2nexp{−2σ21(i=1∑mxi2+21i=1∑nyi2)+σ2mxˉ+21nyˉa−2σ2m+21na2}.
设 φ(x1,⋯,xm,y1,⋯,yn) 是 0 的任一无偏估计,则
E(φ)=∫−∞∞⋯∫−∞∞φ⋅p(x1,⋯,xm,y1,⋯,yn,a,σ2)dx1⋯dxmdy1⋯dyn=0,
即
∫−∞∞⋯∫−∞∞φ⋅(2πσ1)m+n2−2nexp{−2σ21(i=1∑mxi2+21i=1∑nyi2)+σ2mxˉ+21nyˉa−2σ2m+21na2}dx1⋯dxmdy1⋯dyn=0.(1)
将 ① 式两端对 a 求导,并注意到 E(φ)=0,有
∫−∞∞⋯∫−∞∞σ2mxˉ+21nyˉφ⋅(2πσ1)m+n2−2nexp{−2σ21(i=1∑mxi2+21i=1∑nyi2)+σ2mxˉ+21nyˉa−2σ2m+21na2}dx1⋯dxmdy1⋯dyn=0.(2)
这说明
E(σ2mxˉ+21nyˉφ)=0,
即
E((mxˉ+21nyˉ)φ)=0.
于是
Cov(mxˉ+21nyˉ,φ)=E((mxˉ+21nyˉ)φ)−E(mxˉ+21nyˉ)E(φ)=0,
从而
a^=2m+n2mxˉ+nyˉ
是 a 的 UMVUE。
我们将 ② 式的两端再对 a 求导,得
∫−∞∞⋯∫−∞∞(σ4(mxˉ+21nyˉ)2−(m+21n)σ21σ2mxˉ+21nyˉa)φ⋅(2πσ1)m+n2−2n×exp{−2σ21(i=1∑mxi2+21i=1∑nyi2)+σ2mxˉ+21nyˉa−2σ2m+21na2}dx1⋯dxmdy1⋯dyn=0.
由此可以得到
E((mxˉ+21nyˉ)2φ)=0.
下一步,将 ① 式两端对 σ2 求导,略去几个前面已经指出积分为 0 的项,有
∫−∞∞⋯∫−∞∞(i=1∑mxi2+21i=1∑nyi2)φ⋅(2πσ1)m+n2−2nexp{−2σ21(i=1∑mxi2+21i=1∑nyi2)+σ2mxˉ+21nyˉa−2σ2m+21na2}dx1⋯dxmdy1⋯dyn=0.
这表明
E[φ⋅(i=1∑mxi2+21i=1∑nyi2)]=0.
记
T=i=1∑mxi2+21i=1∑nyi2−m+21n(mxˉ+21nyˉ)2,
由此可得到 E(Tφ)=0,因而 Cov(T,φ)=0。
由于
E(i=1∑mxi2+21i=1∑nyi2)=(m+21n)a2+(m+n)σ2,
E(mxˉ+21nyˉ)2=(m+21n)2a2+(m+21n)σ2,
所以,
E(T)=(m+21n)a2+(m+n)σ2−(m+21n)a2−σ2=(m+n−1)σ2,
故
(m+n−1)−1T
是 σ2 的 UMVUE。
注意,这里 σ2 的估计不能是 sx2 和 sy2 的凸组合,为什么?留给读者思考。
设 x1,x2,⋯,xn i.i.d.∼N(μ,1),求 μ2 的 UMVUE。证明此 UMVUE 达不到 C-R 不等式的下界,即它不是有效估计。
解
设 φ(x1,x2,⋯,xn) 是 0 的任一无偏估计,则
E(φ)=∫−∞∞⋯∫−∞∞φ⋅i=1∏n2π1exp{−2(xi−μ)2}dx1⋯dxn=0,
即
∫−∞∞⋯∫−∞∞φ⋅(2π)−2nexp{−21i=1∑nxi2+nxˉμ−2nμ2}dx1⋯dxn=0.(1)
将 ① 式两端对 μ 求导,并注意到 E(φ)=0,有
∫−∞∞⋯∫−∞∞nxˉφ⋅(2π)−2nexp{−21i=1∑nxi2+nxˉμ−2nμ2}dx1⋯dxn=0.(2)
这说明 E(nxˉφ)=0,即 E(xˉφ)=0。
我们将 ② 式的两端再对 μ 求导,得
∫−∞∞⋯∫−∞∞(nxˉ)2φ⋅(2π)−2nexp{−21i=1∑nxi2+nxˉμ−2nμ2}dx1⋯dxn
−∫−∞∞⋯∫−∞∞nxˉ⋅nμφ⋅(2π)−2nexp{−21i=1∑nxi2+nxˉμ−2nμ2}dx1⋯dxn=0,
由此可以得到
E(xˉ2φ)=0.
记
T=xˉ2−n1,
则
Cov(T,φ)=0,E(T)=μ2,
从而
T=xˉ2−n1
为 μ2 的 UMVUE。
进一步,
Var(T)=Var(xˉ2)=n22+n4μ2,
C-R 下界为
nI(μ)4μ2=n4μ2.
故此 UMVUE 的方差还达不到 C-R 不等式的下界。
对泊松分布 P(θ),
- 求 I(θ1);
- 找一个函数 g(⋅),使 g(θ) 的费希尔信息量与 θ 无关。
解
(1)
I(θ1)=I(θ)(d(1/θ)dθ)2=θ4I(θ)=θ3.
(2)
I(g(θ))=I(θ)(dg(θ)dθ)2.
令
I(g(θ))=c
(其中 c 为大于 0 的任意常数),则
dg(θ)dθ=cθ.
所以,
g(θ)=c2θ+c2
(其中 c2 为任意常数)。
设 x1,x2,⋯,xn 为独立同分布变量,0<θ<1,
P(x1=−1)=21−θ,P(x1=0)=21,P(x1=1)=2θ.
- 求 θ 的 MLE θ^1,并问 θ^1 是否是无偏的;
- 求 θ 的矩估计 θ^2;
- 计算 θ 的无偏估计的方差的 C-R 下界。
解
**(1)**方法一 设 x1,x2,⋯,xn 中取值 −1,0,1 分别有 n−1,n0,n1 次,有 n−1+n0+n1=n,则似然函数
L(θ)=(21−θ)n−1(21)n0(2θ)n1=2n(1−θ)n−1θn1,
有
lnL(θ)=n−1ln(1−θ)+n1lnθ−nln2,
令
dθdlnL(θ)=n−1⋅1−θ−1+n1⋅θ1=0,
得
θ=n−1+n1n1,
故 θ 的 MLE θ^1=n−1+n1n1。
方法二 总体 X 的密度函数为
p(x;θ)=(21−θ)2x(x−1)(21)−(x+1)(x−1)(2θ)2x(x+1)=21(1−θ)2x2−xθ2x2+x,x=−1,0,1,
则似然函数
L(θ)=i=1∏n21(1−θ)2xi2−xiθ2xi2+xi=2n1(1−θ)21(∑i=1nxi2−∑i=1nxi)θ21(∑i=1nxi2+∑i=1nxi),
有
lnL(θ)=21(i=1∑nxi2−i=1∑nxi)ln(1−θ)+21(i=1∑nxi2+i=1∑nxi)lnθ−nln2,
令
dθdlnL(θ)=21(i=1∑nxi2−i=1∑nxi)1−θ−1+21(i=1∑nxi2+i=1∑nxi)θ1=0,
得
θ=2∑i=1nxi2∑i=1nxi2+∑i=1nxi=21+2∑i=1nxi2∑i=1nxi,
故 θ 的 MLE
θ^1=21+2∑i=1nXi2∑i=1nXi.
注:因 Xi 全部可能取值 −1,0,1,有
i=1∑nXi2=n−1+n1,i=1∑nXi=n1−n−1,
即以上两个结果一致。
因
E(θ^1)=E(n−1+n1n1)=E[E(n−1+n1n1n−1+n1)],
且
P(x1=1∣x1=−1 或 x1=1)=P(x1=−1 或 x1=1)P(x1=1)=(1−θ)/2+θ/2θ/2=θ,
则在 n−1+n1=m 的条件下,n1 服从二项分布 b(m,θ),E(n1∣n−1+n1=m)=mθ,
可得
E(n−1+n1n1n−1+n1)=θ,
即
E(θ^1)=E[E(n−1+n1n1n−1+n1)]=E(θ)=θ.
θ^1 是 θ 的无偏估计。
**(2)**因为
E(x1)=−1×21−θ+0×21+1×2θ=θ−21,
所以 θ 的矩估计为
θ^2=xˉ+21.
(3)
lnp(x;θ)=21(x2−x)ln(21−θ)−(1−x2)ln2+21(x2+x)ln(2θ),
关于 θ 求导,得
dθdlnp(x;θ)=−21(x2−x)1−θ1+21(x2+x)θ1,
I(θ)=E(dθdlnp(x;θ))2=(−1−θ1)221−θ+0×21+(θ1)22θ=21(1−θ1+θ1)=2θ(1−θ)1.
所以,θ 的无偏估计的方差的 C-R 下界为
n2θ(1−θ).
设总体 X∼Exp(1/θ),x1,x2,⋯,xn 是样本,θ 的矩估计和最大似然估计都是 xˉ,它也是 θ 的相合估计和无偏估计,试证明在均方误差准则下存在优于 xˉ 的估计(提示:考虑 θ^a=axˉ,找均方误差最小者)。
解
令
θ^a=axˉ,
则
MSE(θ^a)=Var(θ^a)+(Eθ^a−θ)2=a2Var(xˉ)+(aE(xˉ)−θ)2=a2nθ2+θ2(a−1)2.
对上式求导易知,当
a=n+1n
时上式达到最小,最小值为
n+1θ2,
它小于 xˉ 的均方误差
nθ2.
补充习题及解答
设 x1,x2,⋯,xn 独立同分布,x1 的取值有四种可能,其概率分别为
p1=1−θ, p2=θ−θ2, p3=θ2−θ3, p4=θ3,
记 Nj 为 x1,x2,⋯,xn 中出现各种可能结果的次数,N1+N2+N3+N4=n。
- 确定 a1,a2,a3,a4,使 T=∑i=14aiNi 为 θ 的无偏估计;
- 将 Var(T) 与 θ 的无偏估计方差的 C-R 下界比较。
解
**(1)**由于 Ni∼b(n,pi),i=1,2,3,4,所以 E(Ni)=npi,从而有
E(T)=j=1∑4ajE(Nj)=a1n(1−θ)+a2n(θ−θ2)+a3n(θ2−θ3)+a4nθ3=na1+n(a2−a1)θ+n(a3−a2)θ2+n(a4−a3)θ3.
若使 T 为 θ 的无偏估计,即要求
⎩⎨⎧na1=0,n(a2−a1)=1,n(a3−a2)=0,n(a4−a3)=0,
解之得
a1=0,a2=a3=a4=n1.
即
T=nN2+N3+N4
是 θ 的无偏估计。
(2)
P(Nj=nj,j=1,2,3,4)=n1!n2!n3!n4!n!(1−θ)n1(θ−θ2)n2(θ2−θ3)n3(θ3)n4
=n1!n2!n3!n4!n!θn2+2n3+3n4(1−θ)n1+n2+n3,
对数似然函数为(略去与 θ 无关的项)
lnL=(n2+2n3+3n4)lnθ+(n1+n2+n3)ln(1−θ).
于是
∂θ∂lnL=θn2+2n3+3n4−1−θn1+n2+n3,
∂θ2∂2lnL=−θ2n2+2n3+3n4−(1−θ)2n1+n2+n3.
注意到观测量 n1,n2,n3,n4 是随机变量,且 E(nj)=npj,故
E(n2+2n3+3n4)=n((θ−θ2)+2(θ2−θ3)+3θ3)=n(θ+θ2+θ3),
E(n1+n2+n3)=n((1−θ)+(θ−θ2)+(θ2−θ3))=n(1−θ3).
从而费希尔信息量为
I(θ)=−E(∂θ2∂2lnL)=θ2n(θ+θ2+θ3)+(1−θ)2n(1−θ3)=θ(1−θ)n(1+θ+θ2).
所以 θ 的无偏估计方差的 C-R 下界为
n(1+θ+θ2)θ(1−θ).
由于
N2+N3+N4=n−N1∼b(n,θ),
于是
Var(T)=n21Var(N2+N3+N4)=nθ(1−θ)n(1+θ+θ2)θ(1−θ),
即 T 的方差没有达到 θ 的无偏估计方差的 C-R 下界。
设 x1,x2,⋯,xn 是来自正态总体 N(μ,σ2) 的一个样本,若均值 μ 已知,证明:
- σ^2=n1∑i=1n(xi−μ)2 是 σ2 的有效估计;
- σ^=n12π∑i=1n∣xi−μ∣ 是 σ 的无偏估计,但不是有效估计。
解
**(1)**由
σ2nσ^2∼χ2(n)
知 E(σ^2)=σ2,
Var(σ^2)=n2σ4.
为了获得 σ2 的无偏估计的 C-R 下界,需要费希尔信息量。正态分布 N(μ,σ2) 的密度函数 p(x) 的对数是
lnp(x)=−21ln2π−21lnσ2−2σ2(x−μ)2,
∂σ2∂lnp(x)=−2σ21+2σ4(x−μ)2=2σ41[(x−μ)2−σ2].
由此得 σ2 的费希尔信息量
I(σ2)=E[∂σ2∂lnp(x)]2=4σ81[E(x−μ)4−2σ2E(x−μ)2+σ4]=4σ81[3σ4−2σ4+σ4]=2σ41.
从而 σ2 的无偏估计的 C-R 下界为
[nI(σ2)]−1=[2σ4n]−1=n2σ4,
此下界与上述 σ^2 无偏估计的方差相等,故此 σ^2 是 σ2 的有效估计。
**(2)**由于
E(∣xi−μ∣)=2πσ1∫−∞∞∣x−μ∣e−2σ2(x−μ)2dx=2π2σ∫0∞ye−y2/2dy=π2σ.
可见,
E(σ^)=σ,
即 σ^ 是 σ 的无偏估计,其方差为
Var(σ^)=2n2πi=1∑nVar(∣xi−μ∣)=2nπ[E(xi−μ)2−(E∣xi−μ∣)2]=2nπ(σ2−π2σ2)=2nπ−2σ2.
为了获得 σ 的无偏估计的 C-R 下界,需要知道 σ 的费希尔信息量。由于
∂σ∂lnp(x)=−σ1+σ3(x−μ)2=σ31[(x−μ)2−σ2],
I(σ)=E(∂σ∂lnp(x))2=σ61[E(x−μ)4−2σ2E(x−μ)2+σ4]=σ61[3σ4−2σ4+σ4]=σ22.
从而 σ 的无偏估计的 C-R 下界为
[nI(σ)]−1=[σ22n]−1=2nσ2,
由于无偏估计 σ^ 的方差
2nπ−2σ2>2nσ2,
故 σ^ 不是 σ 的有效估计。此处,σ 的无偏估计的 C-R 下界与 σ^ 方差的比为
(π−2)σ2/(2n)σ2/(2n)=π−21=0.876,
该比值常称为无偏估计 σ^ 的效。
证明:若 T1 与 T2 是未知参数 g(θ) 的两个 UMVUE,则 T1=T2 依概率几乎处处成立。这个命题表明:g(θ) 的 UMVUE 在几乎处处的意义下是唯一的。
解
首先指出 T1−T2 是 0 的无偏估计,则由教材中定理 6.4.1 知
Cov(Ti,T1−T2)=E[Ti(T1−T2)]=0,i=1,2,
于是
E((T1−T2)2)=E(T12+T22−2T1T2)=E[T1(T1−T2)]+E[T2(T2−T1)]=0,
由此立即可得 (T1−T2)2=0,即 T1=T2,几乎处处成立。
设 x1,x2,⋯,xn 是来自正态总体 N(μ,σ2) 的一个样本,对 σ2 考虑如下三个估计:
σ^12=n−11i=1∑n(xi−xˉ)2,σ^22=n1i=1∑n(xi−xˉ)2,σ^32=n+11i=1∑n(xi−xˉ)2.
- 哪一个是 σ2 的无偏估计?
- 哪一个均方误差最小?
解
**(1)**由于
σ21i=1∑n(xi−xˉ)2∼χ2(n−1),
故有
E[i=1∑n(xi−xˉ)2]=(n−1)σ2,
从而
E(σ^12)=σ2,E(σ^22)=nn−1σ2,E(σ^32)=n+1n−1σ2.
这说明仅有 σ^12 是 σ2 的无偏估计,而 σ^22 与 σ^32 是 σ2 的有偏估计。
**(2)**我们知道,估计的均方误差是估计的方差加上偏差的平方,即
E(σ^2−σ2)2=Var(σ^2)+(E(σ^2)−σ2)2.
而
Var(i=1∑n(xi−xˉ)2)=2(n−1)σ4,
这给出
Var(σ^12)=n−12σ4,Var(σ^22)=n22(n−1)σ4,Var(σ^32)=(n+1)22(n−1)σ4.
于是
MSE(σ^12)=Var(σ^12)=n−12σ4,
MSE(σ^22)=n22(n−1)σ4+(nn−1σ2−σ2)2=n22n−1σ4,
MSE(σ^32)=(n+1)22(n−1)σ4+(n+1n−1σ2−σ2)2=n+12σ4.
显然
n−12>n+12,n22n−1>n+12(n>1),
所以 σ^32 的均方误差最小。
注意,这里 σ^32 是 σ2 的有偏估计,上述结论表明,在均方误差意义下,有时有偏估计要比无偏估计更为优。
事实上,我们还可讨论 σ2 的估计类
σ^l2=l∑(xi−xˉ)2
中的均方误差的最小性问题。易知
MSE(σ^l2)=(E(σ^l2)−σ2)2+Var(σ^l2)=((n−1)l−1)2σ4+2(n−1)l2σ4.
不难求出当
l=n+11
时,上式达到最小。所以,在形如 σ^l2 的估计类中,上述 σ^32 均方误差最小。
设 x1,x2 独立同分布,其共同的密度函数为
p(x;θ)=θ33x2,0<x<θ, θ>0.
- 证明:T1=32(x1+x2) 和 T2=67max{x1,x2} 都是 θ 的无偏估计;
- 计算 T1 和 T2 的均方误差并进行比较;
- 证明:在均方误差意义下,在形如 Tc=cmax{x1,x2} 的估计中,T8/7 最优。
解
**(1)**先计算总体均值为
E(X)=∫0θx⋅θ33x2dx=43θ,
故
E(T1)=32⋅2E(X)=θ,
这说明 T1 是 θ 的无偏估计。又总体分布函数
F(x;θ)=∫0xθ33u2du=(θx)3,0<x<θ,
记
Y=max{x1,x2},
则 Y 的密度函数为
f(y;θ)=2F(y;θ)p(y;θ)=θ66y5,0<y<θ.
于是有
E(T2)=67E(Y)=67∫0θy⋅θ66y5dy=67⋅76θ=θ.
这表明 T2 也是 θ 的无偏估计。
**(2)**无偏估计的方差就是均方误差。由于
E(x12)=∫0θx2⋅θ33x2dx=53θ2,
Var(x1)=E(x12)−(E(x1))2=53θ2−(43θ)2=803θ2,
故有
MSE(T1)=Var(T1)=94⋅2Var(x1)=98⋅803θ2=301θ2.
又
E(Y2)=∫0θy2⋅θ66y5dy=43θ2,
Var(Y)=E(Y2)−(E(Y))2=43θ2−(76θ)2=1963θ2,
从而
MSE(T2)=Var(T2)=3649⋅1963θ2=481θ2.
由于 MSE(T1)>MSE(T2),因此在均方误差意义下,T2 优于 T1。
**(3)**对形如
Tc=cmax{x1,x2}
的估计有
E(Tc)=76cθ,E(Tc2)=43c2θ2,
故
MSE(Tc)=E(Tc−θ)2=E(Tc2)−2θE(Tc)+θ2=(43c2−712c+1)θ2.
因此当
c=3/212/7=78
时,上述均方误差最小。所以在均方误差意义下,在形如 Tc=cmax{x1,x2} 的估计中,T8/7 最优。
评论
支持 Markdown 和 LaTeX 数学公式。