§6.1 点估计的概念与无偏性
依赖于
被以下题目直接调用
正文部分
§6.1 点估计的概念与无偏性
1. 统计中的参数常指以下几种情况
- 分布中所含的未知参数 θ 及其某个函数 g(θ);
- 分布的各种特征数,如期望、方差、中位数等。
参数 θ 可能取值的范围 Θ 称为参数空间。
2. 参数估计的两种形式:点估计与区间估计
参数的点估计是指:对未知参数 θ 选用一个统计量
θ^=θ^(x1,x2,…,xn)
的取值作为 θ 的估计值,θ^ 就是 θ 的点估计(量),简称估计。好的点估计来自好的统计思想。区间估计见 §6.6。
3. 无偏性与可估参数
设
θ^=θ^(x1,x2,…,xn)
是 θ 的一个估计,θ 的参数空间为 Θ,若对任意的 θ∈Θ,有
E(θ^)=θ,
则称 θ^ 是 θ 的无偏估计,否则称为有偏估计。
假如对任意 θ∈Θ,有
n→∞limE(θ^)=θ,
则称 θ^ 是 θ 的渐近无偏估计。
并不是所有的参数都存在无偏估计,当参数存在无偏估计时称该参数是可估的。
4. 有效性
设 θ^1,θ^2 是 θ 的两个无偏估计,如果对任意的 θ∈Θ 有
Var(θ^1)≤Var(θ^2),
且至少有一个 θ∈Θ 使得上述不等号严格成立,则称 θ^1 比 θ^2 有效。
习题与解答 6.1
设 x1,x2,x3 是取自某总体的一个容量为 3 的样本,试证下列统计量都是该总体均值 μ 的无偏估计,并在方差存在时指出哪一个估计的有效性最差。
(1) μ^1=21x1+31x2+61x3;
(2) μ^2=31x1+31x2+31x3;
(3) μ^3=61x1+61x2+32x3.
解
先求三个统计量的数学期望,
E(μ^1)=21E(x1)+31E(x2)+61E(x3)=21μ+31μ+61μ=μ,
E(μ^2)=31E(x1)+31E(x2)+31E(x3)=31μ+31μ+31μ=μ,
E(μ^3)=61E(x1)+61E(x2)+32E(x3)=61μ+61μ+32μ=μ.
这说明它们都是总体均值 μ 的无偏估计,下面求它们的方差,不妨设总体的方差为 σ2,则
Var(μ^1)=41Var(x1)+91Var(x2)+361Var(x3)=187σ2,
Var(μ^2)=91Var(x1)+91Var(x2)+91Var(x3)=31σ2,
Var(μ^3)=361Var(x1)+361Var(x2)+94Var(x3)=21σ2.
不难看出
Var(μ^2)<Var(μ^1)<Var(μ^3),
从而 μ^3 的有效性最差。
由此可猜测,当用样本的凸组合
i=1∑naixi
估计总体均值时,样本均值 xˉ 是最有效的。
设 x1,x2,…,xn 是来自 Exp(λ) 的样本,已知 xˉ 为 1/λ 的无偏估计,试说明 1/xˉ 是否为 λ 的无偏估计。
解
因为 x1,x2,…,xn i.i.d. ∼Exp(λ),所以
y=i=1∑nxi∼Ga(n,λ),
相应的密度函数为
p(y;n,λ)=Γ(n)λnyn−1e−λy,y>0.
于是
E(1/y)=∫0∞Γ(n)λnyn−2e−λydy=n−1λ∫0∞Γ(n−1)λn−1yn−2e−λydy=n−1λ.
所以,
E(1/xˉ)=nλ⋅n−11=n−1nλ.
即 1/xˉ 不是 λ 的无偏估计,但它是 λ 的渐近无偏估计,经修偏,
nxˉn−1
是 λ 的无偏估计。
设 θ^ 是参数 θ 的无偏估计,且有 Var(θ^)>0,试证 (θ^)2 不是 θ2 的无偏估计。
解
由方差的定义可知,
Var(θ^)=E(θ^2)−(E(θ^))2>0.
由于 θ^ 是参数 θ 的无偏估计,即
E(θ^)=θ,
因而
E(θ^2)=Var(θ^)+(E(θ^))2=Var(θ^)+θ2>θ2,
所以 (θ^)2 不是 θ2 的无偏估计。
设总体 X∼N(μ,σ2),x1,x2,…,xn 是来自该总体的一个样本。试确定常数 c 使
ci=1∑n−1(xi+1−xi)2
为 σ2 的无偏估计。
解
由于总体 X∼N(μ,σ2),这给出
E(xi2)=σ2+μ2,E(xixi−1)=E(xi)E(xi−1)=μ2.
于是
E(i=1∑n−1(xi+1−xi)2)=E(x12+2x22+⋯+2xn−12+xn2−2x1x2−⋯−2xn−1xn)=[2(n−1)(σ2+μ2)−2(n−1)μ2]=2(n−1)σ2.
若要使
ci=1∑n−1(xi+1−xi)2
为 σ2 的无偏估计,即
cE(i=1∑n−1(xi+1−xi)2)=σ2,
这给出
c=2(n−1)1.
设 x1,x2,…,xn 是来自下列总体的样本:
p(x;θ)=⎩⎨⎧1,0,θ−21≤x≤θ+21,−∞<θ<∞,其他.
证明样本均值 xˉ 及 21(x(1)+x(n)) 都是 θ 的无偏估计,问何者更有效?
解
由总体
X∼U(θ−21,θ+21),
得
E(X)=θ,Var(X)=121.
因而
E(xˉ)=θ,
这首先说明样本均值
θ^1=xˉ
是 θ 的无偏估计,且
Var(θ^1)=12n1.
为求
θ^2=21(x(1)+x(n))
的均值与方差,注意到
Y=X−(θ−21)∼U(0,1),
令
yi=xi−(θ−21),i=1,2,…,n,
则
θ^2=21(x(1)+x(n))=21(y(1)+y(n))+θ−21.
由于
y(i)∼Be(i,n−i+1),
故
E(y(1))=n+11,E(y(n))=n+1n,
从而
E(θ^2)=21E(y(1)+y(n))+θ−21=θ.
这就证明了
21(x(1)+x(n))
是 θ 的无偏估计。又注意到(参见第五章 5.3 节习题 33)
y(n)−y(1)∼Be(n−1,2),
所以
Var(y(1))=Var(y(n))=(n+1)2(n+2)n,
Var(y(n)−y(1))=(n+1)2(n+2)2(n−1).
从而
Cov(y(1),y(n))=21[Var(y(n))+Var(y(1))−Var(y(n)−y(1))]=(n+1)2(n+2)1.
于是
Var(21(x(1)+x(n)))=41[Var(y(1))+Var(y(n))+2Cov(y(1),y(n))]=41[(n+1)2(n+2)2n+(n+1)2(n+2)2]=2(n+1)(n+2)1.
在 n>2 时,
12n1>2(n+1)(n+2)1.
这说明作为 θ 的无偏估计,在 n>2 时,
21(x(1)+x(n))
比样本均值 xˉ 有效。
事实上,这里 (x(1),x(n)) 是充分统计量,这与充分性原则是一致的。
设 x1,x2,x3 服从均匀分布 U(0,θ),试证
34x(3)
及
4x(1)
都是 θ 的无偏估计,哪个更有效?
解
由 X∼U(0,θ) 可知 x(1),x(3) 的密度函数分别为
f1(x)=3(θθ−x)2⋅θ1=θ33(θ−x)2,0<x<θ,
f3(x)=3(θx)2⋅θ1=θ33x2,0<x<θ.
从而
E(x(1))=θ33∫0θx(θ−x)2dx=4θ,E(x(3))=θ33∫0θx3dx=43θ,
故,由
E(4x(1))=θ,E(34x(3))=θ
知两者均为 θ 的无偏估计。
又可算得
E(x(1)2)=101θ2,E(x(3)2)=53θ2,
从而
Var(4x(1))=53θ2,Var(34x(3))=15θ2.
故
Var(34x(3))<Var(4x(1)),
即
34x(3)
更有效。
事实上,这里 x(3) 是充分统计量,这个结果与充分性原则是一致的。
设从均值为 μ、方差为 σ2>0 的总体中分别抽取容量为 n1 和 n2 的两个独立样本,xˉ1 和 xˉ2 分别是这两个样本的均值。试证,对于任意常数 a,b(a+b=1),
Y=axˉ1+bxˉ2
都是 μ 的无偏估计,并确定常数 a,b 使 Var(Y) 达到最小。
解
由于 xˉ1 和 xˉ2 是容量分别为 n1 和 n2 的两独立样本的均值,故
E(xˉ1)=μ,E(xˉ2)=μ,Var(xˉ1)=n1σ2,Var(xˉ2)=n2σ2.
因而
E(Y)=E(axˉ1+bxˉ2)=aE(xˉ1)+bE(xˉ2)=aμ+bμ=(a+b)μ=μ,
这证明了
Y=axˉ1+bxˉ2
是 μ 的无偏估计。
又由 a+b=1 知,
Y=axˉ1+(1−a)xˉ2,
从而
Var(Y)=n1a2σ2+n2(1−a)2σ2=σ2[(n11+n21)a2−n22a+n21].
由求导知,当
a=1/n1+1/n21/n2=n1+n2n1
时,Var(Y) 达到最小,此时
b=n1+n2n2.
这个结果表明,来自同一总体的两个容量为 n1 和 n2 的样本的合样本(样本量为 n1+n2)的均值
xˉ=n1+n2n1xˉ1+n2xˉ2
是线性无偏估计类
U={axˉ1+(1−a)xˉ2}
中方差最小的。
设总体 X 的均值为 μ,方差为 σ2,x1,x2,…,xn 是来自该总体的一个样本,T(x1,x2,…,xn) 为 μ 的任一线性无偏估计量。证明:xˉ 与 T 的相关系数为
Var(xˉ)/Var(T).
解
由于 T(x1,x2,…,xn) 为 μ 的线性无偏估计,故
T(x1,x2,…,xn)=l1x1+l2x2+⋯+lnxn,
其中
i=1∑nli=1.
于是
Cov(T,xˉ)=i=1∑nnliVar(xi)=nσ2.
而
Var(xˉ)=nσ2,
故有
Cov(T,xˉ)=Var(xˉ).
从而
Corr(T,xˉ)=Var(xˉ)Var(T)Cov(T,xˉ)=Var(xˉ)Var(T)Var(xˉ)=Var(xˉ)/Var(T).
设有 k 台仪器,已知用第 i 台仪器测量的标准差为 σi(i=1,2,…,k)。用这些仪器独立地对某一物理量 θ 各观察一次,分别得到 x1,x2,…,xk,设仪器都没有系统偏差。问 a1,a2,…,ak 应取何值,方能使
θ^=i=1∑kaixi
成为 θ 的无偏估计,且方差达到最小?
解
若要使
θ^=i=1∑kaixi
为 θ 的无偏估计,即
E(θ^)=E(i=1∑kaixi)=a1θ+a2θ+⋯+akθ=θi=1∑kai=θ,
则必须有
i=1∑kai=1.
此时,
Var(θ^)=Var(i=1∑kaixi)=a12σ12+a22σ22+⋯+ak2σk2.
因此,问题转化为在
i=1∑kai=1
的条件下,求
i=1∑kai2σi2
的极小值。
令
f(a1,a2,…,ak)=i=1∑kai2σi2−λ(i=1∑kai−1),
由
∂ai∂f=0,i=1,2,…,k,和∂λ∂f=0,
得到
⎩⎨⎧2aiσi2−λi=1∑kai=0,=1.
从第一式中可以得到
ai=2σi2λ,
代入第二式中,解出
λ=(i=1∑k2σi21)−1,
从而
ai=∑j=1k1/σj21/σi2,i=1,2,…,k.
各 1/σj2 可视作仪器精度,这表明各观测值以精度为权重是最好的;若精度都一样,则等权重最优。
设 x1,x2,…,xn 是来自 N(θ,1) 的样本,证明 g(θ)=∣θ∣ 没有无偏估计(提示:利用 g(θ) 在 θ=0 处不可导)。
解
(反证法)假设 T(x1,x2,…,xn) 为 g(θ) 的无偏估计,则
(2π1)n∫−∞∞T(x1,x2,…,xn)exp{−i=1∑n2(xi−θ)2}dx1dx2⋯dxn=∣θ∣.
由上式可知,等式的左边关于 θ 处处可导,而等式的右边在 θ=0 处不存在导数。因此,假设不成立,即 g(θ)=∣θ∣ 没有无偏估计。
设总体 X 服从正态分布 N(μ,σ2),x1,x2,…,xn 为来自总体 X 的样本,为了得到标准差 σ 的估计量,考虑统计量
γ1=n1i=1∑n∣xi−xˉ∣,xˉ=n1i=1∑nxi,n≥2,
γ2=n(n−1)1i=1∑nj=1∑n∣xi−xj∣,n≥2,
求常数 C1 与 C2,使得 C1γ1 与 C2γ2 都是 σ 的无偏估计。
解
由期望的公式及对称性,我们只需要求出
E(∣x1−xˉ∣)
和
E(∣x1−x2∣)
即
注意到
x1−xˉ∼N(0,nn−1σ2),x1−x2∼N(0,2σ2),
我们只需要求出如下期望即可完成本题:设 y∼N(0,σ2),则
E(∣y∣)=2∫0∞2πσ1ye−y2/(2σ2)dy=∫0∞2πσ1e−z/(2σ2)dz=∫0∞π2σe−tdt=π2σ.
于是有
E(∣x1−xˉ∣)=nn−1π2σ,E(∣x1−x2∣)=π2σ,
从而给出
C1=2(n−1)nπ,C2=2π.
补充习题及解答
设分别自总体 N(μ1,σ2) 和 N(μ2,σ2) 中抽取容量为 n1 和 n2 的两独立样本,其样本方差分别为 s12,s22。试证,对于任意常数 a,b(a+b=1),Z=as12+bs22 都是 σ2 的无偏估计,并确定常数 a,b 使 Var(Z) 达到最小。
解
由已知条件有
σ2(n1−1)s12∼χ2(n1−1),σ2(n2−1)s22∼χ2(n2−1),
且 s12,s22 独立,于是
E(s12)=E(s22)=σ2,
故
E(Z)=E(as12+bs22)=aE(s12)+bE(s22)=aσ2+bσ2=(a+b)σ2=σ2,
这证明了 Z=as12+bs22 是 σ2 的无偏估计。
又
Var(s12)=n1−12σ4,Var(s22)=n2−12σ4,
从而
Var(Z)=a2Var(s12)+(1−a)2Var(s22)=2[(n1−1)(n2−1)n1+n2−2a2−n2−12a+n2−11]σ4.
因而当
a=n1+n2−2n1−1
时,Var(Z) 达到最小,此时
b=n1+n2−2n2−1,
该无偏估计为
σ^2=n1+n2−2i=1∑n1(xi−xˉ)2+i=1∑n2(yi−yˉ)2.
这个结果表明,对来自方差相等(不论均值是否相等)的两个正态总体的容量为 n1 和 n2 的样本,上述 σ^2 是 σ2 的线性无偏估计类
U={as12+(1−a)s22}
中方差最小的。
设 x1,x2,⋯,xn 是取自均匀分布总体 U(θ1,θ2) 的一个样本,若分别取
θ^1=min{x1,x2,⋯,xn},θ^2=max{x1,x2,⋯,xn}
作为 θ1,θ2 的估计量,问 θ^1,θ^2 是否为 θ1,θ2 的无偏估计?如果不是,如何修正才能获得 θ1,θ2 的无偏估计?
解
令
Y=θ2−θ1X−θ1,
则 Y∼U(0,1),记 y(1),y(2),⋯,y(n) 为样本相应的次序统计量,于是有
E(y(1))=n+11,E(y(n))=n+1n,
从而
E(θ^1)=θ1+(θ2−θ1)n+11=n+1θ2+nθ1,
E(θ^2)=θ1+(θ2−θ1)n+1n=n+1nθ2+θ1.
可见 θ^1,θ^2 不是 θ1,θ2 的无偏估计。由
{nθ1+θ2θ1+nθ2=(n+1)E(x(1)),=(n+1)E(x(n)),
解之得
⎩⎨⎧θ1θ2=n−1nE(x(1))−E(x(n)),=n−1nE(x(n))−E(x(1)),
因而
θ^1=n−1nx(1)−x(n),θ^2=n−1nx(n)−x(1)
是 θ1,θ2 的无偏估计。
设 x1,x2,⋯,xn 是来自二点分布 b(1,p) 的一个样本,
- 寻求 p2 的无偏估计;
- 寻求 p(1−p) 的无偏估计;
- 证明 p1 没有无偏估计。
解
(1) xˉ2 是 p2 的一个直观估计,但不是 p2 的无偏估计,这是因为
E(xˉ2)=Var(xˉ)+[E(xˉ)]2=np(1−p)+p2=np+nn−1p2=p2,
由此可见
p2^=n−1n(xˉ2−nxˉ)
是 p2 的无偏估计。
(2) xˉ(1−xˉ)=xˉ−xˉ2 是 p(1−p) 的直观估计,但不是 p(1−p) 的无偏估计,这是因为
E(xˉ−xˉ2)=p−(np(1−p)+p2)=nn−1p(1−p)=p(1−p),
由此可见
n−1nxˉ(1−xˉ)
是 p(1−p) 的一个无偏估计。
(3) 反证法。倘若 g(x1,x2,⋯,xn) 是 p1 的无偏估计,则有
x1,x2,⋯,xn∑g(x1,x2,⋯,xn)p∑i=1nxi(1−p)n−∑i=1nxi=p1,
或者
x1,x2,⋯,xn∑g(x1,x2,⋯,xn)p∑i=1nxi+1(1−p)n−∑i=1nxi−1=0.
左端是关于 p 的 n+1 次方程,但它对每个 p∈(0,1) 都成立,这是不可能的,故上述假设不成立。因此 p1 没有无偏估计。
评论
支持 Markdown 和 LaTeX 数学公式。