§6.4 最小方差无偏估计

依赖于

无显式依赖

被以下题目直接调用

正文部分

§6.4 最小方差无偏估计

均方误差 设 $\hat{θ}$ 是 $θ$ 的一个估计（无偏的或有偏的），则称

MSE (\hat{θ}) = E (\hat{θ} - θ)^{2} = Var (\hat{θ}) + [E (\hat{θ}) - θ]^{2}

为 $\hat{θ}$ 的均方误差。均方误差较小意味着： $\hat{θ}$ 不仅方差较小，而且偏差 $E (\hat{θ}) - θ$ 也小，所以均方误差是评价点估计的一般标准。

使均方误差一致最小的估计量一般是不存在的，但两个估计的优劣可用均方误差评估；
在无偏估计类中使均方误差最小就是使方差最小。
一致最小方差无偏估计 设 $\hat{θ}$ 是 $θ$ 的一个无偏估计，如果对另外任意一个 $θ$ 的无偏估计 $\tilde{θ}$ ，在参数空间 $Θ = {θ}$ 上都有

Var_{θ} (\hat{θ}) \leq Var_{θ} (\tilde{θ}),

则称 $\hat{θ}$ 是 $θ$ 的一致最小方差无偏估计，简记为 UMVUE。

判断准则 设 $\hat{θ} = \hat{θ} (x_{1}, x_{2}, \dots, x_{n})$ 是 $θ$ 的一个无偏估计， $Var (\hat{θ}) < \infty$ 。如果对任意一个满足

E (φ (x_{1}, x_{2}, \dots, x_{n})) = 0

和

Var (φ (x_{1}, x_{2}, \dots, x_{n})) < \infty

的 $φ$ ，都有

Cov_{θ} (\hat{θ}, φ) = 0, \forall θ \in Θ,

则 $\hat{θ}$ 是 $θ$ 的 UMVUE。

充分性原则
任一参数 $θ$ 的 UMVUE 不一定存在，若存在，则它一定可表示为充分统计量的函数；
若 $θ$ 的某个无偏估计 $\hat{θ}$ 不是充分统计量 $T = T (x_{1}, x_{2}, \dots, x_{n})$ 的函数，则通过条件期望可以获得一个新的无偏估计 $\tilde{θ} = E (\hat{θ} ∣ T)$ ，且方差不超过原估计的方差；
考虑 $θ$ 的估计时，只需要在其充分统计量的函数中寻找即可，这说法对所有统计推断都是正确的，这便是充分性原则。
费希尔信息量 $I (θ)$ 设总体的概率函数 $p (x; θ)$ ， $θ \in Θ$ 满足下列条件：
参数空间 $Θ$ 是直线上的一个开区间；
支撑 $S = {x : p (x; θ) > 0}$ 与 $θ$ 无关；
导数 $\frac{\partial}{\partial θ} p (x; θ)$ 对一切 $θ \in Θ$ 都存在；
对 $p (x; θ)$ ，积分与微分运算可交换次序，即

\frac{\partial}{\partial θ} \int_{- \infty}^{\infty} p (x; θ) d x = \int_{- \infty}^{\infty} \frac{\partial}{\partial θ} p (x; θ) d x;

期望

I (θ) = E [\frac{\partial}{\partial θ} ln p (x; θ)]^{2}

存在。

则称该期望 $I (θ)$ 为总体分布的费希尔信息量。若二阶导数对一切 $θ \in Θ$ 都存在，则 $I (θ)$ 还可用下式计算：

I (θ) = - E [\frac{\partial ^{2}}{\partial θ ^{2}} ln p (x; θ)] .

常用分布的费希尔信息量
二点分布 $b (1, p)$ 的费希尔信息量 $I (p) = [p (1 - p)]^{- 1}$ ；
泊松分布 $p (λ)$ 的费希尔信息量 $I (λ) = λ^{- 1}$ ；
指数分布 $Exp (λ)$ 的费希尔信息量 $I (λ) = λ^{2}$ ；
正态分布 $N (μ, 1)$ 的费希尔信息量 $I (μ) = 1$ ；
正态分布 $N (0, σ^{2})$ 的费希尔信息量 $I (σ^{2}) = \frac{1}{2 σ ^{4}}$ ；
正态分布 $N (μ, σ^{2})$ 的费希尔信息量（信息矩阵）

I (μ, σ^{2}) = (1/ σ^{2} 0 0 1/ (2 σ^{4})) .

C-R 不等式 设 $T = T (x_{1}, x_{2}, \dots, x_{n})$ 是未知参数 $g (θ)$ 的一个无偏估计，若

g^{'} (θ) = \frac{\partial g ( θ )}{\partial θ}

存在，则在费希尔信息量 $I (θ)$ 也存在的条件下有

Var (T) \geq \frac{[ g ^{'} ( θ ) ] ^{2}}{n I ( θ )} .

上式称为克拉默—拉奥（C-R）不等式， $\frac{[ g ^{'} ( θ ) ] ^{2}}{n I ( θ )}$ 称为 $g (θ)$ 的无偏估计的方差的 C-R 下界，简称 $g (θ)$ 的 C-R 下界。特别，对 $θ$ 的无偏估计 $\hat{θ}$ ，有

Var (\hat{θ}) \geq [n I (θ)]^{- 1} .

注： $g (θ)$ 的 C-R 下界并不是对任意参数函数 $g (θ)$ 的无偏估计的方差都可达到，但能达到 C-R 下界的 $g (θ)$ 的估计 $T = T (x_{1}, x_{2}, \dots, x_{n})$ 一定是 $g (θ)$ 的 UMVUE。方差达到 C-R 下界的无偏估计称为有效估计。

习题与解答 6.4

习题 6.4-1

设总体概率函数是 $p (x; θ)$ ， $x_{1}, x_{2}, \dots, x_{n}$ 是其样本， $T = T (x_{1}, x_{2}, \dots, x_{n})$ 是 $θ$ 的充分统计量，则对 $g (θ)$ 的任何一个估计 $\overset{g}{^}$ ，令
$\tilde{g} = E (\overset{g}{^} ∣ T),$
证明：
$MSE (\tilde{g}) \leq MSE (\overset{g}{^}) .$
这说明，在均方误差准则下，人们只需要考虑基于充分统计量的估计。

解我们将均方误差作如下分解

MSE (\overset{g}{^}) = E (\overset{g}{^} - g (θ))^{2} = E (\overset{g}{^} - \tilde{g} + \tilde{g} - g (θ))^{2} = E (\overset{g}{^} - \tilde{g})^{2} + MSE (\tilde{g}) + 2 E [(\overset{g}{^} - \tilde{g}) (\tilde{g} - g (θ))] .

注意到 $\tilde{g} = E (\overset{g}{^} ∣ T)$ ，这说明

E [(\overset{g}{^} - \tilde{g}) ∣ T] = E (\overset{g}{^} ∣ T) - E [E (\overset{g}{^} ∣ T) ∣ T] = E (\overset{g}{^} ∣ T) - E (\overset{g}{^} ∣ T) = 0,

于是

E [(\overset{g}{^} - \tilde{g}) (\tilde{g} - g (θ))] = E {E [(\overset{g}{^} - \tilde{g}) (\tilde{g} - g (θ)) ∣ T]} = E {(\tilde{g} - g (θ)) E [(\overset{g}{^} - \tilde{g}) ∣ T]} = 0.

因而

MSE (\overset{g}{^}) = E (\overset{g}{^} - \tilde{g})^{2} + MSE (\tilde{g}) \geq MSE (\tilde{g}) .

习题 6.4-2

设 $T_{1}, T_{2}$ 分别是 $θ_{1}, θ_{2}$ 的 UMVUE，证明：对任意的（非零）常数 $a, b$ ， $a T_{1} + b T_{2}$ 是 $a θ_{1} + b θ_{2}$ 的 UMVUE。

解由于 $T_{1}, T_{2}$ 分别是 $θ_{1}, θ_{2}$ 的 UMVUE，故

E (T_{i}) = θ_{i}, i = 1, 2.

且对任意一个 $ϕ (x)$ ，满足 $E (ϕ) = 0$ ，由判断准则知

Cov (T_{i}, ϕ) = 0, i = 1, 2.

于是

E (a T_{1} + b T_{2}) = a θ_{1} + b θ_{2},

Cov (a T_{1} + b T_{2}, ϕ) = a Cov (T_{1}, ϕ) + b Cov (T_{2}, ϕ) = 0.

因此 $a T_{1} + b T_{2}$ 是 $a θ_{1} + b θ_{2}$ 的 UMVUE。

习题 6.4-3

设 $T$ 是 $g (θ)$ 的 UMVUE， $\overset{g}{^}$ 是 $g (θ)$ 的无偏估计，证明：若 $Var (\overset{g}{^}) < \infty$ ，则
$Cov (T, \overset{g}{^}) \geq 0.$

解因为 $T$ 是 $g (θ)$ 的 UMVUE， $\overset{g}{^}$ 是 $g (θ)$ 的无偏估计，故其差

T - \overset{g}{^}

是 $0$ 的无偏估计，即

E (T - \overset{g}{^}) = 0,

且

Var (T - \overset{g}{^}) < \infty.

由判断准则知

Cov (T, T - \overset{g}{^}) = 0,

这说明

Var (T) - Cov (T, \overset{g}{^}) = 0,

即

Cov (T, \overset{g}{^}) = Var (T) \geq 0.

习题 6.4-4

设总体 $X \sim N (μ, σ^{2})$ ， $x_{1}, x_{2}, \dots, x_{n}$ 为样本，证明，
$\overset{x}{ˉ} = \frac{1}{n} i = 1 \sum n x_{i}, s^{2} = \frac{1}{n - 1} i = 1 \sum n (x_{i} - \overset{x}{ˉ})^{2}$
分别为 $μ, σ^{2}$ 的 UMVUE。

解大家知道： $\overset{x}{ˉ}, s^{2}$ 分别是 $μ, σ^{2}$ 的无偏估计，设 $φ (x_{1}, x_{2}, \dots, x_{n})$ 是 $0$ 的任一无偏估计，则

E (φ) = \int_{- \infty}^{\infty} \dots \int_{- \infty}^{\infty} φ \cdot i = 1 \prod n \frac{1}{2 π σ} exp {- \frac{( x _{i} - μ ) ^{2}}{2 σ ^{2}}} d x_{1} \dots d x_{n} = 0,

即

\int_{- \infty}^{\infty} \dots \int_{- \infty}^{\infty} φ \cdot (2 π σ^{2})^{- n /2} exp {- \frac{1}{2 σ ^{2}} i = 1 \sum n x_{i}^{2} + \frac{n x ˉ}{σ ^{2}} μ - \frac{n μ ^{2}}{2 σ ^{2}}} d x_{1} \dots d x_{n} = 0. (1)

将 $(1)$ 式两端对 $μ$ 求导，并注意到 $E (φ) = 0$ ，有

\int_{- \infty}^{\infty} \dots \int_{- \infty}^{\infty} \frac{n x ˉ}{σ ^{2}} φ \cdot (2 π σ^{2})^{- n /2} exp {- \frac{1}{2 σ ^{2}} i = 1 \sum n x_{i}^{2} + \frac{n x ˉ}{σ ^{2}} μ - \frac{n μ ^{2}}{2 σ ^{2}}} d x_{1} \dots d x_{n} = 0. (2)

这说明

E (\frac{n x ˉ φ}{σ ^{2}}) = 0,

即

E (\overset{x}{ˉ} φ) = 0,

于是

Cov (\overset{x}{ˉ}, φ) = E (\overset{x}{ˉ} φ) - E (\overset{x}{ˉ}) E (φ) = 0,

从而 $\overset{x}{ˉ}$ 是 $μ$ 的 UMVUE。

为证明 $s^{2}$ 是 $σ^{2}$ 的 UMVUE，我们将 $(2)$ 式的两端再对 $μ$ 求导，得

\int_{- \infty}^{\infty} \dots \int_{- \infty}^{\infty} (\frac{n x ˉ}{σ ^{2}})^{2} φ \cdot (2 π σ^{2})^{- \frac{n}{2}} exp {- \frac{1}{2 σ ^{2}} i = 1 \sum n x_{i}^{2} + \frac{n x ˉ}{σ ^{2}} μ - \frac{n μ ^{2}}{2 σ ^{2}}} d x_{1} \dots d x_{n}

- \int_{- \infty}^{\infty} \dots \int_{- \infty}^{\infty} \frac{n x ˉ}{σ ^{2}} \cdot \frac{n μ}{σ ^{2}} φ \cdot (2 π σ^{2})^{- \frac{n}{2}} exp {- \frac{1}{2 σ ^{2}} i = 1 \sum n x_{i}^{2} + \frac{n x ˉ}{σ ^{2}} μ - \frac{n μ ^{2}}{2 σ ^{2}}} d x_{1} \dots d x_{n} = 0,

由此可以得到 $E (\overset{x}{ˉ}^{2} φ) = 0$ 。下一步，将 ① 式两端对 $σ^{2}$ 求导，略去几个前面已经指出积分为 $0$ 的项，有

\int_{- \infty}^{\infty} \dots \int_{- \infty}^{\infty} i = 1 \sum n x_{i}^{2} φ \cdot (2 π σ^{2})^{- \frac{n}{2}} exp {- \frac{1}{2 σ ^{2}} i = 1 \sum n x_{i}^{2} + \frac{n x ˉ}{σ ^{2}} μ - \frac{n μ ^{2}}{2 σ ^{2}}} d x_{1} \dots d x_{n} = 0.

这表明 $E (φ \sum_{i = 1}^{n} x_{i}^{2}) = 0$ ，由此可得到 $E (s^{2} φ) = 0$ ，因而

Cov (s^{2}, φ) = E (s^{2} φ) - E (s^{2}) E (φ) = 0.

这就证明了 $s^{2}$ 是 $σ^{2}$ 的 UMVUE。

习题 6.4-5

设总体 $p (x; θ)$ 的费希尔信息量存在，若二阶导数 $\frac{\partial ^{2}}{\partial θ ^{2}} p (x; θ)$ 对一切的 $θ \in Θ$ 存在，证明费希尔信息量
$I (θ) = - E (\frac{\partial ^{2}}{\partial θ ^{2}} ln p (x; θ)) .$

解记

S_{θ} = \frac{\partial ln p ( x ; θ )}{\partial θ},

则

E (S_{θ}) = \int_{- \infty}^{\infty} \frac{1}{p ( x ; θ )} \cdot \frac{\partial p ( x ; θ )}{\partial θ} \cdot p (x; θ) d x = \int_{- \infty}^{\infty} \frac{\partial p ( x ; θ )}{\partial θ} d x = \frac{\partial}{\partial θ} \int_{- \infty}^{\infty} p (x; θ) d x = 0,

所以

\frac{\partial E ( S _{θ} )}{\partial θ} = 0.

另一方面，

\frac{\partial E ( S _{θ} )}{\partial θ} = \frac{\partial}{\partial θ} \int_{- \infty}^{\infty} S_{θ} p (x; θ) d x = \int_{- \infty}^{\infty} \frac{\partial}{\partial θ} (S_{θ} p (x; θ)) d x = \int_{- \infty}^{\infty} (\frac{\partial S _{θ}}{\partial θ} \cdot p (x; θ) + S_{θ} \cdot \frac{\partial p ( x ; θ )}{\partial θ}) d x = \int_{- \infty}^{\infty} \frac{\partial ^{2} ln p ( x ; θ )}{\partial θ ^{2}} \cdot p (x; θ) d x + \int_{- \infty}^{\infty} (\frac{\partial ln p ( x ; θ )}{\partial θ})^{2} p (x; θ) d x = E (\frac{\partial ^{2} ln p ( x ; θ )}{\partial θ ^{2}}) + E (S_{θ}^{2}) = E (\frac{\partial ^{2} ln p ( x ; θ )}{\partial θ ^{2}}) + I (θ) .

这就证明了

I (θ) = - E (\frac{\partial ^{2} ln p ( x ; θ )}{\partial θ ^{2}}) .

习题 6.4-6

设总体密度函数为
$p (x; θ) = θ x^{θ - 1}, 0 < x < 1, θ > 0,$
$x_{1}, x_{2}, \dots, x_{n}$ 是样本。

求 $g (θ) = 1/ θ$ 的最大似然估计；

求 $g (θ)$ 的有效估计。

解 **（1）**似然函数为

L (θ) = i = 1 \prod n θ x_{i}^{θ - 1},

对数似然函数为

ln L (θ) = n ln θ + (θ - 1) i = 1 \sum n ln x_{i} = - n ln g (θ) + (\frac{1}{g ( θ )} - 1) i = 1 \sum n ln x_{i} .

将对数似然函数求导并令其为 $0$ ，得似然方程

\frac{\partial ln L ( θ )}{\partial g ( θ )} = - \frac{n}{g ( θ )} - \frac{1}{g ^{2} ( θ )} i = 1 \sum n ln x_{i} = 0.

解之得

\overset{g}{^} (θ) = - \frac{1}{n} i = 1 \sum n ln x_{i} .

**（2）**令 $Y = - ln X$ ，则

P (Y < y) = P (- ln X < y) = P (X > e^{- y}) = \int_{e^{- y}}^{1} θ x^{θ - 1} d x = 1 - e^{- θ y},

因此

Y \sim E x p (θ) = G a (1, θ),

从而有

\overset{g}{^} (θ) \sim G a (n, n θ) .

于是

E (\overset{g}{^}) = \frac{n}{n θ} = \frac{1}{θ} = g (θ), Var (\overset{g}{^}) = \frac{n}{( n θ ) ^{2}} = \frac{1}{n θ ^{2}} .

为求有效估计，需求出 $θ$ 的费希尔信息量。注意到

ln p (x; θ) = ln θ + (θ - 1) ln x,

\frac{\partial ln p ( x ; θ )}{\partial θ} = \frac{1}{θ} + ln x, \frac{\partial ^{2} ln p ( x ; θ )}{\partial θ ^{2}} = - \frac{1}{θ ^{2}},

于是

I (θ) = - E (\frac{\partial ^{2}}{\partial θ ^{2}} ln p (x; θ)) = \frac{1}{θ ^{2}} .

而

g^{'} (θ) = - θ^{- 2},

于是 $g (θ)$ 的任一无偏估计的 C-R 下界为

\frac{[ g ^{'} ( θ ) ] ^{2}}{n I ( θ )} = \frac{1}{n θ ^{2}} .

从而 $\overset{g}{^} (θ) = - \frac{1}{n} \sum_{i = 1}^{n} ln x_{i}$ 是 $g (θ)$ 的无偏估计，且方差达到了 C-R 下界，所以 $\overset{g}{^} (θ) = - \frac{1}{n} \sum_{i = 1}^{n} ln x_{i}$ 是 $g (θ)$ 的有效估计。

习题 6.4-7

设总体密度函数为
$p (x; θ) = \frac{2 θ}{x ^{3}} e^{- θ / x^{2}}, x > 0, θ > 0,$
求 $θ$ 的费希尔信息量 $I (θ)$ 。

解对数密度函数为

ln p (x; θ) = ln 2 + ln θ - 3 ln x - θ / x^{2},

于是

\frac{\partial ln p ( x ; θ )}{\partial θ} = \frac{1}{θ} - \frac{1}{x ^{2}}, \frac{\partial ^{2} ln p ( x ; θ )}{\partial θ ^{2}} = - \frac{1}{θ ^{2}},

由此给出

I (θ) = - E (\frac{\partial ^{2} ln p ( x ; θ )}{\partial θ ^{2}}) = \frac{1}{θ ^{2}} .

习题 6.4-8

设总体密度函数为
$p (x; θ) = θ c^{θ} x^{- (θ + 1)}, x > c, c > 0 已知, θ > 0,$
求 $θ$ 的费希尔信息量 $I (θ)$ 。

解对数密度函数为

ln p (x; θ) = ln θ + θ ln c - (θ + 1) ln x,

将上式对 $θ$ 求导，得到

\frac{\partial ln p ( x ; θ )}{\partial θ} = \frac{1}{θ} + ln c - ln x,

二阶导函数为

\frac{\partial ^{2} ln p ( x ; θ )}{\partial θ ^{2}} = - \frac{1}{θ ^{2}},

于是

I (θ) = - E (\frac{\partial ^{2} ln p ( x ; θ )}{\partial θ ^{2}}) = \frac{1}{θ ^{2}} .

习题 6.4-9

设总体分布列为
$P (X = x) = (x - 1) θ^{2} (1 - θ)^{x - 2}, x = 2, 3, \dots, 0 < θ < 1,$
求 $θ$ 的费希尔信息量 $I (θ)$ 。

解对数分布列为

ln P (X = x) = ln (x - 1) + 2 ln θ + (x - 2) ln (1 - θ) .

求一、二阶导数，有

\frac{\partial ln P ( X = x )}{\partial θ} = \frac{2}{θ} - \frac{x - 2}{1 - θ}, \frac{\partial ^{2} ln P ( X = x )}{\partial θ ^{2}} = - \frac{2}{θ ^{2}} - \frac{x - 2}{( 1 - θ ) ^{2}} .

在本章 $6.2$ 节第 $3$ 题中，我们已经算得

E (x) = \frac{2}{θ},

于是

I (θ) = - E (\frac{\partial ^{2} ln P ( X = x )}{\partial θ ^{2}}) = \frac{2}{θ ^{2}} + \frac{E ( x ) - 2}{( 1 - θ ) ^{2}} = \frac{2}{θ ^{2} ( 1 - θ )} .

习题 6.4-10

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自 $G a (α, λ)$ 的样本， $α > 0$ 已知，试证明 $\overset{x}{ˉ} / α$ 是 $g (λ) = 1/ λ$ 的有效估计，从而也是 UMVUE。

解总体 $G a (α, λ)$ 的密度函数为

p (x; λ) = \frac{λ ^{α}}{Γ ( α )} x^{α - 1} e^{- λ x}, x > 0,

于是

ln p (x; λ) = α ln λ - ln Γ (α) + (α - 1) ln x - λ x,

\frac{\partial ln p ( x ; λ )}{\partial λ} = \frac{α}{λ} - x, \frac{\partial ^{2} ln p ( x ; λ )}{\partial λ ^{2}} = - \frac{α}{λ ^{2}} .

所以 $λ$ 的费希尔信息量为

I (λ) = \frac{α}{λ ^{2}},

这就是说 $g (λ) = \frac{1}{λ}$ 的任一无偏估计的 C-R 下界为

\frac{[ g ^{'} ( λ ) ] ^{2}}{n I ( λ )} = \frac{1}{n α λ ^{2}} .

又

E (\frac{x ˉ}{α}) = \frac{1}{α} \cdot \frac{α}{λ} = \frac{1}{λ}, Var (\frac{x ˉ}{α}) = \frac{1}{α ^{2}} \cdot \frac{1}{n} \cdot \frac{α}{λ ^{2}} = \frac{1}{n α λ ^{2}} .

这就证明了 $\overset{x}{ˉ} / α$ 是 $g (λ) = 1/ λ$ 的有效估计，从而也是 UMVUE。

习题 6.4-11

设 $x_{1}, x_{2}, \dots, x_{m} i.i.d. \sim N (a, σ^{2})$ ， $y_{1}, y_{2}, \dots, y_{n} i.i.d. \sim N (a, 2 σ^{2})$ ，求 $a$ 和 $σ^{2}$ 的 UMVUE。

解直观上，可考虑 $\overset{x}{ˉ}$ 和 $\overset{y}{ˉ}$ 的凸线性组合

\overset{a}{^}_{l} = l \overset{x}{ˉ} + (1 - l) \overset{y}{ˉ},

易知 $\overset{a}{^}_{l}$ 为 $a$ 的无偏估计，且当

l = \frac{2 m}{2 m + n}

时， $Var (\overset{a}{^}_{l})$ 达到最小。下证

\overset{a}{^} = \frac{2 m x ˉ + n y ˉ}{2 m + n}

为 $a$ 的 UMVUE。

$(x_{1}, x_{2}, \dots, x_{m}, y_{1}, y_{2}, \dots, y_{n})$ 的联合密度函数为

p (x_{1}, \dots, x_{m}, y_{1}, \dots, y_{n}, a, σ^{2}) = (\frac{1}{2 π σ})^{m + n} 2^{- \frac{n}{2}} exp {- i = 1 \sum m \frac{( x _{i} - a ) ^{2}}{2 σ ^{2}} - i = 1 \sum n \frac{( y _{i} - a ) ^{2}}{4 σ ^{2}}} = (\frac{1}{2 π σ})^{m + n} 2^{- \frac{n}{2}} exp {- \frac{1}{2 σ ^{2}} (i = 1 \sum m x_{i}^{2} + \frac{1}{2} i = 1 \sum n y_{i}^{2}) + \frac{m x ˉ + \frac{1}{2} n y ˉ}{σ ^{2}} a - \frac{m + \frac{1}{2} n}{2 σ ^{2}} a^{2}} .

设 $φ (x_{1}, \dots, x_{m}, y_{1}, \dots, y_{n})$ 是 $0$ 的任一无偏估计，则

E (φ) = \int_{- \infty}^{\infty} \dots \int_{- \infty}^{\infty} φ \cdot p (x_{1}, \dots, x_{m}, y_{1}, \dots, y_{n}, a, σ^{2}) d x_{1} \dots d x_{m} d y_{1} \dots d y_{n} = 0,

即

\int_{- \infty}^{\infty} \dots \int_{- \infty}^{\infty} φ \cdot (\frac{1}{2 π σ})^{m + n} 2^{- \frac{n}{2}} exp {- \frac{1}{2 σ ^{2}} (i = 1 \sum m x_{i}^{2} + \frac{1}{2} i = 1 \sum n y_{i}^{2}) + \frac{m x ˉ + \frac{1}{2} n y ˉ}{σ ^{2}} a - \frac{m + \frac{1}{2} n}{2 σ ^{2}} a^{2}} d x_{1} \dots d x_{m} d y_{1} \dots d y_{n} = 0. (1)

将 ① 式两端对 $a$ 求导，并注意到 $E (φ) = 0$ ，有

\int_{- \infty}^{\infty} \dots \int_{- \infty}^{\infty} \frac{m x ˉ + \frac{1}{2} n y ˉ}{σ ^{2}} φ \cdot (\frac{1}{2 π σ})^{m + n} 2^{- \frac{n}{2}} exp {- \frac{1}{2 σ ^{2}} (i = 1 \sum m x_{i}^{2} + \frac{1}{2} i = 1 \sum n y_{i}^{2}) + \frac{m x ˉ + \frac{1}{2} n y ˉ}{σ ^{2}} a - \frac{m + \frac{1}{2} n}{2 σ ^{2}} a^{2}} d x_{1} \dots d x_{m} d y_{1} \dots d y_{n} = 0. (2)

这说明

E (\frac{m x ˉ + \frac{1}{2} n y ˉ}{σ ^{2}} φ) = 0,

即

E ((m \overset{x}{ˉ} + \frac{1}{2} n \overset{y}{ˉ}) φ) = 0.

于是

Cov (m \overset{x}{ˉ} + \frac{1}{2} n \overset{y}{ˉ}, φ) = E ((m \overset{x}{ˉ} + \frac{1}{2} n \overset{y}{ˉ}) φ) - E (m \overset{x}{ˉ} + \frac{1}{2} n \overset{y}{ˉ}) E (φ) = 0,

从而

\overset{a}{^} = \frac{2 m x ˉ + n y ˉ}{2 m + n}

是 $a$ 的 UMVUE。

我们将 ② 式的两端再对 $a$ 求导，得

\int_{- \infty}^{\infty} \dots \int_{- \infty}^{\infty} (\frac{( m x ˉ + \frac{1}{2} n y ˉ ) ^{2}}{σ ^{4}} - (m + \frac{1}{2} n) \frac{1}{σ ^{2}} \frac{m x ˉ + \frac{1}{2} n y ˉ}{σ ^{2}} a) φ \cdot (\frac{1}{2 π σ})^{m + n} 2^{- \frac{n}{2}} \times exp {- \frac{1}{2 σ ^{2}} (i = 1 \sum m x_{i}^{2} + \frac{1}{2} i = 1 \sum n y_{i}^{2}) + \frac{m x ˉ + \frac{1}{2} n y ˉ}{σ ^{2}} a - \frac{m + \frac{1}{2} n}{2 σ ^{2}} a^{2}} d x_{1} \dots d x_{m} d y_{1} \dots d y_{n} = 0.

由此可以得到

E ((m \overset{x}{ˉ} + \frac{1}{2} n \overset{y}{ˉ})^{2} φ) = 0.

下一步，将 ① 式两端对 $σ^{2}$ 求导，略去几个前面已经指出积分为 $0$ 的项，有

\int_{- \infty}^{\infty} \dots \int_{- \infty}^{\infty} (i = 1 \sum m x_{i}^{2} + \frac{1}{2} i = 1 \sum n y_{i}^{2}) φ \cdot (\frac{1}{2 π σ})^{m + n} 2^{- \frac{n}{2}} exp {- \frac{1}{2 σ ^{2}} (i = 1 \sum m x_{i}^{2} + \frac{1}{2} i = 1 \sum n y_{i}^{2}) + \frac{m x ˉ + \frac{1}{2} n y ˉ}{σ ^{2}} a - \frac{m + \frac{1}{2} n}{2 σ ^{2}} a^{2}} d x_{1} \dots d x_{m} d y_{1} \dots d y_{n} = 0.

这表明

E [φ \cdot (i = 1 \sum m x_{i}^{2} + \frac{1}{2} i = 1 \sum n y_{i}^{2})] = 0.

记

T = i = 1 \sum m x_{i}^{2} + \frac{1}{2} i = 1 \sum n y_{i}^{2} - \frac{( m x ˉ + \frac{1}{2} n y ˉ ) ^{2}}{m + \frac{1}{2} n},

由此可得到 $E (T φ) = 0$ ，因而 $Cov (T, φ) = 0$ 。

由于

E (i = 1 \sum m x_{i}^{2} + \frac{1}{2} i = 1 \sum n y_{i}^{2}) = (m + \frac{1}{2} n) a^{2} + (m + n) σ^{2},

E (m \overset{x}{ˉ} + \frac{1}{2} n \overset{y}{ˉ})^{2} = (m + \frac{1}{2} n)^{2} a^{2} + (m + \frac{1}{2} n) σ^{2},

所以，

E (T) = (m + \frac{1}{2} n) a^{2} + (m + n) σ^{2} - (m + \frac{1}{2} n) a^{2} - σ^{2} = (m + n - 1) σ^{2},

故

(m + n - 1)^{- 1} T

是 $σ^{2}$ 的 UMVUE。

注意，这里 $σ^{2}$ 的估计不能是 $s_{x}^{2}$ 和 $s_{y}^{2}$ 的凸组合，为什么？留给读者思考。

习题 6.4-12

设 $x_{1}, x_{2}, \dots, x_{n} i.i.d. \sim N (μ, 1)$ ，求 $μ^{2}$ 的 UMVUE。证明此 UMVUE 达不到 C-R 不等式的下界，即它不是有效估计。

解设 $φ (x_{1}, x_{2}, \dots, x_{n})$ 是 $0$ 的任一无偏估计，则

E (φ) = \int_{- \infty}^{\infty} \dots \int_{- \infty}^{\infty} φ \cdot i = 1 \prod n \frac{1}{2 π} exp {- \frac{( x _{i} - μ ) ^{2}}{2}} d x_{1} \dots d x_{n} = 0,

即

\int_{- \infty}^{\infty} \dots \int_{- \infty}^{\infty} φ \cdot (2 π)^{- \frac{n}{2}} exp {- \frac{1}{2} i = 1 \sum n x_{i}^{2} + n \overset{x}{ˉ} μ - \frac{n μ ^{2}}{2}} d x_{1} \dots d x_{n} = 0. (1)

将 ① 式两端对 $μ$ 求导，并注意到 $E (φ) = 0$ ，有

\int_{- \infty}^{\infty} \dots \int_{- \infty}^{\infty} n \overset{x}{ˉ} φ \cdot (2 π)^{- \frac{n}{2}} exp {- \frac{1}{2} i = 1 \sum n x_{i}^{2} + n \overset{x}{ˉ} μ - \frac{n μ ^{2}}{2}} d x_{1} \dots d x_{n} = 0. (2)

这说明 $E (n \overset{x}{ˉ} φ) = 0$ ，即 $E (\overset{x}{ˉ} φ) = 0$ 。

我们将 ② 式的两端再对 $μ$ 求导，得

\int_{- \infty}^{\infty} \dots \int_{- \infty}^{\infty} (n \overset{x}{ˉ})^{2} φ \cdot (2 π)^{- \frac{n}{2}} exp {- \frac{1}{2} i = 1 \sum n x_{i}^{2} + n \overset{x}{ˉ} μ - \frac{n μ ^{2}}{2}} d x_{1} \dots d x_{n}

- \int_{- \infty}^{\infty} \dots \int_{- \infty}^{\infty} n \overset{x}{ˉ} \cdot n μ φ \cdot (2 π)^{- \frac{n}{2}} exp {- \frac{1}{2} i = 1 \sum n x_{i}^{2} + n \overset{x}{ˉ} μ - \frac{n μ ^{2}}{2}} d x_{1} \dots d x_{n} = 0,

由此可以得到

E (\overset{x}{ˉ}^{2} φ) = 0.

记

T = \overset{x}{ˉ}^{2} - \frac{1}{n},

则

Cov (T, φ) = 0, E (T) = μ^{2},

从而

T = \overset{x}{ˉ}^{2} - \frac{1}{n}

为 $μ^{2}$ 的 UMVUE。

进一步，

Var (T) = Var (\overset{x}{ˉ}^{2}) = \frac{2}{n ^{2}} + \frac{4}{n} μ^{2},

C-R 下界为

\frac{4 μ ^{2}}{n I ( μ )} = \frac{4 μ ^{2}}{n} .

故此 UMVUE 的方差还达不到 C-R 不等式的下界。

习题 6.4-13

对泊松分布 $P (θ)$ ，

求 $I (\frac{1}{θ})$ ；

找一个函数 $g (\cdot)$ ，使 $g (θ)$ 的费希尔信息量与 $θ$ 无关。

解 （1）

I (\frac{1}{θ}) = I (θ) (\frac{d θ}{d ( 1/ θ )})^{2} = θ^{4} I (θ) = θ^{3} .

（2）

I (g (θ)) = I (θ) (\frac{d θ}{d g ( θ )})^{2} .

令

I (g (θ)) = c

（其中 $c$ 为大于 $0$ 的任意常数），则

\frac{d θ}{d g ( θ )} = c θ .

所以，

g (θ) = \frac{2}{c} θ + c_{2}

（其中 $c_{2}$ 为任意常数）。

习题 6.4-14

设 $x_{1}, x_{2}, \dots, x_{n}$ 为独立同分布变量， $0 < θ < 1$ ，
$P (x_{1} = - 1) = \frac{1 - θ}{2}, P (x_{1} = 0) = \frac{1}{2}, P (x_{1} = 1) = \frac{θ}{2} .$

求 $θ$ 的 MLE $\hat{θ}_{1}$ ，并问 $\hat{θ}_{1}$ 是否是无偏的；

求 $θ$ 的矩估计 $\hat{θ}_{2}$ ；

计算 $θ$ 的无偏估计的方差的 C-R 下界。

解 **（1）**方法一设 $x_{1}, x_{2}, \dots, x_{n}$ 中取值 $- 1, 0, 1$ 分别有 $n_{- 1}, n_{0}, n_{1}$ 次，有 $n_{- 1} + n_{0} + n_{1} = n$ ，则似然函数

L (θ) = (\frac{1 - θ}{2})^{n_{- 1}} (\frac{1}{2})^{n_{0}} (\frac{θ}{2})^{n_{1}} = \frac{( 1 - θ ) ^{n_{- 1}} θ ^{n_{1}}}{2 ^{n}},

有

ln L (θ) = n_{- 1} ln (1 - θ) + n_{1} ln θ - n ln 2,

令

\frac{d ln L ( θ )}{d θ} = n_{- 1} \cdot \frac{- 1}{1 - θ} + n_{1} \cdot \frac{1}{θ} = 0,

得

θ = \frac{n _{1}}{n _{- 1} + n _{1}},

故 $θ$ 的 MLE $\hat{θ}_{1} = \frac{n _{1}}{n _{- 1} + n _{1}}$ 。

方法二总体 $X$ 的密度函数为

p (x; θ) = (\frac{1 - θ}{2})^{\frac{x ( x - 1 )}{2}} (\frac{1}{2})^{- (x + 1) (x - 1)} (\frac{θ}{2})^{\frac{x ( x + 1 )}{2}} = \frac{1}{2} (1 - θ)^{\frac{x ^{2} - x}{2}} θ^{\frac{x ^{2} + x}{2}}, x = - 1, 0, 1,

则似然函数

L (θ) = i = 1 \prod n \frac{1}{2} (1 - θ)^{\frac{x _{i}^{2} - x _{i}}{2}} θ^{\frac{x _{i}^{2} + x _{i}}{2}} = \frac{1}{2 ^{n}} (1 - θ)^{\frac{1}{2} (\sum_{i = 1}^{n} x_{i}^{2} - \sum_{i = 1}^{n} x_{i})} θ^{\frac{1}{2} (\sum_{i = 1}^{n} x_{i}^{2} + \sum_{i = 1}^{n} x_{i})},

有

ln L (θ) = \frac{1}{2} (i = 1 \sum n x_{i}^{2} - i = 1 \sum n x_{i}) ln (1 - θ) + \frac{1}{2} (i = 1 \sum n x_{i}^{2} + i = 1 \sum n x_{i}) ln θ - n ln 2,

令

\frac{d ln L ( θ )}{d θ} = \frac{1}{2} (i = 1 \sum n x_{i}^{2} - i = 1 \sum n x_{i}) \frac{- 1}{1 - θ} + \frac{1}{2} (i = 1 \sum n x_{i}^{2} + i = 1 \sum n x_{i}) \frac{1}{θ} = 0,

得

θ = \frac{\sum _{i = 1}^{n} x _{i}^{2} + \sum _{i = 1}^{n} x _{i}}{2 \sum _{i = 1}^{n} x _{i}^{2}} = \frac{1}{2} + \frac{\sum _{i = 1}^{n} x _{i}}{2 \sum _{i = 1}^{n} x _{i}^{2}},

故 $θ$ 的 MLE

\hat{θ}_{1} = \frac{1}{2} + \frac{\sum _{i = 1}^{n} X _{i}}{2 \sum _{i = 1}^{n} X _{i}^{2}} .

注：因 $X_{i}$ 全部可能取值 $- 1, 0, 1$ ，有

i = 1 \sum n X_{i}^{2} = n_{- 1} + n_{1}, i = 1 \sum n X_{i} = n_{1} - n_{- 1},

即以上两个结果一致。

因

E (\hat{θ}_{1}) = E (\frac{n _{1}}{n _{- 1} + n _{1}}) = E [E (\frac{n _{1}}{n _{- 1} + n _{1}} n_{- 1} + n_{1})],

且

P (x_{1} = 1 ∣ x_{1} = - 1 或 x_{1} = 1) = \frac{P ( x _{1} = 1 )}{P ( x _{1} = - 1 或 x _{1} = 1 )} = \frac{θ /2}{( 1 - θ ) /2 + θ /2} = θ,

则在 $n_{- 1} + n_{1} = m$ 的条件下， $n_{1}$ 服从二项分布 $b (m, θ)$ ， $E (n_{1} ∣ n_{- 1} + n_{1} = m) = m θ$ ，可得

E (\frac{n _{1}}{n _{- 1} + n _{1}} n_{- 1} + n_{1}) = θ,

即

E (\hat{θ}_{1}) = E [E (\frac{n _{1}}{n _{- 1} + n _{1}} n_{- 1} + n_{1})] = E (θ) = θ .

$\hat{θ}_{1}$ 是 $θ$ 的无偏估计。

**（2）**因为

E (x_{1}) = - 1 \times \frac{1 - θ}{2} + 0 \times \frac{1}{2} + 1 \times \frac{θ}{2} = θ - \frac{1}{2},

所以 $θ$ 的矩估计为

\hat{θ}_{2} = \overset{x}{ˉ} + \frac{1}{2} .

（3）

ln p (x; θ) = \frac{1}{2} (x^{2} - x) ln (\frac{1 - θ}{2}) - (1 - x^{2}) ln 2 + \frac{1}{2} (x^{2} + x) ln (\frac{θ}{2}),

关于 $θ$ 求导，得

\frac{d ln p ( x ; θ )}{d θ} = - \frac{1}{2} (x^{2} - x) \frac{1}{1 - θ} + \frac{1}{2} (x^{2} + x) \frac{1}{θ},

I (θ) = E (\frac{d ln p ( x ; θ )}{d θ})^{2} = (- \frac{1}{1 - θ})^{2} \frac{1 - θ}{2} + 0 \times \frac{1}{2} + (\frac{1}{θ})^{2} \frac{θ}{2} = \frac{1}{2} (\frac{1}{1 - θ} + \frac{1}{θ}) = \frac{1}{2 θ ( 1 - θ )} .

所以， $θ$ 的无偏估计的方差的 C-R 下界为

\frac{2 θ ( 1 - θ )}{n} .

习题 6.4-15

设总体 $X \sim E x p (1/ θ)$ ， $x_{1}, x_{2}, \dots, x_{n}$ 是样本， $θ$ 的矩估计和最大似然估计都是 $\overset{x}{ˉ}$ ，它也是 $θ$ 的相合估计和无偏估计，试证明在均方误差准则下存在优于 $\overset{x}{ˉ}$ 的估计（提示：考虑 $\hat{θ}_{a} = a \overset{x}{ˉ}$ ，找均方误差最小者）。

解令

\hat{θ}_{a} = a \overset{x}{ˉ},

则

MSE (\hat{θ}_{a}) = Var (\hat{θ}_{a}) + (E \hat{θ}_{a} - θ)^{2} = a^{2} Var (\overset{x}{ˉ}) + (a E (\overset{x}{ˉ}) - θ)^{2} = a^{2} \frac{θ ^{2}}{n} + θ^{2} (a - 1)^{2} .

对上式求导易知，当

a = \frac{n}{n + 1}

时上式达到最小，最小值为

\frac{θ ^{2}}{n + 1},

它小于 $\overset{x}{ˉ}$ 的均方误差

\frac{θ ^{2}}{n} .

补充习题及解答

补充习题 16

设 $x_{1}, x_{2}, \dots, x_{n}$ 独立同分布， $x_{1}$ 的取值有四种可能，其概率分别为
$p_{1} = 1 - θ, p_{2} = θ - θ^{2}, p_{3} = θ^{2} - θ^{3}, p_{4} = θ^{3},$
记 $N_{j}$ 为 $x_{1}, x_{2}, \dots, x_{n}$ 中出现各种可能结果的次数， $N_{1} + N_{2} + N_{3} + N_{4} = n$ 。

确定 $a_{1}, a_{2}, a_{3}, a_{4}$ ，使 $T = \sum_{i = 1}^{4} a_{i} N_{i}$ 为 $θ$ 的无偏估计；

将 $Var (T)$ 与 $θ$ 的无偏估计方差的 C-R 下界比较。

解 **（1）**由于 $N_{i} \sim b (n, p_{i})$ ， $i = 1, 2, 3, 4$ ，所以 $E (N_{i}) = n p_{i}$ ，从而有

E (T) = j = 1 \sum 4 a_{j} E (N_{j}) = a_{1} n (1 - θ) + a_{2} n (θ - θ^{2}) + a_{3} n (θ^{2} - θ^{3}) + a_{4} n θ^{3} = n a_{1} + n (a_{2} - a_{1}) θ + n (a_{3} - a_{2}) θ^{2} + n (a_{4} - a_{3}) θ^{3} .

若使 $T$ 为 $θ$ 的无偏估计，即要求

⎩ ⎨ ⎧ n a_{1} = 0, n (a_{2} - a_{1}) = 1, n (a_{3} - a_{2}) = 0, n (a_{4} - a_{3}) = 0,

解之得

a_{1} = 0, a_{2} = a_{3} = a_{4} = \frac{1}{n} .

即

T = \frac{N _{2} + N _{3} + N _{4}}{n}

是 $θ$ 的无偏估计。

（2）

P (N_{j} = n_{j}, j = 1, 2, 3, 4) = \frac{n !}{n _{1} ! n _{2} ! n _{3} ! n _{4} !} (1 - θ)^{n_{1}} (θ - θ^{2})^{n_{2}} (θ^{2} - θ^{3})^{n_{3}} (θ^{3})^{n_{4}}

= \frac{n !}{n _{1} ! n _{2} ! n _{3} ! n _{4} !} θ^{n_{2} + 2 n_{3} + 3 n_{4}} (1 - θ)^{n_{1} + n_{2} + n_{3}},

对数似然函数为（略去与 $θ$ 无关的项）

ln L = (n_{2} + 2 n_{3} + 3 n_{4}) ln θ + (n_{1} + n_{2} + n_{3}) ln (1 - θ) .

于是

\frac{\partial ln L}{\partial θ} = \frac{n _{2} + 2 n _{3} + 3 n _{4}}{θ} - \frac{n _{1} + n _{2} + n _{3}}{1 - θ},

\frac{\partial ^{2} ln L}{\partial θ ^{2}} = - \frac{n _{2} + 2 n _{3} + 3 n _{4}}{θ ^{2}} - \frac{n _{1} + n _{2} + n _{3}}{( 1 - θ ) ^{2}} .

注意到观测量 $n_{1}, n_{2}, n_{3}, n_{4}$ 是随机变量，且 $E (n_{j}) = n p_{j}$ ，故

E (n_{2} + 2 n_{3} + 3 n_{4}) = n ((θ - θ^{2}) + 2 (θ^{2} - θ^{3}) + 3 θ^{3}) = n (θ + θ^{2} + θ^{3}),

E (n_{1} + n_{2} + n_{3}) = n ((1 - θ) + (θ - θ^{2}) + (θ^{2} - θ^{3})) = n (1 - θ^{3}) .

从而费希尔信息量为

I (θ) = - E (\frac{\partial ^{2} ln L}{\partial θ ^{2}}) = \frac{n ( θ + θ ^{2} + θ ^{3} )}{θ ^{2}} + \frac{n ( 1 - θ ^{3} )}{( 1 - θ ) ^{2}} = \frac{n ( 1 + θ + θ ^{2} )}{θ ( 1 - θ )} .

所以 $θ$ 的无偏估计方差的 C-R 下界为

\frac{θ ( 1 - θ )}{n ( 1 + θ + θ ^{2} )} .

由于

N_{2} + N_{3} + N_{4} = n - N_{1} \sim b (n, θ),

于是

Var (T) = \frac{1}{n ^{2}} Var (N_{2} + N_{3} + N_{4}) = \frac{θ ( 1 - θ )}{n} \frac{θ ( 1 - θ )}{n ( 1 + θ + θ ^{2} )},

即 $T$ 的方差没有达到 $θ$ 的无偏估计方差的 C-R 下界。

补充习题 17

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自正态总体 $N (μ, σ^{2})$ 的一个样本，若均值 $μ$ 已知，证明：

$\overset{σ}{^}^{2} = \frac{1}{n} \sum_{i = 1}^{n} (x_{i} - μ)^{2}$ 是 $σ^{2}$ 的有效估计；

$\overset{σ}{^} = \frac{1}{n} \frac{π}{2} \sum_{i = 1}^{n} ∣ x_{i} - μ ∣$ 是 $σ$ 的无偏估计，但不是有效估计。

解 **（1）**由

\frac{n σ ^ ^{2}}{σ ^{2}} \sim χ^{2} (n)

知 $E (\overset{σ}{^}^{2}) = σ^{2}$ ，

Var (\overset{σ}{^}^{2}) = \frac{2 σ ^{4}}{n} .

为了获得 $σ^{2}$ 的无偏估计的 C-R 下界，需要费希尔信息量。正态分布 $N (μ, σ^{2})$ 的密度函数 $p (x)$ 的对数是

ln p (x) = - \frac{1}{2} ln 2 π - \frac{1}{2} ln σ^{2} - \frac{( x - μ ) ^{2}}{2 σ ^{2}},

\frac{\partial ln p ( x )}{\partial σ ^{2}} = - \frac{1}{2 σ ^{2}} + \frac{( x - μ ) ^{2}}{2 σ ^{4}} = \frac{1}{2 σ ^{4}} [(x - μ)^{2} - σ^{2}] .

由此得 $σ^{2}$ 的费希尔信息量

I (σ^{2}) = E [\frac{\partial ln p ( x )}{\partial σ ^{2}}]^{2} = \frac{1}{4 σ ^{8}} [E (x - μ)^{4} - 2 σ^{2} E (x - μ)^{2} + σ^{4}] = \frac{1}{4 σ ^{8}} [3 σ^{4} - 2 σ^{4} + σ^{4}] = \frac{1}{2 σ ^{4}} .

从而 $σ^{2}$ 的无偏估计的 C-R 下界为

[n I (σ^{2})]^{- 1} = [\frac{n}{2 σ ^{4}}]^{- 1} = \frac{2 σ ^{4}}{n},

此下界与上述 $\overset{σ}{^}^{2}$ 无偏估计的方差相等，故此 $\overset{σ}{^}^{2}$ 是 $σ^{2}$ 的有效估计。

**（2）**由于

E (∣ x_{i} - μ ∣) = \frac{1}{2 π σ} \int_{- \infty}^{\infty} ∣ x - μ ∣ e^{- \frac{( x - μ ) ^{2}}{2 σ ^{2}}} d x = \frac{2 σ}{2 π} \int_{0}^{\infty} y e^{- y^{2} /2} d y = \frac{2}{π} σ .

可见，

E (\overset{σ}{^}) = σ,

即 $\overset{σ}{^}$ 是 $σ$ 的无偏估计，其方差为

Var (\overset{σ}{^}) = \frac{π}{2 n ^{2}} i = 1 \sum n Var (∣ x_{i} - μ ∣) = \frac{π}{2 n} [E (x_{i} - μ)^{2} - (E ∣ x_{i} - μ ∣)^{2}] = \frac{π}{2 n} (σ^{2} - \frac{2}{π} σ^{2}) = \frac{π - 2}{2 n} σ^{2} .

为了获得 $σ$ 的无偏估计的 C-R 下界，需要知道 $σ$ 的费希尔信息量。由于

\frac{\partial ln p ( x )}{\partial σ} = - \frac{1}{σ} + \frac{( x - μ ) ^{2}}{σ ^{3}} = \frac{1}{σ ^{3}} [(x - μ)^{2} - σ^{2}],

I (σ) = E (\frac{\partial ln p ( x )}{\partial σ})^{2} = \frac{1}{σ ^{6}} [E (x - μ)^{4} - 2 σ^{2} E (x - μ)^{2} + σ^{4}] = \frac{1}{σ ^{6}} [3 σ^{4} - 2 σ^{4} + σ^{4}] = \frac{2}{σ ^{2}} .

从而 $σ$ 的无偏估计的 C-R 下界为

[n I (σ)]^{- 1} = [\frac{2 n}{σ ^{2}}]^{- 1} = \frac{σ ^{2}}{2 n},

由于无偏估计 $\overset{σ}{^}$ 的方差

\frac{π - 2}{2 n} σ^{2} > \frac{σ ^{2}}{2 n},

故 $\overset{σ}{^}$ 不是 $σ$ 的有效估计。此处， $σ$ 的无偏估计的 C-R 下界与 $\overset{σ}{^}$ 方差的比为

\frac{σ ^{2} / ( 2 n )}{( π - 2 ) σ ^{2} / ( 2 n )} = \frac{1}{π - 2} = 0.876,

该比值常称为无偏估计 $\overset{σ}{^}$ 的效。

补充习题 18

证明：若 $T_{1}$ 与 $T_{2}$ 是未知参数 $g (θ)$ 的两个 UMVUE，则 $T_{1} = T_{2}$ 依概率几乎处处成立。这个命题表明： $g (θ)$ 的 UMVUE 在几乎处处的意义下是唯一的。

解首先指出 $T_{1} - T_{2}$ 是 $0$ 的无偏估计，则由教材中定理 $6.4.1$ 知

Cov (T_{i}, T_{1} - T_{2}) = E [T_{i} (T_{1} - T_{2})] = 0, i = 1, 2,

于是

E ((T_{1} - T_{2})^{2}) = E (T_{1}^{2} + T_{2}^{2} - 2 T_{1} T_{2}) = E [T_{1} (T_{1} - T_{2})] + E [T_{2} (T_{2} - T_{1})] = 0,

由此立即可得 $(T_{1} - T_{2})^{2} = 0$ ，即 $T_{1} = T_{2}$ ，几乎处处成立。

补充习题 19

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自正态总体 $N (μ, σ^{2})$ 的一个样本，对 $σ^{2}$ 考虑如下三个估计：
$\overset{σ}{^}_{1}^{2} = \frac{1}{n - 1} i = 1 \sum n (x_{i} - \overset{x}{ˉ})^{2}, \overset{σ}{^}_{2}^{2} = \frac{1}{n} i = 1 \sum n (x_{i} - \overset{x}{ˉ})^{2}, \overset{σ}{^}_{3}^{2} = \frac{1}{n + 1} i = 1 \sum n (x_{i} - \overset{x}{ˉ})^{2} .$

哪一个是 $σ^{2}$ 的无偏估计？

哪一个均方误差最小？

解 **（1）**由于

\frac{1}{σ ^{2}} i = 1 \sum n (x_{i} - \overset{x}{ˉ})^{2} \sim χ^{2} (n - 1),

故有

E [i = 1 \sum n (x_{i} - \overset{x}{ˉ})^{2}] = (n - 1) σ^{2},

从而

E (\overset{σ}{^}_{1}^{2}) = σ^{2}, E (\overset{σ}{^}_{2}^{2}) = \frac{n - 1}{n} σ^{2}, E (\overset{σ}{^}_{3}^{2}) = \frac{n - 1}{n + 1} σ^{2} .

这说明仅有 $\overset{σ}{^}_{1}^{2}$ 是 $σ^{2}$ 的无偏估计，而 $\overset{σ}{^}_{2}^{2}$ 与 $\overset{σ}{^}_{3}^{2}$ 是 $σ^{2}$ 的有偏估计。

**（2）**我们知道，估计的均方误差是估计的方差加上偏差的平方，即

E (\overset{σ}{^}^{2} - σ^{2})^{2} = Var (\overset{σ}{^}^{2}) + (E (\overset{σ}{^}^{2}) - σ^{2})^{2} .

而

Var (i = 1 \sum n (x_{i} - \overset{x}{ˉ})^{2}) = 2 (n - 1) σ^{4},

这给出

Var (\overset{σ}{^}_{1}^{2}) = \frac{2 σ ^{4}}{n - 1}, Var (\overset{σ}{^}_{2}^{2}) = \frac{2 ( n - 1 ) σ ^{4}}{n ^{2}}, Var (\overset{σ}{^}_{3}^{2}) = \frac{2 ( n - 1 ) σ ^{4}}{( n + 1 ) ^{2}} .

于是

MSE (\overset{σ}{^}_{1}^{2}) = Var (\overset{σ}{^}_{1}^{2}) = \frac{2 σ ^{4}}{n - 1},

MSE (\overset{σ}{^}_{2}^{2}) = \frac{2 ( n - 1 )}{n ^{2}} σ^{4} + (\frac{n - 1}{n} σ^{2} - σ^{2})^{2} = \frac{2 n - 1}{n ^{2}} σ^{4},

MSE (\overset{σ}{^}_{3}^{2}) = \frac{2 ( n - 1 )}{( n + 1 ) ^{2}} σ^{4} + (\frac{n - 1}{n + 1} σ^{2} - σ^{2})^{2} = \frac{2}{n + 1} σ^{4} .

显然

\frac{2}{n - 1} > \frac{2}{n + 1}, \frac{2 n - 1}{n ^{2}} > \frac{2}{n + 1} (n > 1),

所以 $\overset{σ}{^}_{3}^{2}$ 的均方误差最小。

注意，这里 $\overset{σ}{^}_{3}^{2}$ 是 $σ^{2}$ 的有偏估计，上述结论表明，在均方误差意义下，有时有偏估计要比无偏估计更为优。

事实上，我们还可讨论 $σ^{2}$ 的估计类

\overset{σ}{^}_{l}^{2} = l \sum (x_{i} - \overset{x}{ˉ})^{2}

中的均方误差的最小性问题。易知

MSE (\overset{σ}{^}_{l}^{2}) = (E (\overset{σ}{^}_{l}^{2}) - σ^{2})^{2} + Var (\overset{σ}{^}_{l}^{2}) = ((n - 1) l - 1)^{2} σ^{4} + 2 (n - 1) l^{2} σ^{4} .

不难求出当

l = \frac{1}{n + 1}

时，上式达到最小。所以，在形如 $\overset{σ}{^}_{l}^{2}$ 的估计类中，上述 $\overset{σ}{^}_{3}^{2}$ 均方误差最小。

补充习题 20

设 $x_{1}, x_{2}$ 独立同分布，其共同的密度函数为
$p (x; θ) = \frac{3 x ^{2}}{θ ^{3}}, 0 < x < θ, θ > 0.$

证明： $T_{1} = \frac{2}{3} (x_{1} + x_{2})$ 和 $T_{2} = \frac{7}{6} max {x_{1}, x_{2}}$ 都是 $θ$ 的无偏估计；

计算 $T_{1}$ 和 $T_{2}$ 的均方误差并进行比较；

证明：在均方误差意义下，在形如 $T_{c} = c max {x_{1}, x_{2}}$ 的估计中， $T_{8/7}$ 最优。

解 **（1）**先计算总体均值为

E (X) = \int_{0}^{θ} x \cdot \frac{3 x ^{2}}{θ ^{3}} d x = \frac{3}{4} θ,

故

E (T_{1}) = \frac{2}{3} \cdot 2 E (X) = θ,

这说明 $T_{1}$ 是 $θ$ 的无偏估计。又总体分布函数

F (x; θ) = \int_{0}^{x} \frac{3 u ^{2}}{θ ^{3}} d u = (\frac{x}{θ})^{3}, 0 < x < θ,

记

Y = max {x_{1}, x_{2}},

则 $Y$ 的密度函数为

f (y; θ) = 2 F (y; θ) p (y; θ) = \frac{6 y ^{5}}{θ ^{6}}, 0 < y < θ .

于是有

E (T_{2}) = \frac{7}{6} E (Y) = \frac{7}{6} \int_{0}^{θ} y \cdot \frac{6 y ^{5}}{θ ^{6}} d y = \frac{7}{6} \cdot \frac{6}{7} θ = θ .

这表明 $T_{2}$ 也是 $θ$ 的无偏估计。

**（2）**无偏估计的方差就是均方误差。由于

E (x_{1}^{2}) = \int_{0}^{θ} x^{2} \cdot \frac{3 x ^{2}}{θ ^{3}} d x = \frac{3}{5} θ^{2},

Var (x_{1}) = E (x_{1}^{2}) - (E (x_{1}))^{2} = \frac{3}{5} θ^{2} - (\frac{3}{4} θ)^{2} = \frac{3}{80} θ^{2},

故有

MSE (T_{1}) = Var (T_{1}) = \frac{4}{9} \cdot 2 Var (x_{1}) = \frac{8}{9} \cdot \frac{3}{80} θ^{2} = \frac{1}{30} θ^{2} .

又

E (Y^{2}) = \int_{0}^{θ} y^{2} \cdot \frac{6 y ^{5}}{θ ^{6}} d y = \frac{3}{4} θ^{2},

Var (Y) = E (Y^{2}) - (E (Y))^{2} = \frac{3}{4} θ^{2} - (\frac{6}{7} θ)^{2} = \frac{3}{196} θ^{2},

从而

MSE (T_{2}) = Var (T_{2}) = \frac{49}{36} \cdot \frac{3}{196} θ^{2} = \frac{1}{48} θ^{2} .

由于 $MSE (T_{1}) > MSE (T_{2})$ ，因此在均方误差意义下， $T_{2}$ 优于 $T_{1}$ 。

**（3）**对形如

T_{c} = c max {x_{1}, x_{2}}

的估计有

E (T_{c}) = \frac{6}{7} c θ, E (T_{c}^{2}) = \frac{3}{4} c^{2} θ^{2},

故

MSE (T_{c}) = E (T_{c} - θ)^{2} = E (T_{c}^{2}) - 2 θ E (T_{c}) + θ^{2} = (\frac{3}{4} c^{2} - \frac{12}{7} c + 1) θ^{2} .

因此当

c = \frac{12/7}{3/2} = \frac{8}{7}

时，上述均方误差最小。所以在均方误差意义下，在形如 $T_{c} = c max {x_{1}, x_{2}}$ 的估计中， $T_{8/7}$ 最优。

群知识库

AI 找笔记

Explorer

6.4 最小方差无偏估计

§6.4 最小方差无偏估计

依赖于

被以下题目直接调用

正文部分

§6.4 最小方差无偏估计

习题与解答 6.4

补充习题及解答

评论

Graph View

目录

反向链接