§6.6 区间估计

依赖于

无显式依赖

被以下题目直接调用

正文部分

§6.6 区间估计

1. 置信区间 设 $θ$ 是总体的一个参数，其参数空间为 $Θ$ ， $x_{1}, x_{2}, \dots, x_{n}$ 是来自该总体的样本，对给定的一个 $α (0 < α < 1)$ ，若有两个统计量

\hat{θ}_{L} = \hat{θ}_{L} (x_{1}, x_{2}, \dots, x_{n}), \hat{θ}_{U} = \hat{θ}_{U} (x_{1}, x_{2}, \dots, x_{n}),

使得对任意的 $θ \in Θ$ ，有

P_{θ} (\hat{θ}_{L} \leq θ \leq \hat{θ}_{U}) \geq 1 - α,

则称随机区间 $[\hat{θ}_{L}, \hat{θ}_{U}]$ 是 $θ$ 的置信水平为 $1 - α$ 的置信区间，或简称 $[\hat{θ}_{L}, \hat{θ}_{U}]$ 是 $θ$ 的 $1 - α$ 置信区间； $\hat{θ}_{L}$ 和 $\hat{θ}_{U}$ 分别称为 $θ$ 的（双侧）置信下限和置信上限。

这里置信水平 $1 - α$ 的含义是指在大量使用该置信区间时，大约有不少于 $100 (1 - α) %$ 的区间包含 $θ$ 。

2. 同等置信区间 在上述记号下，若对给定的 $α (0 < α < 1)$ ，对任意的 $θ \in Θ$ ，有

P_{θ} (\hat{θ}_{L} \leq θ \leq \hat{θ}_{U}) = 1 - α,

则称 $[\hat{θ}_{L}, \hat{θ}_{U}]$ 为 $θ$ 的 $1 - α$ 同等置信区间。

同等置信区间是把给定的置信水平 $1 - α$ 用足了。常在总体为连续分布场合下可以实现。

3. 置信限 在上述记号下，若对给定的 $α (0 < α < 1)$ 和任意的 $θ \in Θ$ ，有

P_{θ} (\hat{θ}_{L} \leq θ) \geq 1 - α, \forall θ \in Θ,

则称 $\hat{θ}_{L}$ 是 $θ$ 的置信水平为 $1 - α$ 的（单侧）置信下限。假如等号对一切 $θ \in Θ$ 成立，则称 $\hat{θ}_{L}$ 是 $θ$ 的 $1 - α$ 同等置信下限。若对给定的 $α (0 < α < 1)$ 和任意的 $θ \in Θ$ ，有

P_{θ} (\hat{θ}_{U} \geq θ) \geq 1 - α,

则称 $\hat{θ}_{U}$ 是 $θ$ 的置信水平为 $1 - α$ 的（单侧）置信上限。若等号对一切 $θ \in Θ$ 成立，则称 $\hat{θ}_{U}$ 是 $θ$ 的 $1 - α$ 同等置信上限。

4. 枢轴量法 寻找同等置信区间常采用枢轴量法，其步骤如下：

设法构造一个样本和 $θ$ 的函数 $G = G (x_{1}, x_{2}, \dots, x_{n}, θ)$ ，使得 $G$ 的分布不依赖于未知参数。此种 $G$ 被称为枢轴量；
适当地选择两个常数 $c, d$ ，使对给定的 $α (0 < α < 1)$ ，有 $P (c \leq G \leq d) = 1 - α$ ；
若能将 $c \leq G \leq d$ 进行不等式等价变形化为 $\hat{θ}_{L} \leq θ \leq \hat{θ}_{U}$ ，则有

P_{θ} (\hat{θ}_{L} \leq θ \leq \hat{θ}_{U}) = 1 - α,

最后的 $[\hat{θ}_{L}, \hat{θ}_{U}]$ 就是 $θ$ 的 $1 - α$ 同等置信区间。

关于置信区间的构造有两点说明：

满足置信水平要求的 $c$ 与 $d$ 通常不唯一。若有可能，应选平均长度 $E (\hat{θ}_{U} - \hat{θ}_{L})$ 达到最短的 $c$ 与 $d$ ，这在 $G$ 的分布为对称分布场合通常容易实现。
实际中，选平均长度 $E (\hat{θ}_{U} - \hat{θ}_{L})$ 尽可能短的 $c$ 与 $d$ 往往很难实现，此时，常这样选择 $c$ 与 $d$ ，使得两个尾部概率各为 $α /2$ ，即 $P (G < c) = P (G > d) = α /2$ ，这样的置信区间称为等尾置信区间。这是在 $G$ 的分布为偏态分布场合常采用的方法。

5. 常用的置信区间

(1) 设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自 $N (μ, σ^{2})$ 的样本， $\overset{x}{ˉ}$ 为样本均值， $s$ 为样本标准差， $u_{p}$ 为标准正态分布的 $p$ 分位数， $t_{p} (k)$ 为自由度是 $k$ 的 $t$ 分布 $t (k)$ 的 $p$ 分位数， $χ_{p}^{2} (k)$ 为自由度是 $k$ 的 $χ^{2}$ 分布 $χ^{2} (k)$ 的 $p$ 分位数，取置信水平 $1 - α$ ，则

$σ$ 已知时 $μ$ 的置信区间为

[\overset{x}{ˉ} - u_{1 - α /2} \frac{σ}{n}, \overset{x}{ˉ} + u_{1 - α /2} \frac{σ}{n}];

$σ$ 未知时 $μ$ 的置信区间为

[\overset{x}{ˉ} - t_{1 - α /2} (n - 1) \frac{s}{n}, \overset{x}{ˉ} + t_{1 - α /2} (n - 1) \frac{s}{n}];

$σ^{2}$ （ $μ$ 未知）的置信区间为

[\frac{( n - 1 ) s ^{2}}{χ _{1 - α /2}^{2} ( n - 1 )}, \frac{( n - 1 ) s ^{2}}{χ _{α /2}^{2} ( n - 1 )}];

$σ$ （ $μ$ 未知）的置信区间为

\frac{s n - 1}{χ _{1 - α /2}^{2} ( n - 1 )}, \frac{s n - 1}{χ _{α /2}^{2} ( n - 1 )} .

(2) 设 $x_{1}, x_{2}, \dots, x_{m}$ 是来自 $N (μ_{1}, σ_{1}^{2})$ 的样本， $\overset{x}{ˉ}$ 为其样本均值， $s_{x}$ 为其样本标准差； $y_{1}, y_{2}, \dots, y_{n}$ 是来自 $N (μ_{2}, σ_{2}^{2})$ 的样本， $\overset{y}{ˉ}$ 为其样本均值， $s_{y}$ 为其样本标准差； $u_{p}, t_{p} (k)$ 含义同上， $F_{p} (k_{1}, k_{2})$ 为自由度是 $(k_{1}, k_{2})$ 的 $F$ 分布 $F (k_{1}, k_{2})$ 的 $p$ 分位数，取置信水平 $1 - α$ ，则

$σ_{1}^{2}$ 与 $σ_{2}^{2}$ 均已知时， $μ_{1} - μ_{2}$ 的置信区间为

[\overset{x}{ˉ} - \overset{y}{ˉ} - u_{1 - α /2} \frac{σ _{1}^{2}}{m} + \frac{σ _{2}^{2}}{n}, \overset{x}{ˉ} - \overset{y}{ˉ} + u_{1 - α /2} \frac{σ _{1}^{2}}{m} + \frac{σ _{2}^{2}}{n}];

$σ_{1}^{2} = σ_{2}^{2}$ 未知时， $μ_{1} - μ_{2}$ 的置信区间为

[\overset{x}{ˉ} - \overset{y}{ˉ} - \frac{m + n}{mn} s_{w} t_{1 - α /2} (m + n - 2), \overset{x}{ˉ} - \overset{y}{ˉ} + \frac{m + n}{mn} s_{w} t_{1 - α /2} (m + n - 2)],

其中

s_{w}^{2} = \frac{( m - 1 ) s _{x}^{2} + ( n - 1 ) s _{y}^{2}}{m + n - 2};

$\frac{σ _{1}^{2}}{σ _{2}^{2}} = c$ 已知时， $μ_{1} - μ_{2}$ 的置信区间为

[\overset{x}{ˉ} - \overset{y}{ˉ} - \frac{m c + n}{mn} s_{t} t_{1 - α /2} (m + n - 2), \overset{x}{ˉ} - \overset{y}{ˉ} + \frac{m c + n}{mn} s_{t} t_{1 - α /2} (m + n - 2)],

其中

s_{t}^{2} = \frac{( m - 1 ) s _{x}^{2} + ( n - 1 ) s _{y}^{2} / c}{m + n - 2};

$m$ 与 $n$ 都很大时， $μ_{1} - μ_{2}$ 的近似置信区间为

[\overset{x}{ˉ} - \overset{y}{ˉ} - u_{1 - α /2} \frac{s _{x}^{2}}{m} + \frac{s _{y}^{2}}{n}, \overset{x}{ˉ} - \overset{y}{ˉ} + u_{1 - α /2} \frac{s _{x}^{2}}{m} + \frac{s _{y}^{2}}{n}];

一般场合下 $μ_{1} - μ_{2}$ 的近似置信区间为

[\overset{x}{ˉ} - \overset{y}{ˉ} - s_{0} t_{1 - α /2} (l), \overset{x}{ˉ} - \overset{y}{ˉ} + s_{0} t_{1 - α /2} (l)],

其中

s_{0}^{2} = \frac{s _{x}^{2}}{m} + \frac{s _{y}^{2}}{n}, l = \frac{s _{0}^{4}}{\frac{s _{x}^{4}}{m ^{2} ( m - 1 )} + \frac{s _{y}^{4}}{n ^{2} ( n - 1 )}} .

方差比 $\frac{σ _{1}^{2}}{σ _{2}^{2}}$ 的置信区间为

[\frac{s _{x}^{2}}{s _{y}^{2}} \cdot \frac{1}{F _{1 - α /2} ( m - 1 , n - 1 )}, \frac{s _{x}^{2}}{s _{y}^{2}} \cdot \frac{1}{F _{α /2} ( m - 1 , n - 1 )}] .

(3) 设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自 $b (1, p)$ 的样本， $\overset{x}{ˉ}$ 为其样本均值，则 $n$ 很大时比例 $p$ 的置信水平为 $1 - α$ 的近似置信区间为

[\overset{x}{ˉ} - u_{1 - α /2} \frac{x ˉ ( 1 - x ˉ )}{n}, \overset{x}{ˉ} + u_{1 - α /2} \frac{x ˉ ( 1 - x ˉ )}{n}] .

6. 样本量的确定 控制比率 $p$ 的 $1 - α$ 置信区间长度不超过 $2 d_{0}$ 的最小样本量为

n \geq (\frac{u _{1 - α /2}}{2 d _{0}})^{2} .

习题与解答 6.6

习题 6.6-1

某厂生产的化纤强度服从正态分布，长期以来其标准差稳定在 $σ = 0.85$ ，现抽取了一个容量为 $n = 25$ 的样本，测定其强度，算得样本均值为 $\overset{x}{ˉ} = 2.25$ ，试求这批化纤平均强度的置信水平为 $0.95$ 的置信区间。

解这是方差已知时正态均值的区间估计问题。由题设条件 $1 - α = 0.95$ ， $α = 0.05$ ，查表知 $u_{0.975} = 1.96$ ，于是这批化纤平均强度的置信水平为 $0.95$ 的置信区间为

[\overset{x}{ˉ} - u_{1 - α /2} \frac{σ}{n}, \overset{x}{ˉ} + u_{1 - α /2} \frac{σ}{n}] = [2.25 - 1.96 \times \frac{0.85}{25}, 2.25 + 1.96 \times \frac{0.85}{25}] .

即这批化纤平均强度的置信水平为 $0.95$ 的置信区间为

[1.9168, 2.5832] .

习题 6.6-2

总体 $X \sim N (μ, σ^{2})$ ， $σ^{2}$ 已知，问样本容量 $n$ 取多大时才能保证 $μ$ 置信水平为 $95%$ 的置信区间的长度不大于 $k$ 。

解已知条件下得 $μ$ 的 $0.95$ 置信区间为

[\overset{x}{ˉ} - u_{1 - α /2} \frac{σ}{n}, \overset{x}{ˉ} + u_{1 - α /2} \frac{σ}{n}],

其区间长度为 $2 u_{1 - α /2} σ / n$ ，若使 $2 u_{1 - α /2} σ / n \leq k$ ，只需

n \geq (\frac{2}{k})^{2} σ^{2} u_{1 - α /2}^{2} .

由于 $u_{1 - α /2} = 1.96$ ，故

n \geq (\frac{2}{k})^{2} σ^{2} \cdot 1.9 6^{2} = (\frac{3.92 σ}{k})^{2},

即样本容量 $n$ 至少取 $(\frac{3.92 σ}{k})^{2}$ 时，才能保证 $μ$ 的置信水平为 $95%$ 的置信区间的长度不大于 $k$ 。

习题 6.6-3

$0.50, 1.25, 0.80, 2.00$ 是取自总体 $X$ 的样本，已知 $Y = ln X$ 服从正态分布 $N (μ, 1)$ 。

(1) 求 $μ$ 的置信水平为 $95%$ 的置信区间；

(2) 求 $X$ 的数学期望的置信水平为 $95%$ 的置信区间。

解 (1) 将数据进行对数变换，得到 $Y = ln X$ 的样本值为

- 0.6931, 0.2231, - 0.2231, 0.6931.

它可看作是来自正态总体 $N (μ, 1)$ 的样本，其样本均值为 $\overset{y}{ˉ} = 0$ ，由于 $σ = 1$ 已知，因此， $μ$ 的置信水平为 $95%$ 的置信区间为

[\overset{y}{ˉ} - u_{1 - α /2} \frac{1}{n}, \overset{y}{ˉ} + u_{1 - α /2} \frac{1}{n}] = [- 0.9800, 0.9800] .

(2) 由于

E (X) = e^{μ + \frac{1}{2}}

是 $μ$ 的严格函数，利用 (1) 的结果，可算得 $X$ 的数学期望的置信水平为 $95%$ 的置信区间为

[e^{- 0.98 + 0.5}, e^{0.98 + 0.5}] = [0.6188, 4.3929] .

习题 6.6-4

用一个仪表测量某一物理量 $9$ 次，得样本均值 $\overset{x}{ˉ} = 56.32$ ，样本标准差 $s = 0.22$ 。

(1) 测量标准差 $σ$ 的大小反映了测量仪表的精度，试求 $σ$ 的置信水平为 $0.95$ 的置信区间；

(2) 求该物理量真值的置信水平为 $0.99$ 的置信区间。

解 (1) 此处 $(n - 1) s^{2} = 8 \times 0.2 2^{2} = 0.3872$ 。查表知

χ_{0.025}^{2} (8) = 2.1797, χ_{0.975}^{2} (8) = 17.5345,

$σ^{2}$ 的 $1 - α$ 置信区间为

[\frac{( n - 1 ) s ^{2}}{χ _{1 - α /2}^{2} ( n - 1 )}, \frac{( n - 1 ) s ^{2}}{χ _{α /2}^{2} ( n - 1 )}] = [\frac{0.3872}{17.5345}, \frac{0.3872}{2.1797}] = [0.0221, 0.1776],

从而 $σ$ 的置信水平为 $0.95$ 的置信区间为

[0.1487, 0.4214] .

(2) 当 $σ$ 未知时， $μ$ 的 $1 - α$ 置信区间为

[\overset{x}{ˉ} - t_{1 - α /2} (n - 1) \frac{s}{n}, \overset{x}{ˉ} + t_{1 - α /2} (n - 1) \frac{s}{n}] .

查表得 $t_{1 - 0.005} (8) = 3.3554$ ，因而 $μ$ 的置信水平为 $0.99$ 的置信区间为

[56.32 - 3.3554 \times \frac{0.22}{9}, 56.32 + 3.3554 \times \frac{0.22}{9}] = [56.0739, 56.5661] .

习题 6.6-5

已知某种材料的抗压强度 $X \sim N (μ, σ^{2})$ ，现随机地抽取 $10$ 个试件进行抗压试验，测得数据如下：
$482, 493, 457, 471, 510, 446, 435, 418, 394, 469.$
(1) 求平均抗压强度 $μ$ 的置信水平为 $95%$ 的置信区间；

(2) 若已知 $σ = 30$ ，求平均抗压强度 $μ$ 的置信水平为 $95%$ 的置信区间；

(3) 求 $σ$ 的置信水平为 $95%$ 的置信区间。

解 (1) 经计算得，

\overset{x}{ˉ} = 457.5, s = 35.2176.

在 $σ$ 未知时， $μ$ 的置信水平为 $95%$ 的置信区间为

[\overset{x}{ˉ} - t_{1 - α /2} (n - 1) \frac{s}{n}, \overset{x}{ˉ} + t_{1 - α /2} (n - 1) \frac{s}{n}] .

查表得 $t_{1 - 0.025} (9) = 2.2622$ ，因而 $μ$ 的置信水平为 $95%$ 的置信区间为

[457.5 - 2.2622 \times \frac{35.2176}{10}, 457.5 + 2.2622 \times \frac{35.2176}{10}] = [432.3064, 482.6936] .

(2) 在 $σ = 30$ 已知时， $μ$ 的置信水平为 $95%$ 的置信区间为

[\overset{x}{ˉ} - u_{1 - α /2} \frac{σ}{n}, \overset{x}{ˉ} + u_{1 - α /2} \frac{σ}{n}] .

查表得 $u_{1 - α /2} = 1.96$ ，因而 $μ$ 的置信水平为 $95%$ 的置信区间为

[457.5 - 1.96 \times \frac{30}{10}, 457.5 + 1.96 \times \frac{30}{10}] = [438.9058, 476.0942] .

(3) 此处 $(n - 1) s^{2} = 11162.5141$ 。取 $α = 0.05$ ，查表得

χ_{0.025}^{2} (9) = 2.7004, χ_{0.975}^{2} (9) = 19.0228,

因而 $σ^{2}$ 的置信水平为 $95%$ 的置信区间为

[\frac{11162.5141}{19.0228}, \frac{11162.5141}{2.7004}] = [586.7966, 4133.6521],

由此可以得到 $σ$ 的置信水平为 $95%$ 的置信区间为

[24.2239, 64.2935] .

习题 6.6-6

在一批货物中随机抽取 $80$ 件，发现有 $11$ 件不合格品，试求这批货物的不合格品率的置信水平为 $0.90$ 的置信区间。

解此处 $n = 80$ 较大，可用正态分布求其近似置信区间。不合格品率的 $1 - α$ 近似置信区间为

[\overset{x}{ˉ} - u_{1 - α /2} \frac{x ˉ ( 1 - x ˉ )}{n}, \overset{x}{ˉ} + u_{1 - α /2} \frac{x ˉ ( 1 - x ˉ )}{n}] .

此处

\overset{x}{ˉ} = \frac{11}{80} = 0.1375, u_{0.95} = 1.645,

因而不合格品率的置信水平为 $0.90$ 的置信区间为

[0.1375 - 1.645 \frac{0.1375 \times 0.8625}{80}, 0.1375 + 1.645 \frac{0.1375 \times 0.8625}{80}] = [0.0742, 0.2008] .

习题 6.6-7

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自泊松分布 $P (λ)$ 的样本，证明： $λ$ 的近似 $1 - α$ 置信区间为
$\overset{x}{ˉ} + \frac{1}{2 n} u_{1 - α /2}^{2} - \frac{1}{2} (2 \overset{x}{ˉ} + \frac{1}{n} u_{1 - α /2}^{2})^{2} - 4 \overset{x}{ˉ}^{2}, \overset{x}{ˉ} + \frac{1}{2 n} u_{1 - α /2}^{2} + \frac{1}{2} (2 \overset{x}{ˉ} + \frac{1}{n} u_{1 - α /2}^{2})^{2} - 4 \overset{x}{ˉ}^{2} .$

解由中心极限定理知，当样本量 $n$ 较大时，样本均值 $\overset{x}{ˉ}$ 近似服从

N (λ, \frac{λ}{n}),

因而

u = \frac{x ˉ - λ}{λ / n}

近似服从 $N (0, 1)$ ，此 $u$ 可作为枢轴量。对给定 $α$ ，利用标准正态分布的 $1 - α /2$ 分位数 $u_{1 - α /2}$ 可得

P (\frac{x ˉ - λ}{λ / n} \leq u_{1 - α /2}) \approx 1 - α .

括号里的事件等价于

(\overset{x}{ˉ} - λ)^{2} \leq \frac{u _{1 - α /2}^{2}}{n} λ,

因而得

λ^{2} - (2 \overset{x}{ˉ} + \frac{u _{1 - α /2}^{2}}{n}) λ + \overset{x}{ˉ}^{2} \leq 0.

其左侧 $λ$ 的二次多项式二次项系数为正，故二次曲线开口向上，而其判别式

(2 \overset{x}{ˉ} + \frac{u _{1 - α /2}^{2}}{n})^{2} - 4 \overset{x}{ˉ}^{2} = \frac{4 x ˉ u _{1 - α /2}^{2}}{n} + (\frac{u _{1 - α /2}^{2}}{n})^{2} > 0,

故此二次曲线与 $λ$ 轴有两个交点，记为 $λ_{L}$ 和 $λ_{U}$ （ $λ_{L} < λ_{U}$ ），则有

P (λ_{L} \leq λ \leq λ_{U}) = 1 - α,

其中 $λ_{L}$ 和 $λ_{U}$ 可表示为

\frac{2 x ˉ + \frac{1}{n} u _{1 - α /2}^{2} \pm ( 2 x ˉ + \frac{1}{n} u _{1 - α /2}^{2} ) ^{2} - 4 x ˉ ^{2}}{2} .

这就证明了 $λ$ 的近似 $1 - α$ 置信区间为

\overset{x}{ˉ} + \frac{1}{2 n} u_{1 - α /2}^{2} - \frac{1}{2} (2 \overset{x}{ˉ} + \frac{1}{n} u_{1 - α /2}^{2})^{2} - 4 \overset{x}{ˉ}^{2}, \overset{x}{ˉ} + \frac{1}{2 n} u_{1 - α /2}^{2} + \frac{1}{2} (2 \overset{x}{ˉ} + \frac{1}{n} u_{1 - α /2}^{2})^{2} - 4 \overset{x}{ˉ}^{2} .

事实上，上述近似区间是在 $n$ 比较大时使用的，此时有

\frac{1}{2 n} u_{1 - α /2}^{2} \approx 0, \frac{1}{2} (2 \overset{x}{ˉ} + \frac{1}{n} u_{1 - α /2}^{2})^{2} - 4 \overset{x}{ˉ}^{2} \approx u_{1 - α /2} \frac{x ˉ}{n} .

于是， $λ$ 的近似 $1 - α$ 置信区间可进一步简化为

[\overset{x}{ˉ} - u_{1 - α /2} \frac{x ˉ}{n}, \overset{x}{ˉ} + u_{1 - α /2} \frac{x ˉ}{n}] .

习题 6.6-8

某商店某种商品的月销售量服从泊松分布，为合理进货，必须了解销售情况。现记录了该商店过去的一些销售量，数据如下：
$月销售量月份数 9110611131212139144152161$
试求平均月销售量的置信水平为 $0.95$ 的置信区间。

解平均月销售量

\overset{x}{ˉ} = \frac{\sum _{i = 1}^{8} n _{i} x _{i}}{\sum _{i = 1}^{8} n _{i}} = \frac{575}{48} = 11.9792.

此处 $α = 0.05$ ， $u_{1 - α /2} = 1.96$ ， $n = 48$ 较大，利用上一题的结果，平均月销售量的近似 $0.95$ 置信区间为

[11.9792 - 1.96 \frac{11.9792}{48}, 11.9792 + 1.96 \frac{11.9792}{48}] = [11.0000, 12.9584] .

若用较为精确的近似公式，得置信区间为

[11.0392, 12.9992],

二者相差不大。

习题 6.6-9

设从总体 $X \sim N (μ_{1}, σ_{1}^{2})$ 和总体 $Y \sim N (μ_{2}, σ_{2}^{2})$ 中分别抽取容量为 $n_{1} = 10$ ， $n_{2} = 15$ 的独立样本，可计算得
$\overset{x}{ˉ} = 82, s_{x}^{2} = 56.5, \overset{y}{ˉ} = 76, s_{y}^{2} = 52.4.$
(1) 若已知 $σ_{1}^{2} = 64$ ， $σ_{2}^{2} = 49$ ，求 $μ_{1} - μ_{2}$ 的置信水平为 $95%$ 的置信区间；

(2) 若已知 $σ_{1}^{2} = σ_{2}^{2}$ ，求 $μ_{1} - μ_{2}$ 的置信水平为 $95%$ 的置信区间；

(3) 若对 $σ_{1}^{2}, σ_{2}^{2}$ 一无所知，求 $μ_{1} - μ_{2}$ 的置信水平为 $95%$ 的近似置信区间；

(4) 求 $σ_{1}^{2} / σ_{2}^{2}$ 的置信水平为 $95%$ 的置信区间。

解 (1) 在 $σ_{1}^{2}, σ_{2}^{2}$ 都已知时， $μ_{1} - μ_{2}$ 的置信水平为 $1 - α$ 的置信区间为

\overset{x}{ˉ} - \overset{y}{ˉ} - u_{1 - α /2} \frac{σ _{1}^{2}}{n _{1}} + \frac{σ _{2}^{2}}{n _{2}}, \overset{x}{ˉ} - \overset{y}{ˉ} + u_{1 - α /2} \frac{σ _{1}^{2}}{n _{1}} + \frac{σ _{2}^{2}}{n _{2}} .

经计算 $\overset{x}{ˉ} - \overset{y}{ˉ} = 6$ ，查表得 $u_{0.975} = 1.96$ ，因而 $μ_{1} - μ_{2}$ 的置信水平为 $95%$ 的置信区间为

[6 - 1.96 \frac{64}{10} + \frac{49}{15}, 6 + 1.96 \frac{64}{10} + \frac{49}{15}] = [- 0.0939, 12.0939] .

(2) 当 $σ_{1}^{2} = σ_{2}^{2}$ 时， $μ_{1} - μ_{2}$ 的置信水平为 $1 - α$ 的置信区间为

[\overset{x}{ˉ} - \overset{y}{ˉ} - \frac{n _{1} + n _{2}}{n _{1} n _{2}} s_{w} t_{1 - α /2} (n_{1} + n_{2} - 2), \overset{x}{ˉ} - \overset{y}{ˉ} + \frac{n _{1} + n _{2}}{n _{1} n _{2}} s_{w} t_{1 - α /2} (n_{1} + n_{2} - 2)] .

这里

s_{w}^{2} = \frac{( n _{1} - 1 ) s _{x}^{2} + ( n _{2} - 1 ) s _{y}^{2}}{n _{1} + n _{2} - 2} = \frac{9 \times 56.5 + 14 \times 52.4}{23} = 54.0043,

而 $t_{0.975} (23) = 2.0687$ ，因而 $μ_{1} - μ_{2}$ 的置信水平为 $95%$ 的置信区间为

[82 - 76 - 2.0687 54.0043 \frac{10 + 15}{10 \times 15}, 82 - 76 + 2.0687 54.0043 \frac{10 + 15}{10 \times 15}] = [- 0.2063, 12.2063] .

(3) 当 $σ_{1}^{2}, σ_{2}^{2}$ 未知时，由于两个样本量不是很大，故可采用一般场合下的近似置信区间，即 $μ_{1} - μ_{2}$ 的置信水平为 $1 - α$ 的近似置信区间为

[\overset{x}{ˉ} - \overset{y}{ˉ} - s_{0} t_{1 - α /2} (l), \overset{x}{ˉ} - \overset{y}{ˉ} + s_{0} t_{1 - α /2} (l)] .

这里

s_{0}^{2} = \frac{s _{x}^{2}}{n _{1}} + \frac{s _{y}^{2}}{n _{2}} = \frac{56.5}{10} + \frac{52.4}{15} = 9.1433,

l = \frac{s _{0}^{4}}{\frac{s _{x}^{4}}{n _{1}^{2} ( n _{1} - 1 )} + \frac{s _{y}^{4}}{n _{2}^{2} ( n _{2} - 1 )}} = \frac{9.143 3 ^{2}}{\frac{56. 5 ^{2}}{900} + \frac{52. 4 ^{2}}{3150}} = 18.9199 \approx 19.

又查表得 $t_{0.975} (19) = 2.0930$ ，因而 $μ_{1} - μ_{2}$ 的置信水平为 $95%$ 的近似置信区间为

[82 - 76 - 2.0930 9.1433, 82 - 76 + 2.0930 9.1433] = [- 0.3288, 12.3288] .

(4) $σ_{1}^{2} / σ_{2}^{2}$ 的置信水平为 $1 - α$ 的置信区间为

[\frac{s _{x}^{2}}{s _{y}^{2}} \cdot \frac{1}{F _{1 - α /2} ( n _{1} - 1 , n _{2} - 1 )}, \frac{s _{x}^{2}}{s _{y}^{2}} \cdot \frac{1}{F _{α /2} ( n _{1} - 1 , n _{2} - 1 )}] .

查表得

F_{0.975} (9, 14) = 3.21, F_{0.025} (9, 14) = \frac{1}{F _{0.975} ( 14 , 9 )} = \frac{1}{3.80},

因而 $σ_{1}^{2} / σ_{2}^{2}$ 的置信水平为 $95%$ 的置信区间为

[\frac{56.5}{52.4} \cdot \frac{1}{3.21}, \frac{56.5}{52.4} \cdot 3.80] = [0.3359, 4.0973] .

习题 6.6-10

假设人体身高服从正态分布，今抽测甲、乙两地区 $18$ 岁至 $25$ 岁女青年身高得数据如下：甲地区抽取 $10$ 名，样本均值 $1.64 m$ ，样本标准差 $0.2 m$ ；乙地区抽取 $10$ 名，样本均值 $1.62 m$ ，样本标准差 $0.4 m$ 。求：

(1) 两正态总体方差比的置信水平为 $95%$ 的置信区间；

(2) 两正态总体均值差的置信水平为 $95%$ 的置信区间。

解设 $x_{1}, x_{2}, \dots, x_{10}$ 为甲地区抽取的女青年身高， $y_{1}, y_{2}, \dots, y_{10}$ 为乙地区抽取的女青年身高，由题设条件，

\overset{x}{ˉ} = 1.64, s_{x} = 0.2, \overset{y}{ˉ} = 1.62, s_{y} = 0.4.

(1) $σ_{甲}^{2} / σ_{乙}^{2}$ 的置信水平为 $1 - α$ 的置信区间为

[\frac{s _{x}^{2}}{s _{y}^{2}} \cdot \frac{1}{F _{1 - α /2} ( m - 1 , n - 1 )}, \frac{s _{x}^{2}}{s _{y}^{2}} \cdot \frac{1}{F _{α /2} ( m - 1 , n - 1 )}] .

此处 $α = 0.05$ ， $m = n = 10$ ，查表得

F_{0.975} (9, 9) = 4.03, F_{0.025} (9, 9) = \frac{1}{F _{0.975} ( 9 , 9 )} = \frac{1}{4.03},

由此， $σ_{甲}^{2} / σ_{乙}^{2}$ 的置信水平为 $95%$ 的置信区间为

[\frac{0. 2 ^{2}}{0. 4 ^{2}} \cdot \frac{1}{4.03}, \frac{0. 2 ^{2}}{0. 4 ^{2}} \cdot 4.03] = [0.0620, 1.0075] .

(2) 由 (1)， $σ_{甲}^{2} / σ_{乙}^{2}$ 的置信水平为 $95%$ 的置信区间包含 $1$ ，因此有一定理由假定两个正态总体的方差相等，此时

s_{w}^{2} = \frac{( m - 1 ) s _{x}^{2} + ( n - 1 ) s _{y}^{2}}{m + n - 2} = \frac{9 \times 0. 2 ^{2} + 9 \times 0. 4 ^{2}}{10 + 10 - 2} = \frac{1.8}{18} = 0.1.

查表得 $t_{0.975} (18) = 2.1009$ ，故两正态总体均值差的置信水平为 $95%$ 的置信区间为

[1.64 - 1.62 - 2.1009 0.1 \frac{10 + 10}{10 \times 10}, 1.64 - 1.62 + 2.1009 0.1 \frac{10 + 10}{10 \times 10}] = [- 0.2771, 0.3171] .

还有另一种解法就是不对方差相等作假定，而采用近似方法求均值差的置信区间，由于

s_{0}^{2} = \frac{s _{x}^{2}}{m} + \frac{s _{y}^{2}}{n} = \frac{0.04}{10} + \frac{0.16}{10} = 0.02, l = \frac{0.0 2 ^{2}}{\frac{0.0 4 ^{2}}{900} + \frac{0.1 6 ^{2}}{900}} = 13,

查表知 $t_{0.975} (13) = 2.1604$ ，从而两正态总体均值差的置信水平为 $95%$ 的近似置信区间为

[1.64 - 1.62 - 2.1604 0.02, 1.64 - 1.62 + 2.1604 0.02] = [- 0.2855, 0.3255] .

这两个置信区间相差不算太小，所以在应用中条件“方差相等”是否成立是要加以考证的。

习题 6.6-11

设总体 $X$ 的密度函数为
$p (x, λ) = λ e^{- λ x} I_{{x > 0}},$
其中 $λ > 0$ 为未知参数， $x_{1}, x_{2}, \dots, x_{n}$ 为抽自此总体的简单随机样本，求 $λ$ 的置信水平为 $1 - α$ 的置信区间。

解由指数分布和伽马分布的关系知

i = 1 \sum n x_{i} \sim G a (n, λ),

根据伽马分布的性质，

2 λ i = 1 \sum n x_{i} \sim G a (n, \frac{1}{2}) = χ^{2} (2 n) .

从而，

P (χ_{α /2}^{2} (2 n) \leq 2 λ i = 1 \sum n x_{i} \leq χ_{1 - α /2}^{2} (2 n)) = 1 - α,

因此可得 $λ$ 的置信水平为 $1 - α$ 的置信区间为

[\frac{χ _{α /2}^{2} ( 2 n )}{2 n x ˉ}, \frac{χ _{1 - α /2}^{2} ( 2 n )}{2 n x ˉ}] .

习题 6.6-12

设某电子产品的寿命服从指数分布，其密度函数为
$λ e^{- λ x} I_{{x > 0}},$
现从此批产品中抽取容量为 $9$ 的样本，测得寿命（单位：千时）
$15, 45, 50, 53, 60, 65, 70, 83, 90,$
求平均寿命 $1/ λ$ 的置信水平为 $0.9$ 的置信区间和置信上、下限。

解这是上题的一个具体应用。计算得

2 n \overset{x}{ˉ} = 1062,

查表可得，

χ_{0.05}^{2} (18) = 9.3905, χ_{0.1}^{2} (18) = 10.8649, χ_{0.9}^{2} (18) = 25.9894, χ_{0.95}^{2} (18) = 28.8693.

根据上题结论可知， $λ$ 的置信水平为 $0.9$ 的置信区间为

[0.0088, 0.0272],

单侧置信上限为 $0.0245$ ，单侧置信下限为 $0.0102$ 。所以，平均寿命 $1/ λ$ 的置信水平为 $0.9$ 的置信区间为

[36.76, 113.64],

单侧置信上限为 $98.04$ ，单侧置信下限为 $40.82$ 。

习题 6.6-13

设总体 $X$ 的密度函数为
$p (x, θ) = \frac{1}{π [ 1 + ( x - θ ) ^{2} ]}, - \infty < x < \infty, - \infty < θ < \infty,$
$x_{1}, x_{2}, \dots, x_{n}$ 为抽自此总体的简单随机样本，求位置参数 $θ$ 的置信水平近似为 $1 - α$ 的置信区间。

解由于此柯西分布关于 $θ$ 对称，故 $θ$ 是总体中位数。其样本中位数

m_{0.5} \sim N (θ, \frac{π ^{2}}{4 n}),

所以

P (- u_{1 - α /2} \leq \frac{2 n ( m _{0.5} - θ )}{π} \leq u_{1 - α /2}) \approx 1 - α,

从而可知位置参数 $θ$ 的置信水平近似为 $1 - α$ 的置信区间为

[m_{0.5} - \frac{π}{2 n} u_{1 - α /2}, m_{0.5} + \frac{π}{2 n} u_{1 - α /2}] .

习题 6.6-14

设 $x_{1}, x_{2}, \dots, x_{n}$ 为抽自正态总体 $N (μ, 16)$ 的简单随机样本，为使得 $μ$ 的置信水平为 $1 - α$ 的置信区间的长度不大于给定的 $L$ ，试问样本容量 $n$ 至少要多少？

解 $μ$ 的置信水平为 $1 - α$ 的置信区间为

[\overset{x}{ˉ} - u_{1 - α /2} \frac{4}{n}, \overset{x}{ˉ} + u_{1 - α /2} \frac{4}{n}],

对应的区间长度为

u_{1 - α /2} \frac{8}{n} .

令

u_{1 - α /2} \frac{8}{n} \leq L,

得

n \geq u_{1 - α /2}^{2} \frac{64}{L ^{2}} .

因此，样本容量 $n$ 至少为

u_{1 - α /2}^{2} \frac{64}{L ^{2}} .

习题 6.6-15

设 $x_{1}, x_{2}, \dots, x_{n}$ 为抽自正态总体 $N (μ, σ^{2})$ 的简单随机样本。试证
$\frac{x ˉ - ( μ + k σ )}{[ \sum _{i = 1}^{n} ( x _{i} - x ˉ ) ^{2} ] ^{1/2}}$
为枢轴量，其中 $k$ 为已知常数。

解因为

\frac{x ˉ - ( μ + k σ )}{σ} \sim N (- k, \frac{1}{n}), \frac{1}{σ ^{2}} i = 1 \sum n (x_{i} - \overset{x}{ˉ})^{2} \sim χ^{2} (n - 1),

故

\frac{\frac{x ˉ - ( μ + k σ )}{σ}}{[ \frac{1}{σ ^{2} ( n - 1 )} \sum _{i = 1}^{n} ( x _{i} - x ˉ ) ^{2} ] ^{1/2}} \sim t (n - 1, δ),

其中 $t (n - 1, δ)$ 是自由度为 $n - 1$ 的非中心 $t$ 分布，其非中心参数 $δ = - k n$ 为已知常数。又

\frac{x ˉ - ( μ + k σ )}{[ \sum _{i = 1}^{n} ( x _{i} - x ˉ ) ^{2} ] ^{1/2}} = \frac{\frac{x ˉ - ( μ + k σ )}{σ}}{[ \frac{1}{σ ^{2}} \sum _{i = 1}^{n} ( x _{i} - x ˉ ) ^{2} ] ^{1/2}},

所以

\frac{x ˉ - ( μ + k σ )}{[ \sum _{i = 1}^{n} ( x _{i} - x ˉ ) ^{2} ] ^{1/2}}

的分布与 $(μ, σ^{2})$ 无关，即为枢轴量。

习题 6.6-16

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自
$U (θ - \frac{1}{2}, θ + \frac{1}{2})$
的样本，求 $θ$ 的置信水平为 $1 - α$ 的置信区间（提示：证明 $\frac{x _{(n)} + x _{(1)}}{2} - θ$ 为枢轴量，并求出对应的密度函数）。

解本题是下一题 (2) 的特殊情形，此处过程从略，答案为

[\frac{x _{(n)} + x _{(1)}}{2} - \frac{1 - α ^{1/ n}}{2}, \frac{x _{(n)} + x _{(1)}}{2} + \frac{1 - α ^{1/ n}}{2}] .

习题 6.6-17

设 $x_{1}, x_{2}, \dots, x_{n}$ 为抽自均匀分布 $U (θ_{1}, θ_{2})$ 的简单随机样本，记
$x_{(1)} \leq x_{(2)} \leq \dots \leq x_{(n)}$
为其次序统计量。求：

(1) $θ_{2} - θ_{1}$ 的置信水平为 $1 - α$ 的置信区间；

(2) $\frac{θ _{2} + θ _{1}}{2}$ 的置信水平为 $1 - α$ 的置信区间。

解 (1) 令

y_{i} = \frac{x _{i} - θ _{1}}{θ _{2} - θ _{1}}, i = 1, 2, \dots, n,

则 $y_{1}, y_{2}, \dots, y_{n}$ 独立同分布于 $U (0, 1)$ 。由教材例 5.3.9 可知，

y_{(n)} - y_{(1)} \sim B e (n - 1, 2),

所以，

P (B e_{α /2} (n - 1, 2) \leq y_{(n)} - y_{(1)} \leq B e_{1 - α /2} (n - 1, 2)) = 1 - α,

这里 $B e_{p} (n - 1, 2)$ 表示 $B e (n - 1, 2)$ 的 $p$ 分位数。从而， $θ_{2} - θ_{1}$ 的置信水平为 $1 - α$ 的置信区间为

[\frac{x _{(n)} - x _{(1)}}{B e _{1 - α /2} ( n - 1 , 2 )}, \frac{x _{(n)} - x _{(1)}}{B e _{α /2} ( n - 1 , 2 )}] .

(2) 令

u = \frac{( x _{(n)} + x _{(1)} ) - ( θ _{2} + θ _{1} )}{x _{(n)} - x _{(1)}}, v = x_{(n)} - x_{(1)},

则

⎩ ⎨ ⎧ x_{(1)} x_{(n)} = \frac{uv - v + θ _{1} + θ _{2}}{2}, = \frac{uv + v + θ _{1} + θ _{2}}{2},

且

J = \frac{\partial ( x _{(1)} , x _{(n)} )}{\partial ( u , v )} = v /2 v /2 (u - 1) /2 (u + 1) /2 = \frac{v}{2} .

$(x_{(1)}, x_{(n)})$ 的联合密度函数为

f (x_{(1)}, x_{(n)}; θ_{1}, θ_{2}) = \frac{n ( n - 1 )}{( θ _{2} - θ _{1} ) ^{n}} (x_{(n)} - x_{(1)})^{n - 2}, θ_{1} < x_{(1)} \leq x_{(n)} < θ_{2},

所以， $(u, v)$ 的联合密度函数为

g (u, v; θ_{1}, θ_{2}) = \frac{n ( n - 1 )}{2 ( θ _{2} - θ _{1} ) ^{n}} v^{n - 1},

并且

θ_{1} < \frac{uv - v + θ _{1} + θ _{2}}{2} \leq \frac{uv + v + θ _{1} + θ _{2}}{2} < θ_{2} .

由于

{(u, v) : θ_{1} < \frac{uv - v + θ _{1} + θ _{2}}{2} \leq \frac{uv + v + θ _{1} + θ _{2}}{2} < θ_{2}} = {(u, v) : θ_{1} - θ_{2} < uv - v \leq uv + v < θ_{2} - θ_{1}},

下面讨论在 $u$ 给定后 $v$ 的取值范围，显然有 $v > 0$ ，故主要是确定 $v$ 的上界。若 $u \geq 0$ ，则上式给出

v < \frac{θ _{2} - θ _{1}}{1 + u},

而若 $u < 0$ ，则上式给出

v < \frac{θ _{2} - θ _{1}}{1 - u},

从而 $u$ 的密度函数为

h (u) = I_{{u \geq 0}} \int_{0}^{(θ_{2} - θ_{1}) / (1 + u)} \frac{n ( n - 1 )}{2 ( θ _{2} - θ _{1} ) ^{n}} v^{n - 1} d v + I_{{u < 0}} \int_{0}^{(θ_{2} - θ_{1}) / (1 - u)} \frac{n ( n - 1 )}{2 ( θ _{2} - θ _{1} ) ^{n}} v^{n - 1} d v = \frac{n - 1}{2 ( 1 + ∣ u ∣ ) ^{n}} .

注意到该密度函数是对称的，对任意给定的 $c > 0$ ，有

P (∣ u ∣ \leq c) = \int_{0}^{c} \frac{n - 1}{( 1 + u ) ^{n}} d u = 1 - (1 + c)^{- (n - 1)} .

取

c_{0} = α^{- \frac{1}{n - 1}} - 1,

则

P (- c_{0} \leq u \leq c_{0}) = 1 - α,

即

P (- c_{0} \leq \frac{[( x _{(n)} + x _{(1)} ) - ( θ _{2} + θ _{1} )]}{x _{(n)} - x _{(1)}} \leq c_{0}) = 1 - α,

因此， $\frac{θ _{2} + θ _{1}}{2}$ 的置信水平为 $1 - α$ 的置信区间为

[\frac{x _{(n)} + x _{(1)}}{2} - \frac{c _{0} ( x _{(n)} - x _{(1)} )}{2}, \frac{x _{(n)} + x _{(1)}}{2} + \frac{c _{0} ( x _{(n)} - x _{(1)} )}{2}] .

习题 6.6-18

设 $x_{1}, x_{2}, \dots, x_{m}$ 独立同分布于 $U (0, θ_{1})$ ， $y_{1}, y_{2}, \dots, y_{n}$ 独立同分布于 $U (0, θ_{2})$ ， $θ_{1} > 0, θ_{2} > 0$ 皆未知，且两样本独立，求 $θ_{1} / θ_{2}$ 的一个置信水平为 $1 - α$ 的置信区间（提示：令 $T_{1} = x_{(m)}$ ， $T_{2} = y_{(n)}$ ，证明 $\frac{T _{2}}{T _{1}} \cdot \frac{θ _{1}}{θ _{2}}$ 的分布与 $θ_{1}, θ_{2}$ 无关，并求出对应的密度函数）。

解记

T_{1} = x_{(m)}, T_{2} = y_{(n)},

则

X = \frac{T _{1}}{θ _{1}} \sim B e (m, 1), Y = \frac{T _{2}}{θ _{2}} \sim B e (n, 1),

故

T = \frac{X}{Y} = \frac{T _{1} / θ _{1}}{T _{2} / θ _{2}} = \frac{T _{1}}{T _{2}} \cdot \frac{θ _{2}}{θ _{1}}

的分布完全已知，可作为枢轴量。下求 $T$ 的分布。

利用商的公式，只是要注意 $y$ 的积分范围。此处变量取值范围为

0 < x < 1, 0 < y < 1,

即

0 < t y < 1, 0 < y < 1.

故当 $t \in (0, 1)$ 时， $0 < y < 1$ ，有

p (t) = \int_{0}^{1} m (y t)^{m - 1} n y^{n - 1} \cdot y d y = \frac{mn}{m + n} t^{m - 1} .

而当 $t \geq 1$ 时， $0 < y < 1/ t$ ，

p (t) = \int_{0}^{1/ t} m (y t)^{m - 1} n y^{n - 1} \cdot y d y = \frac{mn}{m + n} t^{- n - 1} .

由此可写出其分布函数（更加简洁），为

F (t) = ⎩ ⎨ ⎧ \frac{n}{m + n} t^{m}, 1 - \frac{m}{m + n} t^{- n}, 0 < t < 1, t \geq 1.

对给定的充分小的 $α$ ，由上式不难给出两个分位数，如取

t_{1} = (\frac{m + n}{n} \frac{α}{2})^{1/ m}, t_{2} = (\frac{m + n}{m} \frac{α}{2})^{- 1/ n},

则

P (t_{1} \leq T \leq t_{2}) = 1 - α,

于是给出了 $θ_{1} / θ_{2}$ 的一个置信水平为 $1 - α$ 的置信区间为

[\frac{x _{(m)}}{y _{(n)}} (\frac{m + n}{m} \frac{α}{2})^{1/ n}, \frac{x _{(m)}}{y _{(n)}} (\frac{m + n}{n} \frac{α}{2})^{- 1/ m}] .

习题 6.6-19

设总体 $X$ 的密度函数为
$p (x, θ) = e^{- (x - θ)} I_{{x > θ}}, - \infty < θ < \infty,$
$x_{1}, x_{2}, \dots, x_{n}$ 为抽自此总体的简单随机样本。

(1) 证明： $x_{(1)} - θ$ 的分布与 $θ$ 无关，并求出此分布；

(2) 求 $θ$ 的置信水平为 $1 - α$ 的置信区间。

解 (1) 令

y_{i} = x_{i} - θ, i = 1, 2, \dots, n,

则 $y_{1}, y_{2}, \dots, y_{n}$ 独立同分布于 $E x p (1)$ ， $y_{(1)}$ 的密度函数为

g (y) = n e^{- n y}, y > 0,

即 $x_{(1)} - θ$ 的分布与 $θ$ 无关，其密度函数为

g (y) = n e^{- n y}, y > 0.

(2) 取 $c, d$ 使得

P (c \leq x_{(1)} - θ \leq d) = \int_{c}^{d} n e^{- n y} d y = 1 - α .

由于 $g (y) = n e^{- n y}$ 在 $y > 0$ 上单调递减，为使得区间长度最短，故应取 $c = 0$ ，从而求得

d = - \frac{ln α}{n} .

所以， $θ$ 的置信水平为 $1 - α$ 的置信区间为

[x_{(1)} + \frac{ln α}{n}, x_{(1)}] .

补充习题及解答

补充习题 20

随机选取 $9$ 发炮弹，测得炮弹的炮口速度的样本标准差 $s = 11 m/s$ ，若炮弹的炮口速度服从正态分布，求其标准差 $σ$ 的 $0.95$ 置信上限。

解在正态分布下，对样本方差 $s^{2}$ 有

\frac{8 s ^{2}}{σ ^{2}} \sim χ^{2} (8),

从而有

P (\frac{8 s ^{2}}{σ ^{2}} \geq χ_{α}^{2} (8)) = 1 - α .

等价地，

P (σ \leq \frac{8 s ^{2}}{χ _{α}^{2} ( 8 )}) = 1 - α,

故标准差 $σ$ 的 $1 - α$ 置信上限为

\overset{σ}{^}_{U} = \frac{8 s ^{2}}{χ _{α}^{2} ( 8 )} .

现 $α = 0.05$ ，查表知

χ_{0.05}^{2} (8) = 2.7326,

故标准差 $σ$ 的 $0.95$ 置信上限为

\overset{σ}{^}_{U} = \frac{8 \times 1 1 ^{2}}{2.7326} = 18.82.

补充习题 21

有两位化验员 $A$ 与 $B$ 独立地对一批聚合物含氯量用同样方法各进行 $10$ 次重复测定，其样本方差分别为 $s_{A}^{2} = 0.5419$ 与 $s_{B}^{2} = 0.6065$ ，若 $A$ 与 $B$ 的测量值都服从正态分布，求其方差比
$R = \frac{σ _{A}^{2}}{σ _{B}^{2}}$
的 $0.95$ 置信上限。

解在正态分布下，两样本方差比服从 $F$ 分布，具体是

\frac{s _{A}^{2} / σ _{A}^{2}}{s _{B}^{2} / σ _{B}^{2}} = \frac{s _{A}^{2}}{s _{B}^{2}} \cdot \frac{σ _{B}^{2}}{σ _{A}^{2}} \sim F (9, 9) .

从而有

P (\frac{s _{A}^{2}}{s _{B}^{2}} \cdot \frac{σ _{B}^{2}}{σ _{A}^{2}} \geq F_{α} (9, 9)) = 1 - α,

即

P (R \leq \frac{s _{A}^{2} / s _{B}^{2}}{F _{α} ( 9 , 9 )}) = 1 - α,

故 $R$ 的 $1 - α$ 置信上限为

\hat{R}_{U} = \frac{s _{A}^{2} / s _{B}^{2}}{F _{α} ( 9 , 9 )} .

现 $α = 0.05$ ，查表知

F_{0.05} (9, 9) = \frac{1}{F _{0.95} ( 9 , 9 )} = \frac{1}{3.18},

故 $R$ 的 $1 - α$ 置信上限为

\hat{R}_{U} = \frac{s _{A}^{2} / s _{B}^{2}}{F _{0.05} ( 9 , 9 )} = \frac{0.5419}{0.6065} \times 3.18 = 2.84.

补充习题 22

为估计某台光谱仪测量材料中金属含量的测量误差，特置备了 $5$ 个金属试块，其成分、金属含量、均匀性都有差别，设每个试块的测量值都服从正态分布，现对每个试块重复测量 $6$ 次，计算得其样本标准差分别为
$s_{1} = 0.09, s_{2} = 0.11, s_{3} = 0.14, s_{4} = 0.10, s_{5} = 0.11,$
试求 $σ$ 的 $0.95$ 置信区间。

解从题意可知，这里 $s_{i}$ 可以看作来自正态总体 $N (μ_{i}, σ^{2})$ 的容量为 $n = 6$ 的样本标准差， $i = 1, 2, \dots, 5$ ，由此可知

(n - 1) \frac{s _{i}^{2}}{σ ^{2}} \sim χ^{2} (n - 1),

即

5 \frac{s _{i}^{2}}{σ ^{2}} \sim χ^{2} (5) .

由于各试块的测量可以为相互独立的，故有

i = 1 \sum 5 \frac{5 s _{i}^{2}}{σ ^{2}} \sim χ^{2} (5 \times 5) = χ^{2} (25),

从而

P (χ_{α /2}^{2} (25) \leq \frac{1}{σ ^{2}} i = 1 \sum 5 5 s_{i}^{2} \leq χ_{1 - α /2}^{2} (25)) = 1 - α,

即

P \frac{5}{χ _{1 - α /2}^{2} ( 25 )} i = 1 \sum 5 s_{i}^{2} \leq σ \leq \frac{5}{χ _{α /2}^{2} ( 25 )} i = 1 \sum 5 s_{i}^{2} = 1 - α .

故 $σ$ 的 $1 - α$ 置信区间为

\frac{5}{χ _{1 - α /2}^{2} ( 25 )} i = 1 \sum 5 s_{i}^{2}, \frac{5}{χ _{α /2}^{2} ( 25 )} i = 1 \sum 5 s_{i}^{2} .

现算出

i = 1 \sum 5 s_{i}^{2} = 0.0619.

对 $α = 0.05$ ，查表知

χ_{0.025}^{2} (25) = 13.1197, χ_{0.975}^{2} (25) = 40.6465,

代入可算得 $σ$ 的 $0.95$ 置信区间为

[\frac{5 \times 0.0619}{40.6465}, \frac{5 \times 0.0619}{13.1197}] = [0.0873, 0.1536] .

补充习题 23

为研究某型号汽车轮胎的磨耗，随机选择 $16$ 只轮胎，每只轮胎行驶到磨坏为止，记录所行驶路程（单位：km）如下：
$41250401874317541010392654187242654412873897040200425504109540680435003977540400$
假设这些数据来自正态总体 $N (μ, σ^{2})$ ，其中 $μ, σ^{2}$ 未知，求 $μ$ 的置信水平为 $0.95$ 的单侧置信下限。

解先计算样本均值 $\overset{x}{ˉ}$ 与样本标准差 $s$ ，

\overset{x}{ˉ} = 41116.9, s = 1346.84.

利用 $σ$ 未知场合的 $μ$ 的单侧置信下限

\overset{μ}{^}_{L} = \overset{x}{ˉ} - t_{1 - α} (n - 1) \frac{s}{n},

这里 $n = 16$ ， $t_{0.95} (15) = 1.7531$ ，代入可得

\overset{μ}{^}_{L} = 41116.9 - 1.7531 \times \frac{1346.84}{16} = 40526.6 (km) .

补充习题 24

有一位市场调查员，他感兴趣的是该地区成年人中将购买某种产品的比例 $θ$ （即该商品的市场占有率）。现他要事先确定需要访问多少顾客（样本量 $n = ?$ ）才能使 $[\overset{x}{ˉ} - d, \overset{x}{ˉ} + d]$ 是 $θ$ 的置信水平为 $0.95$ 的置信区间，其中 $\overset{x}{ˉ}$ 是样本中购买此种商品的顾客的比例， $d$ 是事先给定的常数。假如事先知道 $θ \leq 1/4$ ，结果又是如何？

解对第一个问题，教科书中例 6.6.8 对类似的问题进行了讨论，给出了一种解法，此处我们换一种思路对该问题进行讨论。

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自二点分布 $b (1, θ)$ 的一个样本， $\overset{x}{ˉ}$ 就是样本中购买此种商品的顾客的比例，由中心极限定理知，当 $n$ 较大时，

\frac{n ( x ˉ - θ )}{θ ( 1 - θ )} \approx N (0, 1) .

在 $θ$ 未知时，有

θ (1 - θ) \leq \frac{1}{4},

从而

P (\frac{n ( x ˉ - θ )}{1/4} < u_{1 - α /2}) \geq P (\frac{n ( x ˉ - θ )}{θ ( 1 - θ )} < u_{1 - α /2}) = 1 - α,

即

P (\overset{x}{ˉ} - \frac{u _{1 - α /2}}{2 n} \leq θ \leq \overset{x}{ˉ} + \frac{u _{1 - α /2}}{2 n}) \geq 1 - α .

这说明

[\overset{x}{ˉ} - \frac{u _{1 - α /2}}{2 n}, \overset{x}{ˉ} + \frac{u _{1 - α /2}}{2 n}]

是 $θ$ 的置信水平 $1 - α$ 的置信区间。要求该置信区间的长度不超过 $2 d$ ，即得

2 u_{1 - α /2} / (2 n) \leq 2 d,

或

n \geq (\frac{u _{1 - α /2}}{2 d})^{2} .

若 $α = 0.05$ ， $u_{0.975} = 1.96$ ，当 $d = 0.01, 0.02, 0.03$ 时可分别算得

n \geq 9604, 2401, 1067.

样本量随 $d$ 的增加（精度减小）迅速降低。

对第二个问题，当已知 $θ \leq θ_{0}$ （ $θ_{0} < 1/2$ ）（或已知 $θ \geq θ_{0}$ （ $θ_{0} > 1/2$ ），处理方法完全一样）时，由于

f (θ) = θ (1 - θ)

在 $(0, θ_{0})$ 是增函数，所以

θ (1 - θ) \leq θ_{0} (1 - θ_{0}),

从而

P (\frac{n ( x ˉ - θ )}{θ _{0} ( 1 - θ _{0} )} < u_{1 - α /2}) \geq P (\frac{n ( x ˉ - θ )}{θ ( 1 - θ )} < u_{1 - α /2}) = 1 - α .

这说明

[\overset{x}{ˉ} - u_{1 - α /2} \frac{θ _{0} ( 1 - θ _{0} )}{n}, \overset{x}{ˉ} + u_{1 - α /2} \frac{θ _{0} ( 1 - θ _{0} )}{n}]

是 $θ$ 的置信水平 $1 - α$ 的置信区间。类似地，要求该置信区间的长度不超过 $2 d$ ，即得

n \geq (\frac{u _{1 - α /2}}{d})^{2} θ_{0} (1 - θ_{0}) .

譬如，若已知 $θ \leq 1/4$ （即 $θ_{0} = 1/4$ ），则

θ_{0} (1 - θ_{0}) = \frac{3}{16},

于是关于样本量的要求化为

n \geq (\frac{u _{1 - α /2}}{d})^{2} \frac{3}{16} .

仍取 $α = 0.05$ ，当 $d = 0.01, 0.02, 0.03$ 时分别算得

n \geq 7203, 1801, 800,

与 $θ$ 完全未知情况相比样本量约减少 $25%$ 。由此可见，若对 $θ$ 事先有若干信息可利用，得知市场占有率不会超过 $θ_{0}$ ，那么就应利用这个信息，减少样本量，也即减少调查费用。

群知识库

AI 找笔记

Explorer

6.6 区间估计

§6.6 区间估计

依赖于

被以下题目直接调用

正文部分

§6.6 区间估计

习题与解答 6.6

补充习题及解答

评论

Graph View

目录

反向链接