§5.4 三大抽样分布

依赖于

无显式依赖

被以下题目直接调用

正文部分

§5.4 三大抽样分布

1. 三大抽样分布： $χ^{2}$ 分布， $F$ 分布， $t$ 分布

设 $x_{1}, x_{2}, \dots, x_{n}$ 和 $y_{1}, y_{2}, \dots, y_{m}$ 是来自标准正态分布的两个相互独立的样本，则此三个统计量的构造及其抽样分布如下表所示。

\small \renewcommand{\arraystretch}{1.45}

统计量的构造	抽样分布密度函数	期望	方差
$χ^{2} = x_{1}^{2} + x_{2}^{2} + \dots + x_{n}^{2}$	$p (y) = \frac{1}{Γ ( \frac{n}{2} ) 2 ^{n /2}} y^{\frac{n}{2} - 1} e^{- y /2}, (y > 0)$	$n$	$2 n$
$F = \frac{( y _{1}^{2} + y _{2}^{2} + \dots + y _{m}^{2} ) / m}{( x _{1}^{2} + x _{2}^{2} + \dots + x _{n}^{2} ) / n}$	$p (y) = \frac{Γ ( \frac{m + n}{2} ) ( \frac{m}{n} ) ^{m /2}}{Γ ( \frac{m}{2} ) Γ ( \frac{n}{2} )} y^{\frac{m}{2} - 1} (1 + \frac{m}{n} y)^{- \frac{m + n}{2}}$	$\frac{n}{n - 2}$ \newline $(n > 2)$	$\frac{2 n ^{2} ( m + n - 2 )}{m ( n - 2 ) ^{2} ( n - 4 )}$ \newline $(n > 4)$
$t = \frac{y _{1}}{( x _{1}^{2} + x _{2}^{2} + \dots + x _{n}^{2} ) / n}$	$p (y) = \frac{Γ ( \frac{n + 1}{2} )}{nπ Γ ( \frac{n}{2} )} (1 + \frac{y ^{2}}{n})^{- \frac{n + 1}{2}}, (- \infty < y < \infty)$	$0$ \newline $(n > 1)$	$\frac{n}{n - 2}$ \newline $(n > 2)$

正态总体参数的置信区间与假设检验大多将基于这三大抽样分布获得。

2. 一个重要定理

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自正态总体 $N (μ, σ^{2})$ 的一个样本，其样本均值和样本方差分别为

\overset{x}{ˉ} = \frac{1}{n} i = 1 \sum n x_{i}, s^{2} = \frac{1}{n - 1} i = 1 \sum n (x_{i} - \overset{x}{ˉ})^{2},

则有

$\overset{x}{ˉ}$ 与 $s^{2}$ 相互独立；
$\overset{x}{ˉ} \sim N (μ, σ^{2} / n)$ ；
$\frac{( n - 1 ) s ^{2}}{σ ^{2}} \sim χ^{2} (n - 1)$ 。

3. 两个重要推论

（1）设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自正态总体 $N (μ, σ^{2})$ 的样本，则有

t = \frac{n ( x ˉ - μ )}{s} \sim t (n - 1),

其中 $\overset{x}{ˉ}$ 为样本均值， $s$ 为样本标准差。

（2）设 $x_{1}, x_{2}, \dots, x_{m}$ 是来自 $N (μ_{1}, σ_{1}^{2})$ 的样本， $y_{1}, y_{2}, \dots, y_{n}$ 是来自 $N (μ_{2}, σ_{2}^{2})$ 的样本，且此两样本相互独立，则有

F = \frac{s _{x}^{2} / σ _{1}^{2}}{s _{y}^{2} / σ _{2}^{2}} \sim F (m - 1, n - 1),

其中 $s_{x}^{2}, s_{y}^{2}$ 分别是两个样本方差。若 $σ_{1}^{2} = σ_{2}^{2}$ ，则

F = \frac{s _{x}^{2}}{s _{y}^{2}} \sim F (m - 1, n - 1) .

4. 三个说明

$t (n)$ 分布的密度函数呈“中间高，两边低，左右对称”，与标准正态曲线类似，但峰比 $N (0, 1)$ 低，两侧尾部概率比 $N (0, 1)$ 大。当自由度 $n \to \infty$ 时， $t (n)$ 分布趋向 $N (0, 1)$ 分布；当 $n > 30$ 时，两者相差已不大，可用 $N (0, 1)$ 近似 $t (n)$ 分布。
关于 $t (n)$ 分布分位数有 $t_{α} (n) + t_{1 - α} (n) = 0$ （互为相反数）；关于 $F (m, n)$ 分布分位数有 $F_{α} (m, n) \cdot F_{1 - α} (n, m) = 1$ （互为倒数）。
$t^{2} (n) = F (1, n)$ 。

习题与解答 5.4

习题 5.4-1

在总体 $N (7.6, 4)$ 中抽取容量为 $n$ 的样本，如果要求样本均值落在 $(5.6, 9.6)$ 内的概率不小于 $0.95$ ，则 $n$ 至少为多少？

解样本均值 $\overset{x}{ˉ} \sim N (7.6, \frac{4}{n})$ ，按题意可建立如下不等式

P (5.6 < \overset{x}{ˉ} < 9.6) = P (\frac{5.6 - 7.6}{4/ n} < \frac{x ˉ - 7.6}{4/ n} < \frac{9.6 - 7.6}{4/ n}) \geq 0.95.

即

2Φ (n) - 1 \geq 0.95,

所以

Φ (n) \geq 0.975.

查表得 $Φ (1.96) = 0.975$ ，故 $n \geq 1.96$ ，或 $n \geq 3.84$ ，即样本量 $n$ 至少为 $4$ 。

习题 5.4-2

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自 $N (μ, 16)$ 的样本，问 $n$ 多大时才能使得
$P (∣ \overset{x}{ˉ} - μ ∣ < 1) \geq 0.95$
成立？

解样本均值

\overset{x}{ˉ} \sim N (μ, \frac{16}{n}),

因而

P (∣ \overset{x}{ˉ} - μ ∣ < 1) = P (\frac{x ˉ - μ}{16/ n} < \frac{1}{16/ n}) = 2Φ (\frac{n}{4}) - 1 \geq 0.95.

所以

Φ (\frac{n}{4}) \geq 0.975, \frac{n}{4} \geq 1.96.

这给出

n \geq 61.47,

即 $n$ 至少为 $62$ 时，上述概率不等式成立。

习题 5.4-3

由正态总体 $N (100, 4)$ 抽取两个独立样本，样本均值分别为 $\overset{x}{ˉ}, \overset{y}{ˉ}$ ，样本容量分别为 $15, 20$ ，试求
$P (∣ \overset{x}{ˉ} - \overset{y}{ˉ} ∣ > 0.2) .$

解由条件得

\overset{x}{ˉ} \sim N (100, \frac{4}{15}), \overset{y}{ˉ} \sim N (100, \frac{4}{20}),

且 $\overset{x}{ˉ}$ 和 $\overset{y}{ˉ}$ 相互独立，从而

\overset{x}{ˉ} - \overset{y}{ˉ} \sim N (0, \frac{4}{15} + \frac{4}{20}) = N (0, \frac{7}{15}) .

于是

P (∣ \overset{x}{ˉ} - \overset{y}{ˉ} ∣ > 0.2) = P (\frac{x ˉ - y ˉ}{7/15} > \frac{0.2}{7/15}) = 2 (1 - Φ (0.29)) = 0.7718.

习题 5.4-4

由正态总体 $N (μ, σ^{2})$ 抽取容量为 $20$ 的样本，试求
$P (10 σ^{2} \leq i = 1 \sum 20 (x_{i} - μ)^{2} \leq 30 σ^{2}) .$

解因为

x_{i} \sim N (μ, σ^{2}),

所以

\frac{x _{i} - μ}{σ} \sim N (0, 1), i = 1 \sum 20 \frac{( x _{i} - μ ) ^{2}}{σ ^{2}} \sim χ^{2} (20) .

用 $k_{20} (x)$ 表示服从 $χ^{2} (20)$ 的随机变量的分布函数，则

P (10 σ^{2} \leq i = 1 \sum 20 (x_{i} - μ)^{2} \leq 30 σ^{2}) = P (10 \leq i = 1 \sum 20 \frac{( x _{i} - μ ) ^{2}}{σ ^{2}} \leq 30) = k_{20} (30) - k_{20} (10) .

利用统计软件可计算上式。譬如，可使用 MATLAB 软件计算上式：在命令行输入 \texttt{chi2cdf(30,20)} 则给出 $0.9301$ ，输入 \texttt{chi2cdf(10,20)} 则给出 $0.0318$ ，直接输入 \texttt{chi2cdf(30,20)-chi2cdf(10,20)} 则一次性给出 $0.8983$ 。这里的 \texttt{chi2cdf(x,k)} 就表示自由度为 $k$ 的 $χ^{2}$ 分布在 $x$ 处的分布函数值。于是有

P (10 σ^{2} \leq i = 1 \sum 20 (x_{i} - μ)^{2} \leq 30 σ^{2}) = 0.8983.

习题 5.4-5

设 $x_{1}, x_{2}, \dots, x_{16}$ 是来自 $N (μ, σ^{2})$ 的样本，经计算 $\overset{x}{ˉ} = 9, s^{2} = 5.32$ ，试求
$P (∣ \overset{x}{ˉ} - μ ∣ < 0.6) .$

解因为

\frac{n ( x ˉ - μ )}{s} = \frac{( x ˉ - μ ) / ( σ / n )}{( n - 1 ) s ^{2} / σ ^{2} / ( n - 1 )} \sim t (n - 1),

用 $t_{15} (x)$ 表示服从 $t (15)$ 的随机变量的分布函数，注意到 $t$ 分布是对称的，故

P (∣ \overset{x}{ˉ} - μ ∣ < 0.6) = P (\frac{4∣ x ˉ - μ ∣}{s} < \frac{4 \times 0.6}{s}) = 2 t_{15} (1.0405) - 1.

利用统计软件可计算上式。譬如，使用 MATLAB 软件在命令行输入 \texttt{tcdf(1.0405,15)} 则给出 $0.8427$ ，直接输入 \texttt{2*tcdf(1.0405,15)-1} 则给出 $0.6854$ 。这里的 \texttt{tcdf(x,k)} 就表示自由度为 $k$ 的 $t$ 分布在 $x$ 处的分布函数值。于是有

P (∣ \overset{x}{ˉ} - μ ∣ < 0.6) = 2 \times 0.8427 - 1 = 0.6854.

习题 5.4-6

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自 $N (μ, 1)$ 的样本，试确定最大的常数 $c$ ，使得对任意的 $μ \geq 0$ ，有
$P (∣ \overset{x}{ˉ} ∣ < c) \leq α .$

解由于

\overset{x}{ˉ} \sim N (μ, \frac{1}{n}),

所以 $P (∣ \overset{x}{ˉ} ∣ < c)$ 的值依赖于 $μ$ ，它是 $μ$ 的函数，记为 $g (μ)$ ，于是

g (μ) = P_{μ} (∣ \overset{x}{ˉ} ∣ < c) = P (- c < \overset{x}{ˉ} < c) = Φ (n (c - μ)) - Φ (n (- c - μ)),

其导数为

g^{'} (μ) = - n [φ (n (c - μ)) - φ (n (- c - μ))],

其中 $φ (x)$ 表示 $N (0, 1)$ 的密度函数，由于 $c \geq 0, μ \geq 0$ ，故 $∣ - c - μ ∣ \geq ∣ c - μ ∣$ ，从而

φ (n (- c - μ)) \leq φ (n (c - μ)),

这说明 $g^{'} (μ) \leq 0$ ， $g (μ)$ 为减函数，并在 $μ = 0$ 处取最大值，即

μ \geq 0 max {Φ (n (c - μ)) - Φ (n (- c - μ))} = Φ (n c) - Φ (- n c) = 2Φ (n c) - 1.

于是，只要

2Φ (n c) - 1 \leq α,

即

(0 \leq) c \leq \frac{u _{(1 + α) /2}}{n},

就可保证对任意的 $μ \geq 0$ ，有

P (∣ \overset{x}{ˉ} ∣ < c) \leq α .

最大的常数为

c = \frac{u _{(1 + α) /2}}{n} .

习题 5.4-7

设随机变量 $X \sim F (n, n)$ ，证明 $P (X < 1) = 0.5$ 。

解证若随机变量 $X \sim F (n, n)$ ，则 $Y = 1/ X$ 也服从 $F (n, n)$ ，从而

P (X < 1) = P (Y < 1) = P (1/ X < 1) = P (X > 1) .

而

P (X < 1) + P (X > 1) = 1.

这就证明了

P (X < 1) = 0.5.

习题 5.4-8

设随机变量 $X \sim F (n, m)$ ，证明：
$Z = \frac{\frac{n}{m} X}{1 + \frac{n}{m} X}$
服从贝塔分布，并指出其参数。

解证若 $X \sim F (n, m)$ ，则 $X$ 的密度函数为

p_{X} (x) = \frac{Γ ( \frac{m + n}{2} ) ( \frac{n}{m} ) ^{n /2}}{Γ ( \frac{n}{2} ) Γ ( \frac{m}{2} )} x^{\frac{n}{2} - 1} (1 + \frac{n}{m} x)^{- \frac{m + n}{2}} .

由

z = \frac{n}{m} x / (1 + \frac{n}{m} x)

在 $(0, \infty)$ 上是严格单调增函数，其反函数为

x = \frac{m z}{n ( 1 - z )}, \frac{d x}{d z} = \frac{m}{n ( 1 - z ) ^{2}} .

故 $Z$ 的密度函数为

p_{Z} (z) = \frac{Γ ( \frac{m + n}{2} ) ( \frac{n}{m} ) ^{n /2}}{Γ ( \frac{n}{2} ) Γ ( \frac{m}{2} )} (\frac{m z}{n ( 1 - z )})^{\frac{n}{2} - 1} (1 + \frac{z}{1 - z})^{- \frac{m + n}{2}} \frac{m}{n ( 1 - z ) ^{2}} = \frac{Γ ( \frac{m + n}{2} )}{Γ ( \frac{n}{2} ) Γ ( \frac{m}{2} )} z^{\frac{n}{2} - 1} (1 - z)^{\frac{m}{2} - 1}, 0 < z < 1.

这说明

Z \sim B e (\frac{n}{2}, \frac{m}{2}),

其两个参数分别为 $F$ 分布两个自由度的一半。

习题 5.4-9

设 $x_{1}, x_{2}$ 是来自 $N (0, σ^{2})$ 的样本，试求
$Y = (\frac{x _{1} + x _{2}}{x _{1} - x _{2}})^{2}$
的分布。

解由条件，

x_{1} + x_{2} \sim N (0, 2 σ^{2}), x_{1} - x_{2} \sim N (0, 2 σ^{2}),

又

Cov (x_{1} + x_{2}, x_{1} - x_{2}) = Var (x_{1}) - Var (x_{2}) = 0,

且 $x_{1} + x_{2}$ 与 $x_{1} - x_{2}$ 服从二元正态分布，故 $x_{1} + x_{2}$ 与 $x_{1} - x_{2}$ 独立，于是

(\frac{x _{1} + x _{2}}{2 σ})^{2} \sim χ^{2} (1), (\frac{x _{1} - x _{2}}{2 σ})^{2} \sim χ^{2} (1),

从而

Y = (\frac{x _{1} + x _{2}}{x _{1} - x _{2}})^{2} = \frac{( ( x _{1} + x _{2} ) / 2 σ ) ^{2}}{( ( x _{1} - x _{2} ) / 2 σ ) ^{2}} \sim F (1, 1) .

习题 5.4-10

设总体为 $N (0, 1)$ ， $x_{1}, x_{2}$ 为样本，试求常数 $k$ ，使得
$P (\frac{( x _{1} + x _{2} ) ^{2}}{( x _{1} - x _{2} ) ^{2} + ( x _{1} + x _{2} ) ^{2}} > k) = 0.05.$

解由上题，

Y = (\frac{x _{1} + x _{2}}{x _{1} - x _{2}})^{2} \sim F (1, 1),

又令

Z = \frac{( x _{1} + x _{2} ) ^{2}}{( x _{1} - x _{2} ) ^{2} + ( x _{1} + x _{2} ) ^{2}} = \frac{Y}{1 + Y} .

由于 $Z$ 取值于 $(0, 1)$ ，故所需要求有 $0 < k < 1$ ，从而

P (Z > k) = P (\frac{Y}{1 + Y} > k) = P (Y > \frac{k}{1 - k}) = 0.05.

于是

\frac{k}{1 - k} = F_{0.95} (1, 1) = 161.45,

这给出

k = \frac{161.45}{1 + 161.45} = 0.9938.

习题 5.4-11

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自 $N (μ_{1}, σ^{2})$ 的样本， $y_{1}, y_{2}, \dots, y_{m}$ 是来自 $N (μ_{2}, σ^{2})$ 的样本， $c, d$ 是任意两个不为 $0$ 的常数，证明：
$t = \frac{c ( x ˉ - μ _{1} ) + d ( y ˉ - μ _{2} )}{s _{w} \frac{c ^{2}}{n} + \frac{d ^{2}}{m}} \sim t (n + m - 2),$
其中
$s_{w}^{2} = \frac{( n - 1 ) s _{x}^{2} + ( m - 1 ) s _{y}^{2}}{n + m - 2},$
$s_{x}^{2}$ 与 $s_{y}^{2}$ 分别是两个样本方差。

解由条件有

c (\overset{x}{ˉ} - μ_{1}) \sim N (0, \frac{c ^{2} σ ^{2}}{n}), d (\overset{y}{ˉ} - μ_{2}) \sim N (0, \frac{d ^{2} σ ^{2}}{m}),

\frac{( n - 1 ) s _{x}^{2}}{σ ^{2}} \sim χ^{2} (n - 1), \frac{( m - 1 ) s _{y}^{2}}{σ ^{2}} \sim χ^{2} (m - 1),

且 $\overset{x}{ˉ}, \overset{y}{ˉ}, s_{x}^{2}, s_{y}^{2}$ 相互独立，故

c (\overset{x}{ˉ} - μ_{1}) + d (\overset{y}{ˉ} - μ_{2}) \sim N (0, \frac{c ^{2} σ ^{2}}{n} + \frac{d ^{2} σ ^{2}}{m}),

\frac{( n + m - 2 ) s _{w}^{2}}{σ ^{2}} = \frac{( n - 1 ) s _{x}^{2}}{σ ^{2}} + \frac{( m - 1 ) s _{y}^{2}}{σ ^{2}} \sim χ^{2} (n + m - 2) .

于是

t = \frac{[ c ( x ˉ - μ _{1} ) + d ( y ˉ - μ _{2} ) ] / \frac{c ^{2} σ ^{2}}{n} + \frac{d ^{2} σ ^{2}}{m}}{\frac{( n + m - 2 ) s _{w}^{2} / σ ^{2}}{n + m - 2}} \sim t (n + m - 2) .

习题 5.4-12

设 $x_{1}, x_{2}, \dots, x_{n}, x_{n + 1}$ 是来自 $N (μ, σ^{2})$ 的样本，
$\overset{x}{ˉ}_{n} = \frac{1}{n} i = 1 \sum n x_{i}, s_{n}^{2} = \frac{1}{n - 1} i = 1 \sum n (x_{i} - \overset{x}{ˉ}_{n})^{2},$
试求常数 $c$ 使得
$t_{c} = c \frac{x _{n + 1} - x ˉ _{n}}{s _{n}}$
服从 $t$ 分布，并指出分布的自由度。

解由条件：

x_{n + 1} \sim N (μ, σ^{2}), \overset{x}{ˉ}_{n} \sim N (μ, \frac{σ ^{2}}{n}), \frac{( n - 1 ) s _{n}^{2}}{σ ^{2}} \sim χ^{2} (n - 1),

且 $x_{n + 1}, \overset{x}{ˉ}_{n}, s_{n}^{2}$ 相互独立，因而

x_{n + 1} - \overset{x}{ˉ}_{n} \sim N (0, σ^{2} + \frac{σ ^{2}}{n}) = N (0, \frac{n + 1}{n} σ^{2}),

故

\frac{( x _{n + 1} - x ˉ _{n} ) \frac{n + 1}{n} / \frac{n + 1}{n} σ ^{2}}{\frac{( n - 1 ) s _{n}^{2} / σ ^{2}}{n - 1}} \sim t (n - 1) .

这说明当

c = \frac{n}{n + 1}

时，

t_{c} = c \frac{x _{n + 1} - x ˉ _{n}}{s _{n}} \sim t (n - 1),

自由度为 $n - 1$ 。

习题 5.4-13

设从方差相等的两个独立正态总体中分别抽取容量为 $15, 20$ 的样本，其样本方差分别为 $s_{1}^{2}, s_{2}^{2}$ ，试求
$P (\frac{s _{1}^{2}}{s _{2}^{2}} > 2) .$

解不妨设正态总体的方差为 $σ^{2}$ ，则有

\frac{14 s _{1}^{2}}{σ ^{2}} \sim χ^{2} (14), \frac{19 s _{2}^{2}}{σ ^{2}} \sim χ^{2} (19),

于是

F = \frac{s _{1}^{2}}{s _{2}^{2}} \sim F (14, 19) .

利用统计软件计算可算出

P (\frac{s _{1}^{2}}{s _{2}^{2}} > 2) = P (F > 2) = 0.0798.

譬如，可使用 MATLAB 软件计算上式：在命令行输入 \texttt{1-fcdf(2,14,19)} 则给出 $0.0798$ ，这里的 \texttt{fcdf(x,k_1,k_2)} 就表示自由度为 $(k_{1}, k_{2})$ 的 $F$ 分布在 $x$ 处的分布函数。

习题 5.4-14

设 $x_{1}, x_{2}, \dots, x_{15}$ 是总体 $N (0, σ^{2})$ 的一个样本，求
$y = \frac{x _{1}^{2} + x _{2}^{2} + \dots + x _{10}^{2}}{2 ( x _{11}^{2} + x _{12}^{2} + \dots + x _{15}^{2} )}$
的分布。

解由于 $x_{i} / σ$ 为独立同分布的 $N (0, 1)$ 随机变量，故

\frac{1}{σ ^{2}} (x_{1}^{2} + x_{2}^{2} + \dots + x_{10}^{2}) \sim χ^{2} (10),

\frac{1}{σ ^{2}} (x_{11}^{2} + x_{12}^{2} + \dots + x_{15}^{2}) \sim χ^{2} (5),

且两者独立，故

y = \frac{\frac{1}{σ ^{2}} ( x _{1}^{2} + x _{2}^{2} + \dots + x _{10}^{2} ) /10}{\frac{1}{σ ^{2}} ( x _{11}^{2} + x _{12}^{2} + \dots + x _{15}^{2} ) /5} \sim F (10, 5) .

习题 5.4-15

设 $(x_{1}, x_{2}, \dots, x_{17})$ 是来自正态分布 $N (μ, σ^{2})$ 的一个样本， $\overset{x}{ˉ}$ 与 $s^{2}$ 分别是样本均值与样本方差。求 $k$ ，使得
$P (\overset{x}{ˉ} > μ + k s) = 0.95.$

解在正态总体下，

\frac{n ( x ˉ - μ )}{s} \sim t (n - 1),

所以

P (\overset{x}{ˉ} > μ + k s) = P (\frac{x ˉ - μ}{s} > k) = P (\frac{n ( x ˉ - μ )}{s} > k n) = 0.95,

即

P (\frac{n ( x ˉ - μ )}{s} \leq k n) = 0.05.

故 $k n$ 是自由度为 $n - 1$ 的 $t$ 分布 $t (n - 1)$ 的 $0.05$ 分位数，即

k n = t_{0.05} (n - 1) .

如令 $n = 17$ ，查表知

t_{0.05} (16) = - 1.7459,

从而

k = \frac{- 1.7459}{17} = - 0.4234.

习题 5.4-16

设总体 $X$ 服从 $N (μ, σ^{2})$ ， $σ^{2} > 0$ ，从该总体中抽取样本 $x_{1}, x_{2}, \dots, x_{2 n} (n \geq 1)$ ，其样本均值为
$\overset{x}{ˉ} = \frac{1}{2 n} i = 1 \sum 2 n x_{i},$
求统计量
$y = i = 1 \sum n (x_{i} + x_{n + i} - 2 \overset{x}{ˉ})^{2}$
的数学期望。

解记

y_{i} = x_{i} + x_{n + i}, i = 1, 2, \dots, n,

则 $y_{1}, y_{2}, \dots, y_{n}$ 可看成来自 $N (2 μ, 2 σ^{2})$ 样本，而

y = i = 1 \sum n (x_{i} + x_{n + i} - 2 \overset{x}{ˉ})^{2} = i = 1 \sum n (y_{i} - \overset{y}{ˉ})^{2} .

由《概率论与数理统计教程（第三版）》中定理 $5.4.1$ ，

\frac{y}{2 σ ^{2}} \sim χ^{2} (n - 1),

从而

E (y) = 2 (n - 1) σ^{2} .

习题 5.4-17

证明：若随机变量 $T \sim t (k)$ ，则对 $r < k$ 有
$E (T^{r}) = ⎩ ⎨ ⎧ 0, \frac{k ^{r /2} Γ ( \frac{r + 1}{2} ) Γ ( \frac{k - r}{2} )}{π Γ ( \frac{k}{2} )}, r 为奇数, r 为偶数,$
并由此写出 $E (T)$ 与 $Var (T)$ 。

解证由 $T$ 变量的结构知， $T$ 变量可表示为

T = \frac{U}{V / k} = k^{1/2} U \cdot V^{- 1/2},

其中 $U \sim N (0, 1)$ ， $V \sim χ^{2} (k) = G a (\frac{k}{2}, \frac{1}{2})$ ，且 $U$ 与 $V$ 独立，从而有

E (T^{r}) = k^{r /2} E (U^{r}) E (V^{- r /2}) .

由于

E (U^{r}) = ⎩ ⎨ ⎧ 0, \frac{2 ^{r /2} Γ ( \frac{r + 1}{2} )}{π}, r 为奇数, r 为偶数,

以及

E (V^{- r /2}) = \frac{2 ^{- k /2}}{Γ ( k /2 )} \int_{0}^{\infty} v^{- r /2} v^{k /2 - 1} e^{- v /2} d v = \frac{2 ^{- r /2} Γ ( \frac{k - r}{2} )}{Γ ( k /2 )}, r < k,

将两者代回可知，在 $r < k$ 时，若 $r$ 为奇数，则 $E (T^{r}) = 0$ ，若 $r$ 为偶数，则

E (T^{r}) = \frac{k ^{r /2} Γ ( \frac{r + 1}{2} ) Γ ( \frac{k - r}{2} )}{π Γ ( \frac{k}{2} )} .

证明完成。

进一步，当 $r = 1$ 时，

E (T) = 0

（此时要求 $k > 1$ ，否则均值不存在）；当 $r = 2$ 时，

Var (T) = E (T^{2}) = \frac{k}{k - 2}

（此时要求 $k > 2$ ，否则方差不存在）。

习题 5.4-18

证明：若随机变量 $F \sim F (k, m)$ ，则当
$- \frac{k}{2} < r < \frac{m}{2}$
时有
$E (F^{r}) = \frac{m ^{r} Γ ( \frac{k}{2} + r ) Γ ( \frac{m}{2} - r )}{k ^{r} Γ ( \frac{k}{2} ) Γ ( \frac{m}{2} )},$
由此写出 $E (F)$ 与 $Var (F)$ 。

解证由 $F$ 变量的构造知

F = \frac{v / k}{w / m} = \frac{m}{k} v \cdot w^{- 1},

其中 $v \sim χ^{2} (k)$ ， $w \sim χ^{2} (m)$ ，且 $v$ 与 $w$ 相互独立，因此 $F$ 变量的 $r$ 阶矩为

E (F^{r}) = \frac{m ^{r}}{k ^{r}} E (v^{r}) E (w^{- r}) .

由于 $χ^{2} (k) = G a (\frac{k}{2}, \frac{1}{2})$ ，容易算得

E (v^{r}) = \frac{Γ ( \frac{k}{2} + r )}{( 1/2 ) ^{r} Γ ( \frac{k}{2} )}, r > - \frac{k}{2},

E (w^{- r}) = \frac{Γ ( \frac{m}{2} - r )}{( 1/2 ) ^{- r} Γ ( \frac{m}{2} )}, r < \frac{m}{2},

从而可得

E (F^{r}) = \frac{m ^{r} Γ ( \frac{k}{2} + r ) Γ ( \frac{m}{2} - r )}{k ^{r} Γ ( \frac{k}{2} ) Γ ( \frac{m}{2} )}, - \frac{k}{2} < r < \frac{m}{2},

在其他场合， $E (F^{r})$ 不存在。

当 $r = 1$ 时，由于 $k > 0$ ，只要 $m > 2$ ，就有

E (F) = \frac{m Γ ( \frac{k}{2} + 1 ) Γ ( \frac{m}{2} - 1 )}{k Γ ( \frac{k}{2} ) Γ ( \frac{m}{2} )} = \frac{m}{m - 2} .

当 $r = 2$ 时，只要 $m > 4$ ，就有

E (F^{2}) = \frac{m ^{2} Γ ( \frac{k}{2} + 2 ) Γ ( \frac{m}{2} - 2 )}{k ^{2} Γ ( \frac{k}{2} ) Γ ( \frac{m}{2} )} = \frac{m ^{2} ( k + 2 )}{k ( m - 2 ) ( m - 4 )} .

从而

Var (F) = E (F^{2}) - (E (F))^{2} = \frac{2 m ^{2} ( k + m - 2 )}{k ( m - 2 ) ^{2} ( m - 4 )} .

习题 5.4-19

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自某连续总体的一个样本。该总体的分布函数 $F (x)$ 是连续严格增函数，证明：统计量
$T = - 2 i = 1 \sum n ln F (x_{i})$
服从 $χ^{2} (2 n)$ 。

解证分几步进行：

（1）若 $X \sim F (x)$ ，且 $F (x)$ 为连续严格增函数，则

Y = F (X) \sim U (0, 1) .

这是因为 $F (x)$ 的反函数 $F^{- 1}$ 也存在。于是 $Y = F (X)$ 的分布函数为

F_{Y} (y) = P (F (X) \leq y) = P (X \leq F^{- 1} (y)) = F (F^{- 1} (y)) = y,

其中 $y \in (0, 1)$ ，当 $y \leq 0$ 时， $F_{Y} (y) = 0$ ，当 $y \geq 1$ 时， $F_{Y} (y) = 1$ ，所以 $F (X) \sim U (0, 1)$ 。

（2）若 $Y \sim U (0, 1)$ ，则

Z = - 2 ln Y \sim χ^{2} (2) .

这是由于 $Y$ 仅在 $(0, 1)$ 上取值，故 $Z = - 2 ln Y$ 仅在 $(0, \infty)$ 上取值，所以当 $z \leq 0$ 时， $F_{Z} (z) = 0$ ；当 $z > 0$ 时，有

F_{Z} (z) = P (- 2 ln Y \leq z) = P (Y \geq e^{- z /2}) = 1 - e^{- z /2} .

这是自由度为 $2$ 的 $χ^{2}$ 分布函数，即 $Z = - 2 ln Y \sim χ^{2} (2)$ 。

（3）由 $X_{1}, X_{2}, \dots, X_{n}$ 的相互独立性可知 $F (X_{1}), F (X_{2}), \dots, F (X_{n})$ 相互独立，由（1）与（2）可知

T = - 2 i = 1 \sum n ln F (x_{i}) \sim χ^{2} (2 n) .

习题 5.4-20

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自正态总体 $N (μ, σ^{2})$ 的一个样本，
$s_{n}^{2} = \frac{1}{n - 1} i = 1 \sum n (x_{i} - \overset{x}{ˉ})^{2}$
是样本方差，试求满足
$P (\frac{s _{n}^{2}}{σ ^{2}} \leq 1.5) \geq 0.95$
的最小 $n$ 值。

解由于

\frac{( n - 1 ) s _{n}^{2}}{σ ^{2}} \sim χ^{2} (n - 1),

所以要使

P (\frac{s _{n}^{2}}{σ ^{2}} \leq 1.5) \geq 0.95,

等价于要使 $χ^{2} (n - 1)$ 分布的 $0.95$ 分位数 $χ_{0.95}^{2} (n - 1)$ 不大于 $1.5 (n - 1)$ ，即

χ_{0.95}^{2} (n - 1) \leq 1.5 (n - 1) .

满足上述不等式的最小 $n$ 可用搜索法获得，如下表：

n 2510 χ_{0.95}^{2} (n - 1) 3.8415 9.4877 16.9190 1.5 (n - 1) 1.5 6 13.5

$n$	$χ_{0.95}^{2} (n - 1)$	$1.5 (n - 1)$
$15$	$23.6848$	$21$
$20$	$30.1435$	$28.5$
$25$	$36.4150$	$36$
$26$	$37.6525$	$37.5$
$27$	$38.8851$	$39$
$28$	$40.1133$	$40.5$

由此可见，当 $n \geq 27$ 时，就可使上述不等式成立。

习题 5.4-21

设 $x_{1}, x_{2}, \dots, x_{n}$ 独立同分布服从 $N (μ, σ^{2})$ ，
$\overset{x}{ˉ} = \frac{1}{n} i = 1 \sum n x_{i}, s^{2} = \frac{1}{n - 1} i = 1 \sum n (x_{i} - \overset{x}{ˉ})^{2},$
记
$ξ = \frac{x _{1} - x ˉ}{s} .$
试找出 $ξ$ 与 $t$ 分布的联系（提示：作正交变换
$y_{1} = n \overset{x}{ˉ}, y_{2} = \frac{n}{n - 1} (x_{1} - \overset{x}{ˉ}), y_{i} = j = 1 \sum n c_{ij} x_{j}, i = 3, 4, \dots, n$
）。

解 $x_{1}, x_{2}, \dots, x_{n}$ 的联合密度函数为

p (x_{1}, x_{2}, \dots, x_{n}) = (2 π σ^{2})^{- n /2} exp {- \frac{1}{2 σ ^{2}} i = 1 \sum n (x_{i} - μ)^{2}} = (2 π σ^{2})^{- n /2} exp {- \frac{\sum _{i = 1}^{n} x _{i}^{2} - 2 n x ˉ μ + n μ ^{2}}{2 σ ^{2}}} .

记 $X = (x_{1}, x_{2}, \dots, x_{n})^{T}$ ，取一个 $n$ 维正交矩阵 $A$ ，其第一行为元素全为 $1/ n$ ，第二行为

(\frac{n - 1}{n}, - \frac{1}{n ( n - 1 )}, - \frac{1}{n ( n - 1 )}, \dots, - \frac{1}{n ( n - 1 )}),

其余元素只要满足正交性即可。令 $Y = A X$ ，则该变换的雅可比行列式为 $1$ ，且注意到

y_{1} = n \overset{x}{ˉ}, y_{2} = \frac{n}{n - 1} (x_{1} - \overset{x}{ˉ}), i = 1 \sum n y_{i}^{2} = Y^{T} Y = X^{T} A^{T} A X = i = 1 \sum n x_{i}^{2} .

于是 $y_{1}, y_{2}, \dots, y_{n}$ 的联合密度函数为

p (y_{1}, y_{2}, \dots, y_{n}) = (2 π σ^{2})^{- n /2} exp {- \frac{\sum _{i = 2}^{n} y _{i}^{2} - 2 n μ y _{1} + n μ ^{2}}{2 σ ^{2}}} = (2 π σ^{2})^{- n /2} exp {- \frac{\sum _{i = 2}^{n} y _{i}^{2} + ( y _{1} - n μ ) ^{2}}{2 σ ^{2}}} .

由此， $y_{2}, y_{3}, \dots, y_{n}$ 独立同分布于 $N (0, σ^{2})$ ，且

(n - 1) s^{2} = i = 2 \sum n y_{i}^{2} .

令

t = \frac{y _{2}}{( y _{3}^{2} + \dots + y _{n}^{2} ) / ( n - 2 )} = \frac{y _{2}}{[ ( n - 1 ) s ^{2} - y _{2}^{2} ] / ( n - 2 )},

则 $t \sim t (n - 2)$ ，而

ξ = \frac{x _{1} - x ˉ}{s} = \frac{n - 1}{n} \cdot \frac{y _{2}}{( n - 1 ) s ^{2}}

= \frac{n - 1}{n} \cdot \frac{\frac{y _{2}}{[ ( n - 1 ) s ^{2} - y _{2}^{2} ] / ( n - 2 )}}{\frac{( n - 1 ) s ^{2}}{[ ( n - 1 ) s ^{2} - y _{2}^{2} ] / ( n - 2 )}}

= \frac{n - 1}{n} \cdot \frac{t}{n - 2 + t ^{2}} .

这就建立了 $ξ$ 与 $t$ 分布的联系。

习题 5.4-22

设 $x_{1}, x_{2}, \dots, x_{m}$ 相互独立， $x_{i}$ 服从 $χ^{2} (n_{i})$ ， $i = 1, 2, \dots, m$ 。令
$U_{1} = \frac{x _{1}}{x _{1} + x _{2}}, U_{2} = \frac{x _{1} + x _{2}}{x _{1} + x _{2} + x _{3}}, \dots, U_{m - 1} = \frac{x _{1} + \dots + x _{m - 1}}{x _{1} + \dots + x _{m}} .$
证明： $U_{1}, U_{2}, \dots, U_{m - 1}$ 相互独立，且
$U_{i} \sim B e (\frac{n _{1} + n _{2} + \dots + n _{i}}{2}, \frac{n _{i + 1}}{2}), i = 1, 2, \dots, m - 1.$
（提示：令 $U_{m} = x_{1} + x_{2} + \dots + x_{m}$ ，作变换
$x_{1} = U_{1} U_{2} \dots U_{m}, x_{2} = U_{2} U_{3} \dots U_{m} - U_{1} U_{2} \dots U_{m}, \dots, x_{m} = U_{m} - U_{m - 1} U_{m}$
。）

解令 $U_{m} = x_{1} + x_{2} + \dots + x_{m}$ ，则

⎩ ⎨ ⎧ x_{1} x_{2} x_{m} = U_{1} \dots U_{m}, = U_{2} \dots U_{m} - U_{1} \dots U_{m}, ⋮ = U_{m} - U_{m - 1} U_{m} .

再令

S_{t} = U_{t} U_{t + 1} \dots U_{m}, t = 1, 2, \dots, m,

则

⎩ ⎨ ⎧ x_{1} x_{2} x_{m} = S_{1}, = S_{2} - S_{1}, ⋮ = S_{m} - S_{m - 1} .

所以变换的雅可比行列式为

J = \frac{\partial ( x _{1} , x _{2} , \dots , x _{m} )}{\partial ( u _{1} , u _{2} , \dots , u _{m} )} = \frac{s _{1}}{u _{1}} - \frac{s _{1}}{u _{1}} 0 ⋮ 0 \frac{s _{1}}{u _{2}} \frac{s _{2} - s _{1}}{u _{2}} - \frac{s _{2}}{u _{2}} ⋮ 0 \frac{s _{1}}{u _{3}} \frac{s _{2} - s _{1}}{u _{3}} \frac{s _{3} - s _{2}}{u _{3}} ⋮ 0 \dots \dots \dots ⋱ \dots \frac{s _{1}}{u _{m}} \frac{s _{2} - s _{1}}{u _{m}} \frac{s _{3} - s _{2}}{u _{m}} ⋮ \frac{s _{m} - s _{m - 1}}{u _{m}} .

计算该行列式，可得

J = i = 2 \prod m u_{i}^{i - 1} .

因为

p (x_{1}, x_{2}, \dots, x_{m}) = \frac{1}{i = 1 \prod m 2 ^{n_{i} /2} Γ ( \frac{n _{i}}{2} )} exp {- \frac{1}{2} i = 1 \sum m x_{i}} i = 1 \prod m x_{i}^{n_{i} /2 - 1},

把雅可比行列式代入上式可得

p (u_{1}, u_{2}, \dots, u_{m}) = \frac{1}{i = 1 \prod m 2 ^{n_{i} /2} Γ ( \frac{n _{i}}{2} )} exp {- \frac{1}{2} u_{m}} u_{m}^{\frac{n _{1} + n _{2} + \dots + n _{m}}{2} - 1} \cdot i = 1 \prod m - 1 u_{i}^{\frac{n _{1} + n _{2} + \dots + n _{i}}{2} - 1} (1 - u_{i})^{\frac{n _{i + 1}}{2} - 1} .

由此可知 $U_{1}, U_{2}, \dots, U_{m - 1}$ 相互独立，且

U_{i} \sim B e (\frac{n _{1} + n _{2} + \dots + n _{i}}{2}, \frac{n _{i + 1}}{2}), i = 1, 2, \dots, m - 1.

补充习题及解答

补充习题 23

设 $(x_{i}, y_{i})$ ， $i = 1, 2, \dots, n$ 是取自二维正态分布 $N (μ_{1}, μ_{2}, σ_{1}^{2}, σ_{2}^{2}, ρ)$ 的样本，记
$\overset{x}{ˉ} = \frac{1}{n} i = 1 \sum n x_{i}, \overset{y}{ˉ} = \frac{1}{n} i = 1 \sum n y_{i},$ $s_{x}^{2} = \frac{1}{n - 1} i = 1 \sum n (x_{i} - \overset{x}{ˉ})^{2}, s_{y}^{2} = \frac{1}{n - 1} i = 1 \sum n (y_{i} - \overset{y}{ˉ})^{2},$ $r = \frac{\sum _{i = 1}^{n} ( x _{i} - x ˉ ) ( y _{i} - y ˉ )}{\sum _{i = 1}^{n} ( x _{i} - x ˉ ) ^{2} \cdot \sum _{i = 1}^{n} ( y _{i} - y ˉ ) ^{2}} .$
试求统计量
$T = n \frac{x ˉ - y ˉ - ( μ _{1} - μ _{2} )}{s _{x}^{2} + s _{y}^{2} - 2 r s _{x} s _{y}}$
的分布。

解容易看出 $\overset{x}{ˉ} - \overset{y}{ˉ}$ 仍服从正态分布，且

E (\overset{x}{ˉ} - \overset{y}{ˉ}) = μ_{1} - μ_{2}, Var (\overset{x}{ˉ} - \overset{y}{ˉ}) = \frac{σ _{1}^{2}}{n} + \frac{σ _{2}^{2}}{n} - \frac{2 ρ σ _{1} σ _{2}}{n} .

所以

n \frac{x ˉ - y ˉ - ( μ _{1} - μ _{2} )}{σ _{1}^{2} + σ _{2}^{2} - 2 ρ σ _{1} σ _{2}} \sim N (0, 1) .

另外，

(n - 1) (s_{x}^{2} + s_{y}^{2} - 2 r s_{x} s_{y}) = i = 1 \sum n (x_{i} - \overset{x}{ˉ})^{2} + i = 1 \sum n (y_{i} - \overset{y}{ˉ})^{2} - 2 i = 1 \sum n (x_{i} - \overset{x}{ˉ}) (y_{i} - \overset{y}{ˉ}) = i = 1 \sum n [(x_{i} - y_{i}) - (\overset{x}{ˉ} - \overset{y}{ˉ})]^{2} .

类似于一维正态变量场合，可证：

(n - 1) (s_{x}^{2} + s_{y}^{2} - 2 r s_{x} s_{y})

与 $\overset{x}{ˉ} - \overset{y}{ˉ}$ 相互独立，且

\frac{( n - 1 ) ( s _{x}^{2} + s _{y}^{2} - 2 r s _{x} s _{y} )}{σ _{1}^{2} + σ _{2}^{2} - 2 ρ σ _{1} σ _{2}} \sim χ^{2} (n - 1) .

于是根据 $t$ 变量的构造可知

\frac{\frac{n [ x ˉ - y ˉ - ( μ _{1} - μ _{2} )]}{σ _{1}^{2} + σ _{2}^{2} - 2 ρ σ _{1} σ _{2}}}{\frac{( n - 1 ) ( s _{x}^{2} + s _{y}^{2} - 2 r s _{x} s _{y} )}{( σ _{1}^{2} + σ _{2}^{2} - 2 ρ σ _{1} σ _{2} ) ( n - 1 )}} = n \frac{x ˉ - y ˉ - ( μ _{1} - μ _{2} )}{s _{x}^{2} + s _{y}^{2} - 2 r s _{x} s _{y}} \sim t (n - 1) .

这就是我们要求的分布。

补充习题 24

设 $T_{n}$ 是自由度为 $n$ 的 $t$ 变量，试证： $T_{n}$ 的渐近分布为标准正态分布 $N (0, 1)$ 。

解据自由度为 $n$ 的 $t$ 变量的构造知

T_{n} = \frac{X}{Y / n},

其中 $X \sim N (0, 1)$ ， $Y \sim χ^{2} (n)$ ，且 $X$ 与 $Y$ 相互独立。由 $Y$ 的特征函数为

(1 - 2 i t)^{- n /2},

故 $Y / n$ 的特征函数为

(1 - \frac{2 i t}{n})^{- n /2} .

考察其极限知

n \to \infty lim (1 - \frac{2 i t}{n})^{- n /2} = n \to \infty lim (1 - \frac{2 i t}{n})^{- n / (2 i t)} = e^{i t} .

由特征函数性质知

\frac{Y}{n} P 1,

从而由

\frac{Y}{n} P 1,

再按依概率收敛性知

T_{n} = X \frac{1}{Y / n} P X,

这就证明了 $T_{n}$ 的渐近分布为标准正态分布 $N (0, 1)$ 。

注：此结论也可从自由度为 $n$ 的 $t$ 分布的密度函数直接导出，只是推算稍微复杂一些。

群知识库

AI 找笔记

Explorer

5.4 三大抽样分布

§5.4 三大抽样分布

依赖于

被以下题目直接调用

正文部分

§5.4 三大抽样分布

习题与解答 5.4

补充习题及解答

评论

Graph View

目录

反向链接