07-第七章 假设检验
依赖于
被以下题目直接调用
正文部分
§7.1 假设检验的基本思想与概念
1. 假设
参数空间 Θ = { θ } 的非空子集或有关参数 θ 的命题,称为统计假设,简称假设;
原假设,根据需要而设立的假设,常记为 H 0 : θ ∈ Θ 0 ;
备择假设,在原假设被拒绝后而采用(接受)的假设,常记为 H 1 : θ ∈ Θ 1 。
注:要求 Θ 0 ∩ Θ 1 = ∅ ,即原假设 H 0 与备择假设 H 1 不含公共参数。若假设 H 0 (或 H 1 )只含一个点,则称该假设是简单假设,否则称为复杂假设。
2. 检验 对原假设 H 0 : θ ∈ Θ 0 作出是否拒绝 H 0 的判断的法则称为检验法则,简称检验。检验有两个结果:
“原假设不正确”,称为拒绝原假设,或称检验显著;
“原假设正确”,称为接受(保留)原假设,或称检验不显著。
统计假设检验的着力点不在于说明原假设正确,而在于说明原假设不正确,因为用一个样本去说明原假设正确是根据不足的,而用一个样本去推翻原假设却是合理的,因此统计学在讨论假设检验时着力点在于建立检验的拒绝域。
3. 检验问题
由原假设 H 0 和备择假设 H 1 组成一个需要作判断的问题称为检验问题;
参数假设检验问题,两个假设都是有关参数的命题组成的检验问题;
非参数假设检验问题,两个假设都是有关分布的命题组成的检验问题。
常用的参数假设检验问题有如下三个,其中 θ 0 是已知常数:
( 1 ) H 0 : θ ≤ θ 0 ( 2 ) H 0 : θ ≥ θ 0 ( 3 ) H 0 : θ = θ 0 vs H 1 : θ > θ 0 ; vs H 1 : θ < θ 0 ; vs H 1 : θ = θ 0 .
其中 (1) 与 (2) 又称单侧检验问题,因为一个假设位于另一个假设的一侧;(3) 称为双侧检验问题,因为备择假设位于原假设的两侧。
4. 两类错误及其发生概率
原假设 H 0 正确,但被拒绝,这种判断错误称为第一类错误,其发生概率称为犯第一类错误的概率,或称拒真概率,常记为 α ;
原假设 H 0 不真,但被接受,这种判断错误称为第二类错误,其发生概率称为犯第二类错误的概率,或称取伪概率,常记为 β 。
5. 假设检验的基本步骤
(1) 建立假设,根据要求建立原假设 H 0 和备择假设 H 1 .
(2) 选择检验统计量,给出拒绝域 W 的形式。
用于对原假设 H 0 作出判断的统计量称为检验统计量;
使原假设被拒绝的样本观测值所在区域称为拒绝域,常用 W 表示;
一个拒绝域 W 唯一确定一个检验法则。
(3) 选择显著性水平 α ( 0 < α < 1 ) .
(4) 给出拒绝域,由概率等式 P ( W ) = α 确定具体的拒绝域。
(5) 作出判断。
当样本 ( x 1 , x 2 , … , x n ) ∈ W ,则拒绝 H 0 ;
当样本 ( x 1 , x 2 , … , x n ) ∈ W ,则接受 H 0 。
6. 势函数 设检验问题
H 0 : θ ∈ Θ 0 vs H 1 : θ ∈ Θ 1
的拒绝域为 W ,则样本观测值 x 1 , x 2 , … , x n 落在拒绝域 W 内的概率称为该检验的势函数,记为
g ( θ ) = P θ ( ( x 1 , x 2 , … , x n ) ∈ W ) , θ ∈ Θ 0 ∪ Θ 1 .
由势函数 g ( θ ) 容易得到犯两类错误的概率
g ( θ ) = { α ( θ ) , 1 − β ( θ ) , θ ∈ Θ 0 , θ ∈ Θ 1 .
7. 水平为 α 的检验 对检验问题
H 0 : θ ∈ Θ 0 vs H 1 : θ ∈ Θ 1 ,
若一个检验犯第一类错误的概率 α ( θ ) 不超过事先给定的显著性水平 α ,即
α ( θ ) ≤ α , θ ∈ Θ 0 ,
则称该检验为显著性水平为 α 的显著性检验。
在实际使用中 α 不宜选得过小,α 过小会导致 β 过大,应在适当控制 α 中制约 β 。最常用的选择是 α = 0.05 ,有时也选用 α = 0.10 或 α = 0.01 。
8. 检验的 p 值 在一个假设检验问题中,利用样本观察值能够做出拒绝原假设的最小显著性水平称为该检验的 p 值,引入检验的 p 值的好处是:
它比较客观,避免了事先确定显著性水平;
由检验的 p 值与人们心目中的显著性水平 α 进行比较:
若 α ≥ p ,则在显著性水平 α 下拒绝 H 0 ;
若 α < p ,则在显著性水平 α 下接受 H 0 ;
检验的 p 值的计算是复杂的,会涉及各种抽样分布。如今统计软件都有计算 p 值的功能,因此这对使用者反而方便,它不需要各用各种抽样分布的分位数表,而只需要观察计算机输出的 p 值多少就可以做出判断。
习题与解答 7.1
设 x 1 , x 2 , … , x n 是来自 N ( μ , 1 ) 的样本,考虑假设检验问题
H 0 : μ = 2 , H 1 : μ = 3 ,
若检验由拒绝域
W = { x ˉ ≥ 2.6 }
确定。
(1) 当 n = 20 时求检验犯两类错误的概率;
(2) 如果要使得检验犯第二类错误的概率 β ≤ 0.01 ,n 最小应取多少?
(3) 证明:当 n → ∞ 时,α → 0 , β → 0 。
解
(1) 由定义知,犯第一类错误的概率为
α = P ( x ˉ ≥ 2.6 ∣ H 0 ) = P ( 1/20 x ˉ − 2 ≥ 1/20 2.6 − 2 ) = 1 − Φ ( 2.68 ) = 0.0037 ,
这是因为在 H 0 成立下,x ˉ ∼ N ( 2 , 1/20 ) 。而犯第二类错误的概率为
β = P ( x ˉ < 2.6 ∣ H 1 ) = P ( 1/20 x ˉ − 3 < 1/20 2.6 − 3 ) = Φ ( − 1.79 ) = 1 − Φ ( 1.79 ) = 0.0367 ,
这是因为在 H 1 成立下,x ˉ ∼ N ( 3 , 1/20 ) 。
(2) 若使犯第二类错误的概率满足
β = P ( x ˉ < 2.6 ∣ H 1 ) = P ( 1/ n x ˉ − 3 < 1/ n 2.6 − 3 ) ≤ 0.01 ,
即
1 − Φ ( 0.4 n ) ≤ 0.01 ,
或
Φ ( 0.4 n ) ≥ 0.99.
查表得 0.4 n ≥ 2.33 ,由此给出
n ≥ 33.93 ,
因而 n 最小应取 34 ,才能使检验犯第二类错误的概率 β ≤ 0.01 。
(3) 在样本量为 n 时,检验犯第一类错误的概率为
α = P ( x ˉ ≥ 2.6 ∣ H 0 ) = P ( 1/ n x ˉ − 2 ≥ 1/ n 2.6 − 2 ) = 1 − Φ ( 0.6 n ) ,
当 n → ∞ 时,Φ ( 0.6 n ) → 1 ,即 α → 0 。
检验犯第二类错误的概率为
β = P ( x ˉ < 2.6 ∣ H 1 ) = P ( 1/ n x ˉ − 3 < 1/ n 2.6 − 3 ) = Φ ( − 0.4 n ) = 1 − Φ ( 0.4 n ) ,
当 n → ∞ 时,Φ ( 0.4 n ) → 1 ,即 β → 0 。
注:从这个例子可以看出,要使得 α 与 β 都趋于 0 ,必须 n → ∞ 才可实现,这一结论在一般场合仍成立,即要使得 α 与 β 同时很小,必须样本量 n 很大。由于样本量 n 很大在实际中常常是不可行的,故一般情况下人们不应要求 α 与 β 同时很小。
设 x 1 , x 2 , … , x 10 是来自 0 -1 总体 b ( 1 , p ) 的样本,考虑检验问题
H 0 : p = 0.2 vs H 1 : p = 0.4 ,
取拒绝域为
W = { x ˉ ≥ 0.5 } ,
求该检验犯两类错误的概率。
解
x 1 , x 2 , … , x 10 ∼ b ( 1 , p ) ,则 10 x ˉ ∼ b ( 10 , p ) ,于是犯两类错误的概率分别为
α = P ( x ˉ ≥ 0.5 ∣ H 0 ) = P ( 10 x ˉ ≥ 5 ∣ H 0 ) = k = 5 ∑ 10 ( k 10 ) ( 5 1 ) k ( 5 4 ) 10 − k = 0.0328 ,
β = P ( x ˉ < 0.5 ∣ H 1 ) = P ( 10 x ˉ < 5 ∣ H 1 ) = k = 0 ∑ 4 ( k 10 ) ( 5 2 ) k ( 5 3 ) 10 − k = 0.6331.
讨论:这里 α = 0.0328 已经很小了,但 β = 0.6331 却很大。在样本量 n = 10 固定下,若要使 α 更小则会导致 β 更大,为说明这一点,我们试着将拒绝域改变为
W = { x ˉ ≥ 0.6 } ,
则这时检验犯两类错误的概率分别为
α = P ( x ˉ ≥ 0.6 ∣ H 0 ) = P ( 10 x ˉ ≥ 6 ∣ H 0 ) = k = 6 ∑ 10 ( k 10 ) ( 5 1 ) k ( 5 4 ) 10 − k
= 0.0328 − ( 5 10 ) ( 5 1 ) 5 ( 5 4 ) 5 = 0.0328 − 0.0264 = 0.0064 ,
β = P ( x ˉ < 0.6 ∣ H 1 ) = P ( 10 x ˉ < 6 ∣ H 1 ) = k = 0 ∑ 5 ( k 10 ) ( 5 2 ) k ( 5 3 ) 10 − k
= 0.6331 + ( 5 10 ) ( 5 2 ) 5 ( 5 3 ) 5 = 0.6331 + 0.2007 = 0.8338.
这一现象在一般场合也是对的,即在样本量 n 固定下,减小 α 必导致增大 β ,减小 β 也必导致增大 α 。
设 x 1 , x 2 , … , x 16 是来自正态总体 N ( μ , 4 ) 的样本,考虑检验问题
H 0 : μ = 6 vs H 1 : μ = 6 ,
拒绝域取为
W = { ∣ x ˉ − 6∣ ≥ c } ,
试求 c 使得检验的显著性水平为 0.05 ,并求该检验在 μ = 6.5 处犯第二类错误的概率。
解
在 H 0 为真的条件下,
x ˉ ∼ N ( 6 , 4 1 ) ,
因而由
P ( ∣ x ˉ − 6∣ ≥ c ∣ μ = 6 ) = 0.05 ,
得
P ( 0.5 x ˉ − 6 ≥ 0.5 c ) = 1 − Φ ( 2 c ) = 0.025 ,
也就是说
Φ ( 2 c ) = 0.975 ,
2 c = 1.96 ,所以当 c = 0.98 时,检验的显著性水平为 0.05 。
该检验在 μ = 6.5 处犯第二类错误的概率为
β = P ( ∣ x ˉ − 6∣ < 0.98 ∣ μ = 6.5 )
= P ( − 2 × 1.48 < 0.5 x ˉ − 6.5 < 2 × 0.48 )
= Φ ( 0.96 ) − Φ ( − 2.96 ) = Φ ( 0.96 ) + Φ ( 2.96 ) − 1 = 0.83.
设总体为均匀分布 U ( 0 , θ ) ,x 1 , x 2 , … , x n 是样本,考虑检验问题
H 0 : θ ≥ 3 vs H 1 : θ < 3 ,
拒绝域取为
W = { x ( n ) ≤ 2.5 } ,
求检验犯第一类错误的最大值 α ,若要使得该最大值 α 不超过 0.05 ,n 至少应取多大?
解
均匀分布 U ( 0 , θ ) 的最大次序统计量 x ( n ) 的密度函数为
f n ( x ) = ⎩ ⎨ ⎧ θ n n x n − 1 , 0 , 0 < x < θ , 其他 ,
因而检验犯第一类错误的概率为
α ( θ ) = P ( x ( n ) ≤ 2.5 ∣ H 0 ) = ∫ 0 2.5 n θ n x n − 1 d x = ( θ 2.5 ) n .
它是 θ 的严格单调递减函数,故其最大值在 θ = 3 处达到,即
α = α ( 3 ) = ( 3 2.5 ) n .
若要使得 α ( 3 ) ≤ 0.05 ,则要求 n ln ( 2.5/3 ) ≤ ln 0.05 ,这给出 n ≥ 16.43 ,即 n 至少为 17 。
在假设检验问题中,若检验结果是接受原假设,则检验可能犯哪一类错误?若检验结果是拒绝原假设,则又有可能犯哪一类错误?
解
若检验结果是接受原假设,可能有两种情况:其一是原假设为真,此时检验是正确的,未犯错误;其二是原假设不真,此时检验结果就错了,这种错误是接受了不真的原假设,为第二类错误,故此时检验可能犯第二类错误。
若检验结果是拒绝原假设,也可能有两种情况:若原假设本身不真,检验是正确的;若原假设事实上是真的,则检验就犯了第一类错误,由此,在此种场合,检验可能会犯第一类错误。
设 x 1 , x 2 , … , x 20 是来自 0 -1 总体 b ( 1 , p ) 的样本,考虑检验问题
H 0 : p = 0.2 vs H 1 : p = 0.2 ,
取拒绝域为
W = { i = 1 ∑ 20 x i ≥ 7 或 i = 1 ∑ 20 x i ≤ 1 } ,
求 p = 0 , 0.1 , 0.2 , … , 0.9 , 1 时的势并由此画出势函数的图;
求在 p = 0.05 时犯第二类错误的概率。
解
(1) 势函数的计算公式为
g ( p ) = P p ( i = 1 ∑ 20 x i ≥ 7 或 i = 1 ∑ 20 x i ≤ 1 ) = i = 0 ∑ 1 ( i 20 ) p i ( 1 − p ) 20 − i + i = 7 ∑ 20 ( i 20 ) p i ( 1 − p ) 20 − i .
则 p = 0 , 0.1 , 0.2 , … , 0.9 , 1 时的势计算如下表:
p g ( p ) 0 1.00 0.1 0.39 0.2 0.16 0.3 0.40 0.4 0.75 0.5 0.94 0.6 0.99 0.7 1.00 0.8 1.00 0.9 1.00 1 1.00
可用软件计算,如 MATLAB 语句为 1 - binocdf(6,20,p) + binocdf(1,20,p);势函数图如图 7.1 ,它在 p = 0.2 处达到最小。
\FigureSevenOne
(2) p = 0.05 时,犯第二类错误的概率可采用如下 MATLAB 语句 binocdf(6,20,0.05) - binocdf(1,20,0.05) 计算给出 1 − g ( 0.05 ) ,计算结果为 0.2641 。
设一个单一观测的样本 x 取自密度函数为 p ( x ) 的总体,对 p ( x ) 考虑统计假设
H 0 : p 0 ( x ) = I [ 0 , 1 ] ( x ) vs H 1 : p 1 ( x ) = 2 x I [ 0 , 1 ] ( x ) ,
若其拒绝域的形式为 W = { x ∣ x ≥ c } ,试确定一个 c ,使得犯第一类、第二类错误的概率满足 α + 2 β 为最小,并求其最小值。
解
由 α = P 0 ( x ≥ c ) = 1 − c ,β = 1 − P 1 ( x ≥ c ) = c 2 ,可得
α + 2 β = 1 − c + 2 c 2 .
因此,当 c = 4 1 时,α + 2 β 为最小,并且此时的最小值为 8 7 。
设 x 1 , x 2 , … , x 30 为取自泊松分布 P ( λ ) 的随机样本。
试给出单边假设检验问题
H 0 : λ ≤ 0.1 vs H 1 : λ > 0.1
的显著性水平 α = 0.05 的检验;
求此检验的势函数 g ( λ ) 在 λ = 0.05 , 0.2 , 0.3 , … , 0.9 时的值,并据此画出 g ( λ ) 的图像。
解
(1) 选 ∑ i = 1 30 x i 为检验统计量,其值愈大愈倾向于拒绝 H 0 ,所以,该检验问题的拒绝域形式为
W = { i = 1 ∑ 30 x i > c } .
注意到在 λ = 0.1 时 ∑ i = 1 30 x i ∼ P ( 3 ) ,从而第一类错误概率为
P 0.1 ( i = 1 ∑ 30 x i > c ) = 1 − i = 0 ∑ c i ! 3 i e − 3 .
当 c = 5 时,
P 0.1 ( i = 1 ∑ 30 x i > 5 ) = 0.0839 ,
当 c = 6 时,
P 0.1 ( i = 1 ∑ 30 x i > 6 ) = 0.0335.
因此,该检验问题的拒绝域为
W = { i = 1 ∑ 30 x i > 6 } .
(2) 势函数的计算公式为
g ( λ ) = P λ ( i = 1 ∑ 30 x i > 6 ) = 1 − i = 0 ∑ 6 i ! ( 30 λ ) i e − 30 λ ,
则 λ = 0.05 , 0.2 , … , 0.9 时的势计算如下表:
λ g ( λ ) 0.05 9.3 × 1 0 − 4 0.2 0.39 0.3 0.79 0.4 0.95 0.5 0.99 0.6 1.00 0.7 1.00 0.8 1.00 0.9 1.00
势函数图如图 7.2 。
\FigureSevenTwo
设正态总体的方差 σ 2 已知,均值 μ 只能取 μ 0 或 μ 1 (μ 1 < μ 0 )两值之一,x ˉ 为总体的容量为 n 的样本均值,考虑检验问题
H 0 : μ = μ 0 vs H 1 : μ = μ 1 ,
若检验拒绝域取为
W = { x ˉ ≤ μ 0 + u α σ / n } ,
则检验犯第二类错误的概率为
β = P μ 1 ( x ˉ > μ 0 + u α σ / n ) .
试验证:
β = Φ ( u 1 − α + σ / n μ 1 − μ 0 ) ,
从而在 α , β 给定时,有
n = ( u 1 − α + u 1 − β ) 2 ( μ 1 − μ 0 ) 2 σ 2 ;
若 n 固定,当 α 减小时 β 怎样变化?当 β 减小时 α 怎样变化?
当 σ = 0.12 ,μ 1 = μ 0 − 0.02 ,并且要求 α ≤ 0.05 , β ≤ 0.025 时,样本容量 n 至少应为多少?
解
(1) 由于 x ˉ ∼ N ( μ , σ 2 / n ) ,故检验犯第二类错误的概率为
β = P μ 1 ( x ˉ − μ 1 > μ 0 + σ u α / n − μ 1 ) = P μ 1 ( σ / n x ˉ − μ 1 > u α + σ / n μ 0 − μ 1 ) = 1 − Φ ( u α + σ / n μ 0 − μ 1 ) = Φ ( − u α − σ / n μ 0 − μ 1 ) = Φ ( u 1 − α + σ / n μ 1 − μ 0 ) .
这给出
u 1 − α + σ / n μ 1 − μ 0 = u β ,
也即
u 1 − α + u 1 − β = σ / n μ 1 − μ 0 .
从而在 α , β 给定时,有
n = ( u 1 − α + u 1 − β ) 2 ( μ 1 − μ 0 ) 2 σ 2 .
(2) 若 n 固定,当 α 减小时,u 1 − α 就变大,由
u 1 − α + u 1 − β = σ / n μ 1 − μ 0
为常量可知 u 1 − β 就变小,从而导致 β 增大。
同理可知:当 β 减小时 α 增大。
这说明,在样本量给定时,犯两类错误的概率一个变小另一个就会变大,不可能找到一个使得犯两类错误的概率都变小的检验方案。
(3) 由 α ≤ 0.05 , β ≤ 0.025 查表可得 u 1 − α ≥ 1.645 , u 1 − β ≥ 1.96 ,于是
n = ( u 1 − α + u 1 − β ) 2 ( μ 1 − μ 0 ) 2 σ 2 ≥ ( μ 1 − μ 0 ) 2 ( 1.645 + 1.96 ) 2 σ 2 .
将 σ = 0.12 ,μ 1 = μ 0 − 0.02 代入,有
n ≥ 0.0 2 2 ( 1.645 + 1.96 ) 2 ⋅ 0.1 2 2 = 467.86 ,
即 n 至少应为 468 。
假定 X 是连续随机变量,x 是 X 的一次观测值。关于总体密度函数 f ( x ) 有如下两个假设:
H 0 : f ( x ) = { 1/2 , 0 , 0 ≤ x ≤ 2 , 其他 , vs H 1 : f ( x ) = { x /2 , 0 , 0 ≤ x ≤ 2 , 其他 .
检验的判断规则是:若 x ≥ 2/3 则拒绝原假设 H 0 ,试求检验犯两类错误的概率。
解
由所给条件,犯第一类错误的概率为
α = P ( x ≥ 3 2 ∣ H 0 ) = ∫ 2/3 2 2 1 d x = 3 2 ,
犯第二类错误的概率为
β = P ( x < 3 2 ∣ H 1 ) = ∫ 0 2/3 2 x d x = 4 1 × ( 3 2 ) 2 = 9 1 .
这个检验犯两类错误的概率都不小,不是一个好的检验,主要原因是样本量太小。
设 x 1 , x 2 , … , x n 是来自 U ( 0 , θ ) 的一个样本,对如下的检验问题
H 0 : θ ≤ 2 1 vs H 1 : θ > 2 1
已给出拒绝域
W = { x ( n ) ≥ c } ,
其中 x ( n ) 为样本的最大次序统计量。
求此检验的势函数;
若要求检验犯第一类错误概率不超过 0.05 (即 α ( θ ) ≤ 0.05 ),如何确定 c ?
若在(2)的要求下进一步要求检验在 θ = 4 3 处犯第二类错误的概率不超过 0.02 (即 β ( θ ) ≤ 0.02 ),n 至少要取多少?
如今 n = 20 , x ( 20 ) = 0.48 ,对此检验问题作出判断。
解
(1) 此检验的势函数为
g ( θ ) = P ( x ( n ) ≥ c ) = 1 − P ( x ( n ) < c ) = 1 − P ( x 1 < c , x 2 < c , … , x n < c ) = ⎩ ⎨ ⎧ 0 , 1 − ( θ c ) n , θ ≤ c , θ > c .
可见,在 θ > c 时,势函数 g ( θ ) 是 θ 的严格增函数。
(2) 在 H 0 成立下,犯第一类错误的概率为 α ( θ ) = g ( θ ) ,故由题意知,应有
g ( θ ) = 1 − ( θ c ) n ≤ 0.05 , θ ≤ 2 1 .
由于 g ( θ ) 是增函数,故 g ( θ ) 在 θ = 2 1 处达到最大值,故只要使
g ( 2 1 ) = 1 − ( 2 c ) n = 0.05
即可实现,由此解出
c = 2 1 ( 0.95 ) 1/ n .
譬如,在 n = 5 时,c = 0.4949 ;在 n = 10 时,c = 0.4974 。
(3) 在备择假设 H 1 成立下,犯第二类错误的概率为
β ( θ ) = 1 − g ( θ ) = ( θ c ) n , θ > 2 1 .
现要求在 θ = 4 3 处有 β ( θ ) ≤ 0.02 ,即
( 3/4 c ) n ≤ 0.02.
若把(2)中的
c = 2 1 ( 0.95 ) 1/ n
代入,可得
n ≥ ln 3 − ln 2 ln 95 − ln 2 = 9.52.
可见,若取 n = 10 即可使 θ = 4 3 处犯第二类错误的概率不超过 0.02 。
(4) 若样本量 n = 20 ,则其拒绝域为
W = { x ( n ) ≥ c 0 } , 其中 c 0 = 2 1 ( 0.95 ) 1/20 = 0.4987.
如今 x ( n ) = 0.48 < c 0 ,故应接受原假设 H 0 : θ ≤ 2 1 。
设 x 1 , x 2 , … , x n 是来自泊松分布 P ( λ ) 的一个样本。
利用泊松分布的充分统计量对检验问题
H 0 : λ = λ 0 vs H 1 : λ = λ 1 ( λ 1 > λ 0 )
在显著性水平 α 时给出其拒绝域;
证明(1)中的拒绝域也是检验问题
H 0 : λ ≤ λ 0 vs H 1 : λ > λ 0
的显著性水平为 α 的显著性检验的拒绝域;
当样本量 n 较大时,由中心极限定理给出近似的拒绝域。
解
(1) 泊松分布 P ( λ ) 的充分统计量是 x ˉ ,它是 λ 的无偏估计。若原假设 H 0 : λ = λ 0 成立,则 x ˉ 不应该很大,因此,当 x ˉ 较大时,就应该拒绝原假设 λ = λ 0 ,所以此检验的拒绝域应有形式
W = { x ˉ ≥ c } = { i = 1 ∑ n x i ≥ n c } ,
其中 c 应由给定的显著性水平 α 确定,即 c 由概率不等式
P λ 0 ( i = 1 ∑ n x i ≥ n c ) ≤ α
或
P λ 0 ( i = 1 ∑ n x i < n c ) ≥ 1 − α
确定。由于原假设成立下 x i ∼ P ( λ 0 ) ,故
i = 1 ∑ n x i ∼ P ( n λ 0 ) .
若令泊松分布 P ( n λ 0 ) 的 1 − α 分位数为 k 1 − α ,则由 n c = k 1 − α 可得
c = n k 1 − α .
所以在给定 α 时,该检验的拒绝域为
W = { x ˉ ≥ n k 1 − α } ,
这里 k 1 − α 的寻求还不是一件易事。
(2) 若将上述拒绝域作为此处检验问题的拒绝域,我们只需要证明确该检验的势函数是单调增的即可说明它也是(2)的显著性水平为 α 的显著性检验。此处该检验的势函数为
g ( λ ) = P λ ( x ˉ ≥ n k 1 − α ) = 1 − P λ ( x ˉ < n k 1 − α ) = 1 − k = 0 ∑ m k ! ( nλ ) k e − nλ ,
其中 m 为如下整数:
m = { k 1 − α − 1 , ⌊ k 1 − α ⌋ , k 1 − α 为整数 , k 1 − α 为非整数 .
考察 g ( λ ) 的单调性,为此求其导数
g ′ ( λ ) = − k = 0 ∑ m k ! 1 [ nk ( nλ ) k − 1 e − nλ − n ( nλ ) k e − nλ ] = n e − nλ [ k = 0 ∑ m k ! ( nλ ) k − k = 0 ∑ m − 1 k ! ( nλ ) k ] = n e − nλ m ! ( nλ ) m > 0.
所以势函数 g ( λ ) 是 λ 的严格增函数。由此可知,在原假设 H 0 : λ ≤ λ 0 上,g ( λ ) 在 λ = λ 0 处达到最大。
(3) 当样本量 n 较大时,由中心极限定理可得原假设成立时 x ˉ 的渐近分布
λ 0 / n x ˉ − λ 0 ∼ ˙ N ( 0 , 1 ) .
对给定的显著性水平 α ,有
P ( λ 0 / n x ˉ − λ 0 ≥ u 1 − α ) = α ,
P ( x ˉ ≥ λ 0 + u 1 − α n λ 0 ) = α ,
即拒绝域 W 中的临界值
c = λ 0 + u 1 − α n λ 0 .
譬如,λ 0 = 1.5 , n = 10 和 α = 0.05 时,有
c = 1.5 + 1.645 10 1.5 = 2.1371 ,
即当 n = 10 时,若 x ˉ ≥ 2.1371 ,则应拒绝原假设 H 0 : λ ≤ 1.5 。
设 x 1 , x 2 , … , x n 是来自瑞利(Rayleigh)分布 R a ( θ ) 的一个样本,瑞利分布的密度函数为
p ( x ) = ⎩ ⎨ ⎧ θ 2 2 x exp { − θ 2 x 2 } , 0 , x > 0 , x ≤ 0 ( θ > 0 ) .
求此分布的充分统计量;
利用充分统计量在给定显著性水平 α 下给出检验问题
H 0 : θ = 1 vs H 1 : θ > 1
的拒绝域;
在样本量较大时,利用中心极限定理给出近似拒绝域。
解
(1) 样本的联合密度函数为
p ( x 1 , x 2 , … , x n ) = ( i = 1 ∏ n θ 2 2 x i ) exp { − θ 2 1 i = 1 ∑ n x i 2 } = exp { − θ 2 1 i = 1 ∑ n x i 2 − 2 n ln θ } i = 1 ∏ n 2 x i .
由因子分解定理知,θ 的充分统计量是
T = i = 1 ∑ n x i 2 .
(2) 注意到
E ( x 2 ) = ∫ 0 ∞ θ 2 2 x 3 exp { − θ 2 x 2 } d x = θ 2 ∫ 0 ∞ θ 2 x 2 exp { − θ 2 x 2 } d ( θ 2 x 2 ) = θ 2 ∫ 0 ∞ y e − y d y = θ 2 Γ ( 2 ) = θ 2 .
由此可见
n 1 i = 1 ∑ n x i 2
是 θ 2 的无偏估计。当
T = i = 1 ∑ n x i 2
较大时,拒绝原假设 H 0 : θ = 1 是合理的。故
H 0 : θ = 1 vs H 1 : θ > 1
的拒绝域为
W = { i = 1 ∑ n x i 2 ≥ c } ,
其中 c 由概率等式
P ( i = 1 ∑ n x i 2 ≥ c ) = α
确定。为了确定 c ,需要充分统计量
T = i = 1 ∑ n x i 2
的分布。
可以证明,当 X ∼ R a ( θ ) 时,
X 2 ∼ E x p ( θ 2 1 ) = G a ( 1 , θ 2 1 ) ,
由此可得
i = 1 ∑ n x i 2 ∼ G a ( n , θ 2 1 ) ,
或者
θ 2 2 i = 1 ∑ n x i 2 ∼ G a ( n , 2 1 ) = χ 2 ( 2 n ) .
在原假设 H 0 : θ = 1 成立下,有
2 i = 1 ∑ n x i 2 ∼ χ 2 ( 2 n ) ,
利用 χ 2 分布的分位数可确定临界值 c 。由等式
P ( i = 1 ∑ n x i 2 ≥ c ) = α
可得
P ( 2 i = 1 ∑ n x i 2 < 2 c ) = 1 − α .
记 χ 1 − α 2 ( 2 n ) 是 χ 2 分布的 1 − α 分位数,可得
2 c = χ 1 − α 2 ( 2 n ) , 或 c = 2 1 χ 1 − α 2 ( 2 n ) .
譬如,当 n = 15 , α = 0.05 时,
χ 0.95 2 ( 30 ) = 43.773 ,
所以
c = 21.887 ,
即当检验统计量
i = 1 ∑ n x i 2 ≥ 21.887
时,将拒绝原假设 H 0 : θ = 1 。
(3) 由
X 2 ∼ E x p ( θ 2 1 )
可知
E ( X 2 ) = θ 2 , \Var ( X 2 ) = θ 4 ,
从而有
E ( i = 1 ∑ n x i 2 ) = n θ 2 , \Var ( i = 1 ∑ n x i 2 ) = n θ 4 .
在原假设 H 0 : θ = 1 成立下,有
E ( i = 1 ∑ n x i 2 ) = n , \Var ( i = 1 ∑ n x i 2 ) = n .
这里
i = 1 ∑ n x i 2
可看作 n 个相互独立同分布随机变量之和,故由中心极限定理知
n ∑ i = 1 n x i 2 − n ∼ ˙ N ( 0 , 1 ) ,
从而有
P ( i = 1 ∑ n x i 2 ≥ c ) = P ( n ∑ i = 1 n x i 2 − n ≥ n c − n ) = 1 − Φ ( n c − n ) .
故由等式
P ( i = 1 ∑ n x i 2 ≥ c ) = α
可得
Φ ( n c − n ) = 1 − α .
记 u 1 − α 为标准正态分布的 1 − α 分位数,则有
n c − n = u 1 − α ,
即
c = n + u 1 − α n .
若 n = 15 , α = 0.05 ,查表得 u 1 − α = u 0.95 = 1.645 ,从而
c = 15 + 1.645 15 = 21.371.
这个结果与(2)定出的精确值较为接近。
§7.2 正态总体参数假设检验
单个正态总体均值的假设检验
当总体服从正态分布时,关于均值 μ 的常用检验方法如下。这里 x ˉ 和 s 分别为样本均值与样本标准差,u 0 , t 0 表示相应检验统计量的观测值;U ∼ N ( 0 , 1 ) ,T ∼ t ( n − 1 ) 。
\begingroup
\footnotesize
\setlength{\tabcolsep}{4pt}
\renewcommand{\arraystretch}{1.25}
检验法 H 0 H 1 检验统计量 拒绝域 p 值u 检验(σ 已知)μ ≤ μ 0 μ > μ 0 u = σ / n x ˉ − μ 0 u ≥ u 1 − α 1 − Φ ( u 0 ) u 检验(σ 已知)μ ≥ μ 0 μ < μ 0 u = σ / n x ˉ − μ 0 u ≤ u α Φ ( u 0 ) u 检验(σ 已知)μ = μ 0 μ = μ 0 u = σ / n x ˉ − μ 0 ∥ u ∥ ≥ u 1 − α /2 2 ( 1 − Φ ( ∥ u 0 ∥ ) ) t 检验(σ 未知)μ ≤ μ 0 μ > μ 0 t = s / n x ˉ − μ 0 t ≥ t 1 − α ( n − 1 ) P ( T ≥ t 0 ) t 检验(σ 未知)μ ≥ μ 0 μ < μ 0 t = s / n x ˉ − μ 0 t ≤ t α ( n − 1 ) P ( T ≤ t 0 ) t 检验(σ 未知)μ = μ 0 μ = μ 0 t = s / n x ˉ − μ 0 ∥ t ∥ ≥ t 1 − α /2 ( n − 1 ) P ( ∥ T ∥ ≥ ∥ t 0 ∥ )
\endgroup
检验问题 H 0 : μ = μ 0 vs H 1 : μ > μ 0 与 H 0 : μ ≤ μ 0 vs H 1 : μ > μ 0 的拒绝域相同,p 值也相同;另一对单侧检验同理。
假设检验与置信区间的关系
设显著性水平为 α ,置信水平为 1 − α ,则有如下对应关系:
双侧检验问题 H 0 : μ = μ 0 vs H 1 : μ = μ 0 的接受域可导出正态总体均值 μ 的 1 − α 置信区间。
单侧检验问题 H 0 : μ ≤ μ 0 vs H 1 : μ > μ 0 的接受域可导出正态总体均值 μ 的 1 − α 置信下限。
单侧检验问题 H 0 : μ ≥ μ 0 vs H 1 : μ < μ 0 的接受域可导出正态总体均值 μ 的 1 − α 置信上限。
两个正态总体均值差的假设检验
设 x ˉ , s 1 2 分别来自正态总体 N ( μ 1 , σ 1 2 ) 的样本 x 1 , … , x m ,y ˉ , s 2 2 分别来自正态总体 N ( μ 2 , σ 2 2 ) 的样本 y 1 , … , y n ,则常用检验方法如下:
\begingroup
\footnotesize
\setlength{\tabcolsep}{4pt}
\renewcommand{\arraystretch}{1.2}
检验法 条件 H 0 H 1 检验统计量 拒绝域 p 值u 检验σ 1 , σ 2 已知μ 1 ≤ μ 2 μ 1 > μ 2 u = σ 1 2 / m + σ 2 2 / n x ˉ − y ˉ u ≥ u 1 − α 1 − Φ ( u 0 ) u 检验σ 1 , σ 2 已知μ 1 ≥ μ 2 μ 1 < μ 2 u = σ 1 2 / m + σ 2 2 / n x ˉ − y ˉ u ≤ u α Φ ( u 0 ) u 检验σ 1 , σ 2 已知μ 1 = μ 2 μ 1 = μ 2 u = σ 1 2 / m + σ 2 2 / n x ˉ − y ˉ ∥ u ∥ ≥ u 1 − α /2 2 ( 1 − Φ ( ∥ u 0 ∥ ) ) t 检验σ 1 = σ 2 未知μ 1 ≤ μ 2 μ 1 > μ 2 t = s w 1/ m + 1/ n x ˉ − y ˉ t ≥ t 1 − α ( m + n − 2 ) P ( T ≥ t 0 ) t 检验σ 1 = σ 2 未知μ 1 ≥ μ 2 μ 1 < μ 2 t = s w 1/ m + 1/ n x ˉ − y ˉ t ≤ t α ( m + n − 2 ) P ( T ≤ t 0 ) t 检验σ 1 = σ 2 未知μ 1 = μ 2 μ 1 = μ 2 t = s w 1/ m + 1/ n x ˉ − y ˉ ∥ t ∥ ≥ t 1 − α /2 ( m + n − 2 ) P ( ∥ T ∥ ≥ ∥ t 0 ∥ ) 大样本 u 检验 m , n 充分大μ 1 ≤ μ 2 μ 1 > μ 2 u = s 1 2 / m + s 2 2 / n x ˉ − y ˉ u ≥ u 1 − α 1 − Φ ( u 0 ) 大样本 u 检验 m , n 充分大μ 1 ≥ μ 2 μ 1 < μ 2 u = s 1 2 / m + s 2 2 / n x ˉ − y ˉ u ≤ u α Φ ( u 0 ) 大样本 u 检验 m , n 充分大μ 1 = μ 2 μ 1 = μ 2 u = s 1 2 / m + s 2 2 / n x ˉ − y ˉ ∥ u ∥ ≥ u 1 − α /2 2 ( 1 − Φ ( ∥ u 0 ∥ ) ) 近似 t 检验 m , n 不很大μ 1 ≤ μ 2 μ 1 > μ 2 t = s 1 2 / m + s 2 2 / n x ˉ − y ˉ t ≥ t 1 − α ( l ) P ( T ≥ t 0 ) 近似 t 检验 m , n 不很大μ 1 ≥ μ 2 μ 1 < μ 2 t = s 1 2 / m + s 2 2 / n x ˉ − y ˉ t ≤ t α ( l ) P ( T ≤ t 0 ) 近似 t 检验 m , n 不很大μ 1 = μ 2 μ 1 = μ 2 t = s 1 2 / m + s 2 2 / n x ˉ − y ˉ ∥ t ∥ ≥ t 1 − α /2 ( l ) P ( ∥ T ∥ ≥ ∥ t 0 ∥ )
\endgroup
其中
s w 2 = m + n − 2 ( m − 1 ) s 1 2 + ( n − 1 ) s 2 2 , l = m 2 ( m − 1 ) s 1 4 + n 2 ( n − 1 ) s 2 4 ( m s 1 2 + n s 2 2 ) 2 .
在近似 t 检验中,统计量近似服从自由度为 l 的 t 分布。
单个和两个正态总体方差的假设检验
\begingroup
\footnotesize
\setlength{\tabcolsep}{4pt}
\renewcommand{\arraystretch}{1.2}
检验法 H 0 H 1 检验统计量 拒绝域 p 值χ 2 检验σ 2 ≤ σ 0 2 σ 2 > σ 0 2 χ 0 2 = σ 0 2 ( n − 1 ) s 2 χ 2 ≥ χ 1 − α 2 ( n − 1 ) P ( χ 2 ≥ χ 0 2 ) χ 2 检验σ 2 ≥ σ 0 2 σ 2 < σ 0 2 χ 0 2 = σ 0 2 ( n − 1 ) s 2 χ 2 ≤ χ α 2 ( n − 1 ) P ( χ 2 ≤ χ 0 2 ) χ 2 检验σ 2 = σ 0 2 σ 2 = σ 0 2 χ 0 2 = σ 0 2 ( n − 1 ) s 2 χ 2 ≤ χ α /2 2 ( n − 1 ) 或 χ 2 ≥ χ 1 − α /2 2 ( n − 1 ) 2 min { P ( χ 2 ≤ χ 0 2 ) , P ( χ 2 ≥ χ 0 2 )} F 检验σ 1 2 ≤ σ 2 2 σ 1 2 > σ 2 2 F 0 = s 2 2 s 1 2 F ≥ F 1 − α ( m − 1 , n − 1 ) P ( F ≥ F 0 ) F 检验σ 1 2 ≥ σ 2 2 σ 1 2 < σ 2 2 F 0 = s 2 2 s 1 2 F ≤ F α ( m − 1 , n − 1 ) P ( F ≤ F 0 ) F 检验σ 1 2 = σ 2 2 σ 1 2 = σ 2 2 F 0 = s 2 2 s 1 2 F ≤ F α /2 ( m − 1 , n − 1 ) 或 F ≥ F 1 − α /2 ( m − 1 , n − 1 ) 2 min { P ( F ≤ F 0 ) , P ( F ≥ F 0 )}
\endgroup
这里 s 2 为单个正态总体样本方差,s 1 2 , s 2 2 分别为两个正态总体样本方差。
成对数据检验
成对数据检验就是把两个总体均值的比较通过成对数据的差转变为对单个总体均值的检验,方法完全等同。
成对数据的获得事先要作周全的安排(即试验设计)。在获得成对数据时不要发生“错位”,从而准确获得“成对数据”的信息。
习题与解答 7.2
本节习题均采用拒绝域的形式完成,在可以计算检验的 p 值时要求计算出 p 值。
有一批枪弹,出厂时,其初速率 v ∼ N ( 950 , 100 ) (单位:m/s )。经过较长时间储存,取 9 发进行测试,得样本值(单位:m/s )如下:
914 920 910 934 953 945 912 924 940
据经验,枪弹经储存后其初速率仍服从正态分布,且标准差保持不变,问是否可以认为这批枪弹的初速率有显著降低(α = 0.05 )?
解
这是一个单侧假设检验问题,总体 v ∼ N ( 950 , 100 ) ,待检验的原假设 H 0 和备择假设 H 1 分别为
H 0 : μ = 950 vs H 1 : μ < 950.
在显著性水平 α 下,检验的拒绝域为 { u ≤ u α } 。若取 α = 0.05 ,查表知 u 0.05 = − 1.645 。经计算得,x ˉ = 928 ,
u = 10/3 928 − 950 = − 6.6 ,
此处 u 值落入拒绝域内,故拒绝原假设,可以判断这批枪弹的初速率有显著降低。
借助本题说明一点:本题中的一对假设
H 0 : μ = μ 0 vs H 1 : μ < μ 0
的检验与另一对假设
H 0 : μ ≥ μ 0 vs H 1 : μ < μ 0
的检验有完全相同的拒绝域,这是因为二者的拒绝域形式相同,都形如
W = { σ / n x ˉ − μ 0 ≤ c } ,
由于使用该拒绝域的检验的势函数为
g ( μ ) = P ( σ / n x ˉ − μ 0 ≤ c ) = Φ ( σ / n μ 0 − μ + c ) ,
是 μ 的减函数,因而要求
μ ≥ μ 0 max g ( μ ) = α
与要求 g ( μ 0 ) = α 等价,从而两个检验问题的拒绝域完全一致。这现象不是偶然的,具有普遍性,这从势函数的单调性得到保证。
已知某炼铁厂铁水含碳量服从正态分布 N ( 4.55 , 0.10 8 2 ) 。现在测定了 9 炉铁水,其平均含碳量为 4.484 ,如果铁水含碳量的方差没有变化,可否认为现在生产的铁水平均含碳量仍为 4.55 (α = 0.05 )?
解
这是关于正态总体均值的双侧假设检验问题,原假设 H 0 和备择假设 H 1 分别为
H 0 : μ = 4.55 vs H 1 : μ = 4.55.
由于总体方差已知,故采用 u 检验,检验的拒绝域为 { ∣ u ∣ ≥ u 1 − α /2 } 。当 α = 0.05 时,查表知 u 0.975 = 1.96 。由已知条件,x ˉ = 4.484 ,故
u = 0.108/3 4.484 − 4.55 = − 1.83.
这里 u 值没有落入拒绝域,故不能拒绝原假设,因而可以认为生产的铁水平均含碳量仍为 4.55 。
由经验知某零件质量 X ∼ N ( 15 , 0.0 5 2 ) (单位:g );技术革新后,抽出 6 个零件,测得质量为
14.7 15.1 14.8 15.0 15.2 14.6
已知方差不变,问平均质量是否仍为 15 g (取 α = 0.05 )?
解
本题归结为对方差已知时检验正态总体均值 μ = 15 的问题,而且这是一个双侧假设检验问题,检验的拒绝域为 { ∣ u ∣ ≥ u 1 − α /2 } 。由 α = 0.05 ,查表知 u 0.975 = 1.96 。使用样本数据可算得,
x ˉ = 14.9 , u = 6 0.05 14.9 − 15 = − 4.90.
由于 ∣ u ∣ = 4.90 > 1.96 ,故有充分理由拒绝原假设,因而不能认为产品的平均质量仍为 15 g 。
下面我们对该题的问题作些讨论。此类问题的回答与已知的 σ 0 有很大关系,本题中假设 σ 0 = 0.05 ,得出的结论是拒绝原假设;若假定 σ 0 = 0.15 ,则可算得 u = − 1.63 ,这样一来就应接受原假设,所以在实用中对标准差的假定要慎重,若无把握,可考虑设总体标准差未知,此时就应使用 t 检验。本题中,若假定总体标准差未知,则可由样本算得
s = 0.237 ,
于是
t = 6 0.237 14.9 − 15 = − 1.0335 ,
而拒绝域为
W = { ∣ t ∣ ≥ t 0.975 ( 5 )} = { ∣ t ∣ ≥ 2.5706 } ,
故应接受原假设。
化肥厂用自动包装机包装化肥,每包的质量服从正态分布,其平均质量为 100 kg ,标准差为 1.2 kg 。某日开工后,为了确定这天包装机工作是否正常,随机抽取 9 袋化肥,称得质量(单位:kg )如下:
99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5
设方差稳定不变,问这一天包装机的工作是否正常(取 α = 0.05 )?
解
这是一个双侧假设检验问题,总体 X ∼ N ( μ , 1. 2 2 ) ,待检验的问题为
H 0 : μ = 100 vs H 1 : μ = 100 ,
检验拒绝域为 { ∣ u ∣ ≥ u 1 − α /2 } 。若取 α = 0.05 ,查表知 u 0.975 = 1.96 。由样本数据算得
x ˉ = 99.98 , u = 3 ( 99.98 − 100 ) /1.2 = − 0.05.
此处 u 值未落入拒绝域内,因此不能拒绝原假设,不能认为这一天包装机的工作不正常。
设需要对某正态总体的均值进行假设检验
H 0 : μ = 15 vs H 1 : μ < 15.
已知 σ 2 = 2.5 ,取 α = 0.05 ,若要求当 H 1 中的 μ ≤ 13 时犯第二类错误的概率不超过 0.05 ,求所需的样本容量。
解
由于本题中正态总体的方差已知,对于单侧假设检验问题,拒绝域的形式为
{ u ≤ u α } , 其中 u = 2.5/ n x ˉ − 15 .
若取显著性水平 α = 0.05 ,查表得知 u 0.05 = − 1.645 ,即检验的拒绝域为 { u ≤ − 1.645 } 。于是,当 μ ≤ 13 时,检验犯第二类错误的概率应满足
β = P ( u > − 1.645 ∣ μ ≤ 13 ) ≤ 0.05 ,
即
β = P ( 2.5/ n x ˉ − 15 > − 1.645 ) = P ( 2.5/ n x ˉ − μ > − 1.645 + 2.5/ n 15 − μ ) = 1 − Φ ( − 1.645 + 2.5/ n 15 − μ ) ≤ 0.05.
由于 Φ 是 μ 的减函数,因此只需满足
− 1.645 + 2.5/ n 15 − 13 ≥ 1.645
即可,由此可解得
n ≥ 7.
从一批钢管抽取 10 根,测得其内径(单位:mm )为
100.36 100.85 100.31 99.42 99.99 99.91 100.11 99.35 100.64 100.10
设这批钢管内径服从正态分布 N ( μ , σ 2 ) ,试分别在下列条件下:
已知 σ = 0.5 ;
σ 未知;
检验假设(α = 0.05 )
H 0 : μ = 100 vs H 1 : μ > 100.
解
(1) 当 σ = 0.5 已知时,应采用 u 检验,此时检验的拒绝域为 { u ≥ u 1 − α } 。若取 α = 0.05 ,查表知 u 0.95 = 1.645 ,由样本数据计算
x ˉ = 100.104 , u = 0.5 10 ( 100.104 − 100 ) = 0.6578.
检验统计量未落入拒绝域中,应接受原假设,不能认为 μ > 100 。
(2) 当 σ 未知时,应采用 t 检验,拒绝域为 { t ≥ t 1 − α ( n − 1 )} ,其中检验统计量
t = s / n x ˉ − μ 0 .
取显著性水平 α = 0.05 ,查表得 t 0.95 ( 9 ) = 1.8331 ,由样本观测值计算
s = 0.4760 , t = 10 0.4760 100.104 − 100 = 0.6909 < 1.8331 ,
故接受原假设。
假定考生成绩服从正态分布,在某地一次数学统考中,随机抽取了 36 位考生的成绩,算得平均成绩为 66.5 分,标准差为 15 分,问在显著性水平 0.05 下,是否可以认为这次考试全体考生的平均成绩为 70 分?
解
本题是关于正态总体均值的假设检验问题,由于总体方差未知,故用 t 检验法,欲检验的一对假设为
H 0 : μ = 70 vs H 1 : μ = 70 ,
拒绝域为
{ ∣ t ∣ ≥ t 1 − α /2 ( n − 1 )} .
当显著性水平为 0.05 时,t 0.975 ( 35 ) = 2.0301 。由已知条件,x ˉ = 66.5 , s = 15 ,故检验统计量的值为
t = 15 6 ( 66.5 − 70 ) = − 1.4.
因为 ∣ t ∣ = 1.4 < 2.0301 ,故接受原假设,可以认为这次考试全体考生的平均成绩与 70 分无显著差异。
注:这里没给出容量为 36 的样本数据,只给出样本均值 x ˉ 与样本标准差 s 。由于 x ˉ 与 s 是正态分布 N ( μ , σ 2 ) 的充分统计量,而充分统计量不会失落样本中的有用信息,故给出 x ˉ 与 s 的值,等价于给出具体的样本数据。这一现象会在很多场合里出现。
一位中学校长在报纸上看到这样的报道:“这一城市的初中学生平均每周看 8 h 电视。”她认为她所在学校的学生看电视的时间明显小于该数字。为此她在该校随机调查了 100 个学生,得知平均每周看电视的时间 x ˉ = 6.5 h ,样本标准差为 s = 2 h ,问是否可以认为这位校长的看法是对的(取 α = 0.05 )?
解
由于本题中样本量较大,可以认为样本均值服从正态分布,依题意,需要建立的原假设和备择假设为
H 0 : μ = 8 vs H 1 : μ < 8.
若取 α = 0.05 ,则 u 0.05 = − 1.645 ,拒绝域为 { u ≤ − 1.645 } ,由样本观测值算得
u = 2 10 ( 6.5 − 8 ) = − 7.5 < − 1.645 ,
因而拒绝原假设,认为这位校长的看法是对的。
设在木材中抽出 100 根,测其小头直径,得到样本平均数为 x ˉ = 11.2 cm ,样本标准差 s = 2.6 cm ,问能否认为该批木材小头的平均直径不低于 12 cm (取 α = 0.05 )?
解
本题与第 8 题类似,只是这里的原假设和备择假设分别为
H 0 : μ ≥ 12 vs H 1 : μ < 12 ,
拒绝域为 { u ≤ u α } ,当 α = 0.05 时,u 0.05 = − 1.645 ,检验统计量
u = 2.6 10 ( 11.2 − 12 ) = − 3.0769 < − 1.645.
u 值落入拒绝域内,因此拒绝原假设,不能认为该批木材小头的平均直径不低于 12 cm 。
考察一鱼塘中鱼的含汞量,随机地取 10 条鱼测得各条鱼的含汞量(单位:mg )为
0.8 1.6 0.9 0.8 1.2 0.4 0.7 1.0 1.2 1.1
设鱼的含汞量服从正态分布 N ( μ , σ 2 ) ,试检验假设
H 0 : μ ≤ 1.2 vs H 1 : μ > 1.2
(取 α = 0.10 )。
解
这是在总体方差未知下关于正态分布均值的单侧检验问题,检验的拒绝域为 { t ≥ t 1 − α ( n − 1 )} 。当 α = 0.10 时,查表知 t 0.9 ( 9 ) = 1.3830 ,由样本观测值计算得到
x ˉ = 0.97 , s = 0.3302 ,
t = 10 0.3302 0.97 − 1.2 = − 2.2027 < 1.3830 ,
故在显著性水平 0.1 下接受原假设。
如果一个矩形的宽度 w 与长度 l 的比
l w = 2 1 ( 5 − 1 ) ≈ 0.618 ,
这样的矩形称为黄金矩形。下面列出某工艺品厂随机抽取的 20 个矩形宽度与长度的比值:
0.693 0.668 0.749 0.611 0.654 0.606 0.670 0.609 0.662 0.553 0.672 0.570 0.615 0.844 0.606 0.576 0.690 0.933 0.628 0.630
设这一工厂生产的矩形的宽度与长度的比值总体服从正态分布,其均值为 μ ,试检验假设(取 α = 0.05 )
H 0 : μ = 0.618 vs H 1 : μ = 0.618.
解
这是关于正态分布均值的双侧检验问题,此处总体方差未知,故拒绝域为 { ∣ t ∣ ≥ t 1 − α /2 ( n − 1 )} 。若取显著性水平 α = 0.05 ,查表知 t 0.975 ( 19 ) = 2.0930 。经计算
x ˉ = 0.6620 , s = 0.0918 ,
由此,检验统计量
t = 20 0.0918 0.6620 − 0.618 = 2.1435.
由于 t 值落入拒绝域内,因此在显著性水平 α = 0.05 下拒绝原假设。
下面给出两种型号的计算器充电以后所能使用的时间(单位:h )的观测值
型号 A 型号 B 5.5 3.8 5.6 4.3 6.3 4.2 4.6 4.0 5.3 4.9 5.0 4.5 6.2 5.2 5.8 4.8 5.1 4.5 5.2 3.9 5.9 3.7 4.6
设两样本独立且数据所属的两正态总体的密度函数至多差一个平移量。试问能否认为型号 A 的计算器平均使用时间明显比型号 B 来得长(取 α = 0.01 )?
解
这个问题可归结为关于两总体的均值是否相等的检验问题。两正态总体方差相等但仍未知,故应采用两样本 t 检验。设 X 表示型号 A 的计算器充电以后所能使用的时间,Y 表示型号 B 的计算器充电以后所能使用的时间,则依题意,
X ∼ N ( μ 1 , σ 2 ) , Y ∼ N ( μ 2 , σ 2 ) ,
待检验的假设为
H 0 : μ 1 = μ 2 vs H 1 : μ 1 > μ 2 .
经计算,
x ˉ = 5.5 , y ˉ = 4.3667 , i = 1 ∑ 11 ( x i − x ˉ ) 2 = 2.74 , i = 1 ∑ 12 ( y i − y ˉ ) 2 = 2.4067 ,
从而
s w = 11 + 12 − 2 1 ( 2.74 + 2.4067 ) = 0.4951 ,
t = 0.4951 1/11 + 1/12 5.5 − 4.3667 = 5.4837.
其拒绝域为
{ t ≥ t 1 − α ( m + n − 2 )} = { t ≥ t 0.99 ( 21 )} .
查表知 t 0.99 ( 21 ) = 2.5176 ,由于检验统计量的取值 t > 2.5176 ,故拒绝 H 0 ,可以认为型号 A 的计算器平均使用时间明显比型号 B 来得长。
从某锌矿的东、西两支矿脉中,各抽取样本容量分别为 9 与 8 的样本进行测试,得样本含锌平均数及样本方差如下:
东支: x ˉ 1 = 0.230 , s 1 2 = 0.1337 ,
西支: x ˉ 2 = 0.269 , s 2 2 = 0.1736.
若东、西两支矿脉的含锌量都服从正态分布且方差相同,问东、西两支矿脉含锌量的平均值是否可以看作一样(取 α = 0.05 )?
解
由已知条件,待检验的一对假设为
H 0 : μ 1 = μ 2 vs H 1 : μ 1 = μ 2 .
这是一个双侧检验问题,因而拒绝域为
{ ∣ t ∣ ≥ t 1 − α /2 ( m + n − 2 )} .
由样本数据,算得
s w = 9 + 8 − 2 1 ( 8 × 0.1337 + 7 × 0.1736 ) = 0.3903 ,
检验统计量
t = 0.3903 1/9 + 1/8 0.230 − 0.269 = − 0.2056.
当 α = 0.05 时,t 0.975 ( 15 ) = 2.1314 > 0.2056 ,因此接受 H 0 ,东、西两支矿脉含锌量的均值可以看作一样。
在针织品漂白工艺过程中,要考察温度对针织品断裂强力(主要质量指标)的影响。为了比较 7 0 ∘ C 与 8 0 ∘ C 的影响有无差别,在这两个温度下,分别重复做了 8 次试验,得数据(单位:N )如下:
7 0 ∘ C 时的强力: 8 0 ∘ C 时的强力: 20.5 17.7 18.8 20.3 19.8 20.0 20.9 18.8 21.5 19.0 19.5 20.1 21.0 20.0 21.2 19.1
根据经验,温度对针织品断裂强力的波动没有影响。问在 7 0 ∘ C 时的平均断裂强力与 8 0 ∘ C 时的平均断裂强力间是否有显著差别(假定断裂强力服从正态分布,α = 0.05 )?
解
本题为关于两正态总体均值相等的检验问题,温度对针织品断裂强力的波动没有影响说明二者的方差是相等的。设 X 为 7 0 ∘ C 时针织品的断裂强力,Y 为 8 0 ∘ C 时针织品的断裂强力,
X ∼ N ( μ 1 , σ 2 ) , Y ∼ N ( μ 2 , σ 2 ) ,
待检验的一对假设为
H 0 : μ 1 = μ 2 vs H 1 : μ 1 = μ 2 .
由样本数据可算得
x ˉ = 20.4 , y ˉ = 19.375 , i = 1 ∑ 8 ( x i − x ˉ ) 2 = 6.2 , i = 1 ∑ 8 ( y i − y ˉ ) 2 = 5.515 ,
于是
s w = 8 + 8 − 2 1 ( 6.2 + 5.515 ) = 0.9148 ,
t = 0.9148 1/8 + 1/8 20.4 − 19.375 = 2.2409.
在显著性水平 α = 0.05 时,
t 0.975 ( 14 ) = 2.1448 ,
因此拒绝域为 { ∣ t ∣ ≥ 2.1448 } 。由于 t 值落入拒绝域内,从而拒绝原假设,认为 7 0 ∘ C 时检验的平均断裂强力与 8 0 ∘ C 时的平均断裂强力间有显著差别。
一药厂生产一种新的止痛片,厂方希望验证服用新药片后至开始起作用的时间间隔较原有止痛片至少缩短一半,因此厂方提出需检验假设
H 0 : μ 1 = 2 μ 2 vs H 1 : μ 1 > 2 μ 2 .
此处 μ 1 , μ 2 分别是服用原有止痛片和服用新药片后至开始起作用的时间间隔的总体均值。设两总体均为正态分布且方差分别为已知 σ 1 2 , σ 2 2 ,现分别在两总体中取一样本 x 1 , x 2 , … , x n 和 y 1 , y 2 , … , y m ,设两个样本独立。试给出上述假设检验问题的检验统计量及拒绝域。
解
设 X 为服用原有止痛片后至开始起作用的时间间隔,x 1 , x 2 , … , x n 为样本,Y 为服用新止痛片后至开始起作用的时间间隔,y 1 , y 2 , … , y m 为样本,且两个样本独立,
X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) ,
待检验的一对假设为
H 0 : μ 1 = 2 μ 2 vs H 1 : μ 1 > 2 μ 2 .
为此,先构造 μ 1 − 2 μ 2 的点估计 x ˉ − 2 y ˉ 。由于
x ˉ − 2 y ˉ ∼ N ( μ 1 − 2 μ 2 , n σ 1 2 + m 4 σ 2 2 ) ,
且 σ 1 2 , σ 2 2 已知,故 x ˉ − 2 y ˉ 的分布完全确定。据此,可采用 u 检验方法,检验统计量为
u = σ 1 2 / n + 4 σ 2 2 / m x ˉ − 2 y ˉ .
当 H 0 成立时,u ∼ N ( 0 , 1 ) ,对于本题的检验问题,在给定的显著性水平 α 下,检验的拒绝域为
W = { u ≥ u 1 − α } .
对冷却到 − 0.7 2 ∘ C 的样品用 A , B 两种测量方法测量其熔化到 0 ∘ C 时的潜热,数据如下:
方法 A: 79.98 80.04 80.02 80.04 80.03 80.03 80.04 79.97 方法 A: 80.05 80.03 80.02 80.00 80.02 方法 B: 80.02 79.94 79.98 79.97 80.03 79.95 79.97 79.97
假设它们服从正态分布,方差相等,试检验:两种测量方法的平均性能是否相等(取 α = 0.05 )?
解
设两种方法测量的潜热分别记为 X 和 Y ,并设
X ∼ N ( μ 1 , σ 2 ) , Y ∼ N ( μ 2 , σ 2 ) .
要检验
H 0 : μ 1 = μ 2 vs H 1 : μ 1 = μ 2 ,
可用双样本 t 检验,则检验的拒绝域为
W = {( x , y ) : ∣ t ∣ ≥ t 1 − α /2 ( n + m − 2 )} .
本题中,n = 13 , m = 8 ,直接计算可得
x ˉ = 80.02 , y ˉ = 79.98 ,
s w = n + m − 2 ∑ i = 1 n ( x i − x ˉ ) 2 + ∑ j = 1 m ( y j − y ˉ ) 2 = 19 0.006892 + 0.006888 = 0.02693 ,
因此有
t = 0.02693 80.02 − 79.98 21 104 = 3.31.
而 t 0.975 ( 19 ) = 2.093 < 3.31 ,因此应拒绝原假设,即两种测量方法的平均性能有显著性差异。检验的 p 值为 0.0036 。
为了比较测定污水中氯气含量的两种方法,特在各种场合收集到 8 个污水水样,每个水样均用这两种方法测定氯气含量(单位:mg/l ),具体数据如下:
水样号 1 2 3 4 5 6 7 8 方法一 ( x ) 0.36 1.35 2.56 3.92 5.35 8.33 10.70 10.91 方法二 ( y ) 0.39 0.84 1.76 3.35 4.69 7.70 10.52 10.92 差 ( d = x − y ) − 0.03 0.51 0.80 0.57 0.66 0.63 0.18 − 0.01
设总体为正态分布,试比较两种测定方法是否有显著差异。请写出检验的 p 值和结论(取 α = 0.05 )。
解
一个水样用两种方法测定,测量数据是成对数据。其差 d i = x i − y i 列在上表数据的右侧,若 d i 的样本均值 d ˉ 与样本标准差 s d 分别可算得
d ˉ = 0.4138 , s d = 0.321.
现在要检验的假设为
H 0 : μ = 0 vs H 1 : μ = 0.
使用的检验统计量及其值为
t 1 = s d / 8 d ˉ = 0.321/ 8 0.4138 = 0.1135 0.4138 = 3.646.
对给定的显著性水平 α = 0.05 ,其拒绝域为 { ∣ t 1 ∣ ≥ t 0.975 ( 7 )} ,查表知 t 0.975 ( 7 ) = 2.3646 。由于 ∣ t 1 ∣ > 2.3646 ,故应拒绝原假设,即两种测定污水中氯气含量的方法间有显著差别。检验的 p 值为 0.0082 。
讨论:若对此问题用两样本 t 检验,所得结果完全不同,具体如下。设
X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) ,
X 与 Y 独立,则要检验的假设是
H 0 : μ 1 = μ 2 vs H 1 : μ 1 = μ 2 .
检验统计量是
t 2 = ( s x 2 + s y 2 ) /8 x ˉ − y ˉ .
由两个样本可计算得样本均值与样本方差,它们是
x ˉ = 5.435 , y ˉ = 5.0213 , s x 2 = 17.013 , s y 2 = 17.811.
代入 t 统计量可得
t 2 = ( 17.013 + 17.811 ) /8 5.435 − 5.0213 = 2.0864 0.4137 = 0.198.
对给定的显著性水平 α = 0.05 ,查表得 t 0.975 ( 14 ) = 2.1448 。由于 ∣ t 2 ∣ < 2.1448 ,故不应拒绝原假设,结论与前不一样。
在两个 t 检验统计量 t 1 与 t 2 中,分子是相同的,分母不同,而且相差很大,t 2 的分母为 2.0864 ,t 1 的分母仅为 0.1135 。这是因为 8 个水样的氯气含量之间有较大差别,t 2 的分母将这种差别看作误差归入到标准差中,而 t 1 的分母已不包含水样之间的差异,这就是为什么成对数据用 t 1 统计量更为合理的理由。
一工厂的两个化验室每天同时从工厂的冷却水中取样,测量水中的含气量(1 0 − 6 )一次,下面是 7 天的记录:
室甲: 室乙: 1.15 1.00 1.86 1.90 0.75 0.90 1.82 1.80 1.14 1.20 1.65 1.70 1.90 1.95
设每对数据的差 d i = x i − y i ( i = 1 , 2 , … , 7 ) 来自正态总体,问两化验室测定结果之间有无显著差异(α = 0.01 )?
解
这是成对数据的比较问题,7 个 d i 值为
0.15 , − 0.04 , − 0.15 , 0.02 , − 0.06 , − 0.05 , − 0.05.
不难算出 n = 7 , d ˉ = − 0.0257 , s d = 0.0922 ,于是
t = 0.0922/ 7 − 0.0257 = − 0.7375.
检验的 p 值为 0.4887 。不能认为两化验室测定结果之间有显著差异。
为比较正常成年男女所含红血球(单位:1 0 4 / mm 3 )的差异,对某地区 156 名成年男性进行测量,其红血球的样本均值为 465.13 ,样本方差为 54.8 0 2 ;对该地区 74 名成年女性进行测量,其红血球的样本均值为 422.16 ,样本方差为 49.2 0 2 。试检验:该地区正常成年男女所含红血球的平均值是否有差异(取 α = 0.05 )?
解
设该地区正常成年男女所含红血球数分别记为 X 和 Y ,并设
X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) .
首先要检验两正态总体方差是否相等。为此先检验
H 0 : σ 1 = σ 2 vs H 1 : σ 1 = σ 2 .
为此使用 F 检验,则检验的拒绝域为
W = {( x , y ) : F ≥ F 1 − α /2 ( n − 1 , m − 1 ) 或 F ≤ F α /2 ( n − 1 , m − 1 )} .
本题中,n = 156 , m = 74 ,并已知
s x 2 = 54. 8 2 , s y 2 = 49. 2 2 .
由此可知检验统计量 F 的取值为
F = s y 2 s x 2 = 1.24 ,
而
F 0.975 ( 155 , 73 ) ≈ 1.5 , F 0.025 ( 155 , 73 ) ≈ 0.68.
因此观察样本不在拒绝域,即不能否定 H 0 : σ 1 = σ 2 。
从而我们可在 σ 1 = σ 2 的条件下进一步检验
H 0 : μ 1 = μ 2 vs H 1 : μ 1 = μ 2 .
可用 t 检验,则检验的拒绝域为
W = { ∣ t ∣ ≥ t 1 − α /2 ( n + m − 2 )} .
直接计算得
t = 5.96 ,
而
t 0.975 ( 228 ) ≈ 1.96 < 5.96.
因此应拒绝原假设,即该地区正常成年男女所含红血球的均值有显著性差异。
由于此问题中样本量很大,故采用渐近正态分布作检验也是合适的,结果是一致的。
为比较不同季节出生的女婴体重的方差,从某年 12 月和 6 月出生的女婴中分别随机抽取 6 名及 10 名,测其体重(单位:g )如下:
12 月 3520 2960 2560 2960 3260 3960
6 月 3220 3220 3760 3000 2920 3740 3060 3080 2940 3060
假定新生女婴体重服从正态分布,问新生女婴体重的方差是否是冬季的比夏季的小(取 α = 0.05 )?
解
设冬、夏两季新生女婴的体重分别服从
N ( μ 1 , σ 1 2 ) , N ( μ 2 , σ 2 2 ) ,
考虑检验问题
H 0 : σ 1 2 = σ 2 2 vs H 1 : σ 1 2 < σ 2 2 .
因而,考虑检验统计量
F = s 2 2 s 1 2 ∼ F ( n 1 − 1 , n 2 − 1 ) ,
其中
n 1 = 6 , n 2 = 10 , α = 0.05 ,
s 1 2 = 241666.667 , s 2 2 = 93955.556.
又
F α ( n 1 − 1 , n 2 − 1 ) = F 0.05 ( 5 , 9 ) = F 0.95 ( 9 , 5 ) 1 = 4.77 1 = 0.2096 ,
而
F = 93955.556 241666.667 = 2.572 > 0.2096.
所以不拒绝原假设,不能认为女婴体重的方差是“冬季的比夏季小”。
已知维尼纶纤度在正常条件下服从正态分布,且标准差为 0.048 。从某天产品中抽取 5 根纤维,测得其纤度为
1.32 1.55 1.36 1.40 1.44
问这一天纤度的总体标准差是否正常(取 α = 0.05 )?
解
这是一个关于正态总体方差的双侧检验问题,待检验的原假设和备择假设分别为
H 0 : σ 2 = σ 0 2 = 0.04 8 2 vs H 1 : σ 2 = σ 0 2 = 0.04 8 2 .
此处 n = 5 ,若取显著性水平 α = 0.05 ,查表知
χ 0.025 2 ( 4 ) = 0.4844 , χ 0.975 2 ( 4 ) = 11.1433 ,
故拒绝域为
W = { χ 2 ≤ 0.4844 或 χ 2 ≥ 11.1433 } .
由样本数据可计算得到
χ 2 = σ 0 2 ( n − 1 ) s 2 = 0.04 8 2 0.03112 = 13.5069 > 11.1433 ,
因此拒绝 H 0 ,认为这一天纤度的总体标准差不正常。
讨论:在此种拒绝原假设的场合,人们还经常会问总体标准差 σ 究竟是大于 0.048 还是小于 0.048 呢?回答这个问题要进一步考察其拒绝域,事实上,此处拒绝域
W = W 1 ∪ W 2
由两部分组成:
W 1 = { χ 2 ≤ χ 0.025 2 ( 4 )} = { χ 2 ≤ 0.4844 } ,
它对应 σ < 0.048 ;
W 2 = { χ 2 ≥ χ 0.975 2 ( 4 )} = { χ 2 ≥ 11.1433 } ,
它对应 σ > 0.048 。
如今样本观测值落入 W 2 ,可以认为当天的总体标准差 σ > 0.048 。
在实际中,产品质量的标准差通常不大可能自然减小的,人们要预防的是标准差变大从而使得产品质量下降,因此,对本题的情况,一般也可建立如下的检验问题:
H 0 : σ 2 ≤ 0.04 8 2 vs H 1 : σ 2 > 0.04 8 2 .
若此,则检验统计量不变,而检验的拒绝域变为
W ′ = { χ 2 ≥ χ 1 − α 2 ( 4 )} .
若仍取显著性水平为 0.05 ,则查表知
χ 0.95 2 ( 4 ) = 9.4877 ,
由于观测值大于临界值,仍然拒绝原假设,认为 σ > 0.048 。
某电工器材厂生产一种保险丝,测量其熔化时间,依通常情况方差为 400 ,今从
某天产品中抽取容量为 25 的样本,测量其熔化时间并计算得
x ˉ = 62.24 , s 2 = 404.77 ,
问这天保险丝熔化时间的分散度与通常有无显著差异(取 α = 0.05 ,假定熔化时间服从正态分布)?
解
本题可归结为关于正态总体方差的双侧检验问题
H 0 : σ 2 = 400 vs H 1 : σ 2 = 400.
当 α = 0.05 时,查表知
χ 0.025 2 ( 24 ) = 12.4012 , χ 0.975 2 ( 24 ) = 39.3641 ,
因此拒绝域为
{ χ 2 ≤ 12.4012 或 χ 2 ≥ 39.3641 } .
此外,检验统计量为
χ 2 = 400 24 × 404.77 = 24.2862.
该值没有落入拒绝域内,从而在显著性水平 α = 0.05 下可以认为该天保险丝熔化时间的方差与通常无显著差异。
某种导线的质量标准要求其电阻的标准差不得超过 0.005 Ω 。今在一批导线中随机抽取样品 9 根,测得样本标准差为 s = 0.007 Ω ,设总体为正态分布。问在显著性水平 α = 0.05 下能否认为这批导线的标准差显著地偏大?
解
本题是单侧检验问题,待检验的原假设和备择假设分别为
H 0 : σ ≤ 0.005 vs H 1 : σ > 0.005.
若取 α = 0.05 ,查表知
χ 0.95 2 ( 8 ) = 15.5073 ,
拒绝域为
W = { χ 2 ≥ 15.5073 } ,
由所给条件可得出检验统计量为
χ 2 = 0.00 5 2 8 × 0.00 7 2 = 15.68 > 15.5073.
因此拒绝 H 0 ,在显著性水平 α = 0.05 下认为这批导线的标准差显著地偏大。
两台车床生产同一种滚珠,滚珠直径服从正态分布。从中分别抽取 8 个和 9 个产品,测得其直径为
甲车床: 15.0 , 14.5 , 15.2 , 15.5 , 14.8 , 15.1 , 15.2 , 14.8 ,
乙车床: 15.2 , 15.0 , 14.8 , 15.2 , 15.0 , 15.0 , 14.8 , 15.1 , 14.8.
比较两台车床生产的滚珠直径的方差是否有显著差异(取 α = 0.05 )。
解
这是一个关于两正态总体方差的一致性检验问题,设 X 为甲车床生产的滚珠直径,Y 为乙车床生产的滚珠直径,原假设为
σ 1 2 = σ 2 2 ,
备择假设为
σ 1 2 = σ 2 2 .
此处 m = 8 , n = 9 ,由样本数据计算得
s x 2 = 0.0955 , s y 2 = 0.0261 ,
于是
F = s y 2 s x 2 = 3.6590.
若取显著性水平 α = 0.05 ,查表有
F 0.025 ( 7 , 8 ) = F 0.975 ( 8 , 7 ) 1 = 4.90 1 = 0.2041 , F 0.975 ( 7 , 8 ) = 4.53 ,
从而拒绝域为
W = { F ≥ 4.53 或 F ≤ 0.2041 } .
由于检验统计量的值不在拒绝域内,因此认为两台车床生产的滚珠直径的方差没有显著差异。
有两台机器生产金属部件,分别在两台机器所生产的部件中各取一容量为 m = 14 和 n = 12 的样本,测得部件质量的样本方差分别为 s 1 2 = 15.46 , s 2 2 = 9.66 ,设两样本相互独立,试在显著性水平 α = 0.05 下检验假设
H 0 : σ 1 2 = σ 2 2 vs H 1 : σ 1 2 > σ 2 2 .
解
这是一个关于两正态总体方差的单侧检验问题,由所给条件算得
F = s 2 2 s 1 2 = 1.6004.
若取显著性水平 α = 0.05 ,可求得临界值为
F 0.95 ( 13 , 11 ) = 2.7614
(可用线性插值法或用统计软件求出此值,如在 Matlab 中输入 finv(0.95,13,11) 即可给出此值),拒绝域为
{ F ≥ 2.7614 } ,
此处,检验统计量未落入拒绝域中,因此接受原假设。
测得两批电子器件的样品的电阻(单位:Ω )为
A 批 ( x ) : 0.140 , 0.138 , 0.143 , 0.142 , 0.144 , 0.137 ,
B 批 ( y ) : 0.135 , 0.140 , 0.142 , 0.136 , 0.138 , 0.140.
设这两批器材的电阻值分别服从分布 N ( μ 1 , σ 1 2 ) , N ( μ 2 , σ 2 2 ) ,且两样本独立。
试检验两个总体的方差是否相等(取 α = 0.05 );
试检验两个总体的均值是否相等(取 α = 0.05 )。
解
(1) 对于检验两总体方差是否一致,应使用 F 检验,此处,由样本数据计算可得到
x ˉ = 0.1407 , y ˉ = 0.1385 , s x = 0.0028 , s y = 0.0027.
若取 α = 0.05 ,则
F 0.975 ( 5 , 5 ) = 7.15 , F 0.025 ( 5 , 5 ) = F 0.975 ( 5 , 5 ) 1 = 0.1399 ,
其拒绝域为
W = { F ≤ 0.1399 或 F ≥ 7.15 } ,
而
F = s y 2 s x 2 = 0.002 7 2 0.002 8 2 = 1.0754.
由于 F 值没有落入拒绝域内,可以认为两个总体的方差相等。
(2) 因为在(1)中已经接受了两总体方差一致,从而在检验均值情况时,可以用两样本 t 检验,当 α = 0.05 时,
t 0.975 ( 10 ) = 2.2281 ,
拒绝域为
{ ∣ t ∣ ≥ 2.2281 } .
这里有
s w = ( 6 + 6 − 2 5 × 0.002 8 2 + 5 × 0.002 7 2 ) 1/2 = 0.00275 ,
t = 0.00275 6 1 + 6 1 0.1407 − 0.1385 = 1.3856 < 2.2281 ,
故接受 H 0 ,可以认为两个总体的均值相等。
某厂使用两种不同的原料生产同一类型产品,随机选取使用原料 A 生产的样品 22 件,测得平均质量为 2.36 kg ,样本标准差为 0.57 kg 。取使用原料 B 生产的样品 24 件,测得平均质量为 2.55 kg ,样本标准差为 0.48 kg 。设产品质量服从正态分布,两个样本独立,问能否认为使用原料 B 生产的产品平均质量较使用原料 A 显著大(取 α = 0.05 )?
解
设 X 为使用原料 A 生产的产品质量,Y 为使用原料 B 生产的产品质量,则
X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) .
由问题的陈述,我们看到这是关于两总体均值的检验问题,并且为了能够显著地认为使用原料 B 生产的产品平均质量较使用原料 A 大,必须将该陈述作备择假设,只有当拒绝与之相对应的原假设时,才能说明使用原料 B 生产的产品平均质量较使用原料 A 显著大,因此,可建立如下假设检验问题
H 0 : μ 2 ≤ μ 1 vs H 1 : μ 2 > μ 1 .
为完成此假设检验,应先对两总体的方差是否相等进行检验。若接受 σ 1 2 = σ 2 2 ,可以使用两样本 t 检验;若 σ 1 2 = σ 2 2 不成立,则可以用近似 t 检验。
对于检验问题
H 00 : σ 1 2 = σ 2 2 vs H 01 : σ 1 2 = σ 2 2 ,
可计算如下检验统计量
F = s y 2 s x 2 = 0.4 8 2 0.5 7 2 = 1.4102.
若取 α = 0.05 ,则
F 0.975 ( 21 , 23 ) = 2.3404 , F 0.025 ( 21 , 23 ) = F 0.975 ( 23 , 21 ) 1 = 0.4201 ,
拒绝域为
W = { F ≤ 0.4201 或 F ≥ 2.3404 } ,
观测值未落入拒绝域内,因此可以认为两个总体的方差相等。
下面我们在方差相等的假定下检验上述关于均值的假设,此处可使用两样本 t 检验,若取 α = 0.05 ,则
t 0.95 ( 44 ) ≈ u 0.95 = 1.645 ,
故拒绝域为
W = { t ≥ 1.645 } ,
由所给条件,计算得
s w = 21 + 23 21 × 0.5 7 2 + 23 × 0.4 8 2 = 0.5249 ,
t = 0.5249 22 1 + 24 1 2.55 − 2.36 = 1.2264.
由于 1.2264 < 1.645 ,因此在显著性水平 α = 0.05 时,应接受原假设 H 0 : μ 2 ≤ μ 1 ,即使用原料 B 生产的产品平均质量没有显著地超过使用原料 A 生产的产品平均质量。
讨论:若改变检验问题的一对假设为
H 0 ′ : μ 2 ≥ μ 1 vs H 1 ′ : μ 2 < μ 1 ,
则其拒绝域为
W ′ = { t ≤ − 1.645 } ,
如今 t = 1.2264 > − 1.645 ,故应接受原假设 H 0 ′ : μ 2 ≥ μ 1 。
把两对假设联合起来考察可以看出,既接受原假设 H 0 : μ 2 ≤ μ 1 ,也接受原假设 H 0 ′ : μ 2 ≥ μ 1 ,造成这一现象的原因是两对假设检验问题的接受域有共同部分(见图 7.3),而统计量的值正好落在这个公共区域内。
\FigureSevenThree
这一现象并不是很少出现的,在其他检验问题中也可能会出现,只要检验统计量的取值落入 W ∩ W ′ ,这说明在假设检验中“不拒绝原假设”的含义是丰富的,处理要慎重。
在 20 世纪 70 年代后期人们发现,酿啤酒时,在麦芽干燥过程中会形成致癌物质亚硝基二甲胺(NDMA),20 世纪 80 年代初期开发了一种新的麦芽干燥过程,下面为老、新两种过程中形成的 NDMA 含量(以 10 亿份中的份数计):
老过程: 6 , 4 , 5 , 5 , 6 , 5 , 5 , 6 , 4 , 6 , 7 , 4 ,
新过程: 2 , 1 , 2 , 2 , 1 , 0 , 3 , 2 , 1 , 0 , 1 , 3.
设两样本分别来自不同的正态总体,并假定两总体方差相等,两样本独立,分别以 μ 1 , μ 2 表示老、新过程的总体均值,试检验(α = 0.05 ):
H 0 : μ 1 − μ 2 = 2 vs H 1 : μ 1 − μ 2 > 2.
解
以 x , y 分别表示老、新两种过程下的观测值,x ˉ , y ˉ 分别为其样本均值,s x 2 , s y 2 分别为其样本方差,则 μ 1 − μ 2 的无偏估计为 x ˉ − y ˉ ,在原假设
H 0 : μ 1 − μ 2 = 2
成立下有
x ˉ − y ˉ − 2 ∼ N ( 0 , 6 σ 2 ) ,
其中 σ 2 为两个总体的共同方差,又
σ 2 22 s w 2 = σ 2 11 s x 2 + σ 2 11 s y 2 ∼ χ 2 ( 22 ) ,
故在原假设成立下,
t = s w 6 ( x ˉ − y ˉ − 2 ) ∼ t ( 22 ) .
检验拒绝域为
W = { t ≥ t 1 − α ( 22 )} ,
现取 α = 0.05 ,查表知
t 0.95 ( 22 ) = 1.7171 ,
从而拒绝域为
W = { t ≥ 1.7171 } .
现由样本观测值可算得
x ˉ = 5.25 , y ˉ = 1.5 , i = 1 ∑ 12 ( x i − x ˉ ) 2 = 10.25 , i = 1 ∑ 12 ( y i − y ˉ ) 2 = 11 ,
s w = 22 10.25 + 11 = 0.9828.
从而检验统计量的值为
t = 0.9828 6 ( 5.25 − 1.5 − 2 ) = 4.3616.
由于观测值落入拒绝域,故拒绝原假设,即老、新方法在 NDMA 含量的差显著大于 2 。
设总体 X ∼ N ( μ 1 , σ 2 ) ,总体 Y ∼ N ( μ 2 , σ 2 ) ,从总体 X 抽取样本 x 1 , x 2 , … , x m ,从总体 Y 抽取样本 y 1 , y 2 , … , y n ,两样本独立,考虑如下假设检验问题
H 0 : c μ 1 + d μ 2 = δ vs H 1 : c μ 1 + d μ 2 = δ ,
其中 c = 0 , d = 0 , δ 都是已知常数,求检验统计量与拒绝域。
解
以 x ˉ , y ˉ 分别表示来自两个总体的样本均值,s x 2 , s y 2 分别为其样本方差,记
s w 2 = m + n − 2 ( m − 1 ) s x 2 + ( n − 1 ) s y 2 ,
由所给条件,有
x ˉ ∼ N ( μ 1 , m σ 2 ) , y ˉ ∼ N ( μ 2 , n σ 2 ) ,
由此
c x ˉ + d y ˉ ∼ N ( c μ 1 + d μ 2 , ( m c 2 + n d 2 ) σ 2 ) .
在原假设成立时,
u = σ m c 2 + n d 2 c x ˉ + d y ˉ − δ ∼ N ( 0 , 1 ) .
又
σ 2 ( m − 1 ) s x 2 ∼ χ 2 ( m − 1 ) , σ 2 ( n − 1 ) s y 2 ∼ χ 2 ( n − 1 ) ,
且二者独立,故
σ 2 ( m + n − 2 ) s w 2 ∼ χ 2 ( m + n − 2 ) .
由此,在原假设成立时,检验统计量
t = s w m c 2 + n d 2 c x ˉ + d y ˉ − δ = σ 2 ( m + n − 2 ) ( m + n − 2 ) s w 2 u ∼ t ( m + n − 2 ) ,
若取显著性水平为 α ,检验拒绝域为
W = { ∣ t ∣ ≥ t 1 − α /2 ( m + n − 2 )} .
设 X ∼ N ( μ 1 , σ 1 2 ) ,Y ∼ N ( μ 2 , σ 2 2 ) ,从总体 X 与总体 Y 各取容量分别为 7 和 5 的样本,具体如下:
X : 81 , 165 , 97 , 134 , 92 , 87 , 14 ,
Y : 102 , 86 , 98 , 109 , 92.
设两样本独立,取 α = 0.05 ,
检验假设
H 0 : σ 1 2 = 10 σ 2 2 vs H 1 : σ 1 2 = 10 σ 2 2 ;
利用(1)的结果,检验
H 0 : μ 1 − μ 2 = 10 vs H 1 : μ 1 − μ 2 = 10.
解
以 x ˉ , y ˉ 分别表示来自两个总体的样本均值,s x 2 , s y 2 分别为其样本方差。m , n 分别为两个样本量,此处 m = 7 , n = 5 。
(1) 由于
σ 1 2 ( m − 1 ) s x 2 ∼ χ 2 ( m − 1 ) , σ 2 2 ( n − 1 ) s y 2 ∼ χ 2 ( n − 1 ) ,
且二者独立,故对假设检验问题
H 0 : σ 1 2 = 10 σ 2 2 vs H 1 : σ 1 2 = 10 σ 2 2 ,
在原假设成立下,检验统计量
F = 10 s y 2 s x 2 = s y 2 / σ 2 2 s x 2 / σ 1 2 ∼ F ( m − 1 , n − 1 ) ,
拒绝域为
W = { F ≤ F α /2 ( m − 1 , n − 1 ) 或 F ≥ F 1 − α /2 ( m − 1 , n − 1 )} .
由于 m = 7 , n = 5 , α = 0.05 ,查表知
F 0.975 ( 6 , 4 ) = 9.20 , F 0.025 ( 6 , 4 ) = F 0.975 ( 4 , 6 ) 1 = 6.23 1 = 0.1605 ,
故检验拒绝域为
W = { F ≤ 0.1605 或 F ≥ 9.20 } .
此处由样本数据算得
s x 2 = 2208.57 , s y 2 = 78.80 ,
从而
F = 10 × 78.80 2208.57 = 2.8028.
由于检验统计量值未落入拒绝域,故接受原假设,认为
σ 1 2 = 10 σ 2 2 .
(2) 由(1)可假设
σ 1 2 = 10 σ 2 2 = 10 σ 2 .
在此条件下,
10 σ 2 ( m − 1 ) s x 2 + 10 ( n − 1 ) s y 2 = σ 1 2 ( m − 1 ) s x 2 + σ 2 2 ( n − 1 ) s y 2 ∼ χ 2 ( m + n − 2 ) .
又
x ˉ − y ˉ ∼ N ( μ 1 − μ 2 , m σ 1 2 + n σ 2 2 ) = N ( μ 1 − μ 2 , ( m 10 + n 1 ) σ 2 ) ,
故在 μ 1 − μ 2 = 10 时,检验统计量
t = m 10 + n 1 x ˉ − y ˉ − 10 ⋅ ( m − 1 ) s x 2 + 10 ( n − 1 ) s y 2 10 ( m + n − 2 ) ∼ t ( m + n − 2 ) .
此处 m = 7 , n = 5 ;若取 α = 0.05 ,查表知
t 0.975 ( 10 ) = 2.2281 ,
检验拒绝域为
W = { ∣ t ∣ ≥ 2.2281 } .
现由样本可计算得到
t = 7 10 + 5 1 95.7 − 97.4 − 10 ⋅ 6 × 2208.57 + 10 × 4 × 78.80 10 × 10 = − 0.7158.
现检验统计量值未落入拒绝域,故接受原假设。
§7.3 其他分布参数的假设检验
1. 指数分布均值 θ 的假设检验——χ 2 检验
\renewcommand{\arraystretch}{1.2}
H 0 H 1 检验统计量 拒绝域 p 值θ ≤ θ 0 θ > θ 0 χ 2 = θ 0 2 n x ˉ W = { χ 2 ≥ χ 1 − α 2 ( 2 n )} P ( χ 2 ≥ χ 0 2 ) θ ≥ θ 0 θ < θ 0 χ 2 = θ 0 2 n x ˉ W = { χ 2 ≤ χ α 2 ( 2 n )} P ( χ 2 ≤ χ 0 2 ) θ = θ 0 θ = θ 0 χ 2 = θ 0 2 n x ˉ W = { χ 2 ≤ χ α /2 2 ( 2 n ) 或 χ 2 ≥ χ 1 − α /2 2 ( 2 n )} 2 min { P ( χ 2 ≥ χ 0 2 ) , P ( χ 2 ≤ χ 0 2 )}
注:表中 χ 0 2 = θ 0 2 n x ˉ 为由样本算得的检验统计量值,χ 2 表示服从 χ 2 ( 2 n ) 分布的随机变量。
2. 比率 p 的假设检验
**(1) 小样本方法:**检验统计量为 n 次试验中成功次数 x 。这里用 p 值作检验较为方便。
\renewcommand{\arraystretch}{1.2}
H 0 H 1 p 值p ≤ p 0 p > p 0 P p 0 ( x ≥ x 0 ) p ≥ p 0 p < p 0 P p 0 ( x ≤ x 0 ) p = p 0 p = p 0 2 min { P p 0 ( x ≤ x 0 ) , P p 0 ( x ≥ x 0 )}
注:表中 x 0 为样本观测值,x 为服从 b ( n , p 0 ) 的随机变量。
(2) 大样本方法:
\renewcommand{\arraystretch}{1.2}
H 0 H 1 检验统计量 拒绝域 p 值p ≤ p 0 p > p 0 u = p 0 ( 1 − p 0 ) n ( x ˉ − p 0 ) { u ≥ u 1 − α } 1 − Φ ( u 0 ) p ≥ p 0 p < p 0 u = p 0 ( 1 − p 0 ) n ( x ˉ − p 0 ) { u ≤ u α } Φ ( u 0 ) p = p 0 p = p 0 u = p 0 ( 1 − p 0 ) n ( x ˉ − p 0 ) { ∥ u ∥ ≥ u 1 − α /2 } 2 ( 1 − Φ ( ∥ u 0 ∥ ))
注:表中 u 0 为样本计算出的观测值。
习题与解答 7.3
从一批服从指数分布的产品中抽取 10 个进行寿命试验,观测值(单位:h)如下:
1643 , 1629 , 426 , 132 , 1522 , 432 , 1759 , 1074 , 528 , 283.
根据这批数据能否认为其平均寿命不低于 1100 h (取 α = 0.05 )?
解
指数分布 E x p ( 1/ θ ) 中 θ 是总体均值,所以这是一个关于指数分布参数的假设检验问题,待检验的假设为
H 0 : θ ≥ θ 0 = 1100 vs H 1 : θ < 1100.
由样本数据可算得
x ˉ = 942.8 ,
故检验统计量为
χ 2 = θ 0 20 x ˉ = 1100 20 × 942.8 = 17.1418.
若取 α = 0.05 ,则查表知
χ 0.05 2 ( 20 ) = 10.8508 ,
由于拒绝域为
W = { χ 2 ≤ χ 0.05 2 ( 20 )} ,
故接受原假设,可以认为平均寿命不低于 1100 h 。
关于本题可作一些类似于 7.2 节中 27 题的讨论。如何正确理解“不拒绝原假设”呢?这里可能有两种情况:
原假设 H 0 是正确的,故不拒绝;
对原假设 H 0 虽有怀疑,但尚无足够证据去推翻它,故不拒绝。
假如把“拒绝原假设”仅仅理解为情况(1)而接受原假设是不准确的,要想到可能还会出现情况(2)。为进一步说明这个问题,我们把这里的原假设与备择假设对换一下,即建立如下另一对新的假设检验:
H 0 ′ : θ ≤ 1100 vs H 1 ′ : θ > 1100.
其检验统计量不变,仍取显著水平 α = 0.05 ,则拒绝域变为
W ′ = { χ 2 ≥ χ 0.95 2 ( 20 ) = 31.4104 } ,
检验统计量观测值 χ 2 = 17.1418 未落入拒绝域,故结论是“不拒绝原假设 H 0 ′ : θ ≤ 1100 ”。
类似地,对此结论也不能仅仅理解为 θ ≤ 1100 成立。若把这两个检验问题放在一起考虑,则
在原检验问题中,得结论“不拒绝原假设 H 0 : θ ≥ 1100 ”;
在新检验问题中,得结论“不拒绝原假设 H 0 ′ : θ ≤ 1100 ”。
若把“不拒绝”仅仅理解为“接受”(即理解为(1)),那就得到了相悖的结论(这里 θ 正好等于 1100 的可能性不用考虑),很难理解;若把“不拒绝”理解为(1)或(2),那就好理解了。
某厂一种元件平均使用寿命为 1200 h (偏低),现厂里进行技术革新,革新后任选 8 个元件进行寿命试验,测得寿命数据(单位:h)如下:
2686 , 2001 , 2082 , 792 , 1660 , 4105 , 1416 , 2089.
假定元件寿命服从指数分布,取 α = 0.05 ,问革新后元件的平均寿命是否有明显提高?
解
依题意,我们需要检验的一对假设为
H 0 : θ ≤ θ 0 = 1200 vs H 1 : θ > 1200.
计算样本观测值得到
x ˉ = 2103.875 ,
故检验的统计量为
χ 2 = θ 0 16 x ˉ = 1200 16 × 2103.875 = 28.0517.
若取 α = 0.05 ,则查表知
χ 0.95 2 ( 16 ) = 26.2962 ,
故拒绝域为
W = { χ 2 ≥ 26.2962 } .
由于 28.0517 > 26.2962 ,故拒绝原假设,认为革新后元件的平均寿命有明显提高。
有人称某地成年人中大学毕业生比例不低于 30% ,为检验之,随机调查该地 15 名成年人,发现有 3 名大学毕业生,取 α = 0.05 ,问该人看法是否成立?并给出检验的 p 值。
解
这是关于比例的假设检验问题,以 p 表示成年人中的大学毕业生比例,x 表示 15 名成年人中的大学毕业生人数,则
x ∼ b ( 15 , p ) ,
待检验的一对假设为
H 0 : p ≥ 0.3 vs H 1 : p < 0.3.
检验的拒绝域为
W = { x ≤ c } .
若取 α = 0.05 ,由于
P ( x ≤ 1 ) = 0.0353 < 0.05 < P ( x ≤ 2 ) = 0.1268 ,
故取 c = 1 ,从而检验的拒绝域为
W = { x ≤ 1 } .
由于观测值为 3 ,未落入拒绝域中,所以不拒绝原假设,不能否定该人的看法。
此处计算检验的 p 值更容易一些,事实上,若以 X 表示服从二项分布 b ( 15 , 0.3 ) 的随机变量,则 p 值为
p = P ( X ≤ 3 ) = x = 0 ∑ 3 ( x 15 ) 0. 3 x 0. 7 15 − x = 0.2969.
这个 p 值不算小,故不拒绝原假设 H 0 是恰当的。
某大学随机调查 120 名男同学,发现有 50 人非常喜欢看武侠小说,而随机调查的 85 名女同学中有 23 人喜欢,用大样本检验方法在 α = 0.05 下确认:男女同学在喜爱武侠小说方面有无显著差异?并给出检验的 p 值。
解
设 X 为 120 名男同学中喜欢看武侠小说的人数,p 1 为其真实比例,Y 为 85 名女同学中喜欢看武侠小说的人数,p 2 为其真实比例,则
X ∼ b ( 120 , p 1 ) , Y ∼ b ( 85 , p 2 ) ,
待检验问题为
H 0 : p 1 = p 2 vs H 1 : p 1 = p 2 .
由于这里样本量较大,可以采用大样本 u 检验方法,注意到
x ˉ ∼ N ( p 1 , 120 p 1 ( 1 − p 1 ) ) , y ˉ ∼ N ( p 2 , 85 p 2 ( 1 − p 2 ) ) ,
其中
x ˉ = 120 50 = 0.4167 , y ˉ = 85 23 = 0.2706.
于是,在 H 0 成立的条件下,近似有
u = 120 p ^ ( 1 − p ^ ) + 85 p ^ ( 1 − p ^ ) x ˉ − y ˉ ∼ N ( 0 , 1 ) ,
其中
p ^ = 120 + 85 50 + 23 = 0.3561.
将 x ˉ , y ˉ 的值代入,可算得
u = 0.3561 ( 1 − 0.3561 ) ( 120 1 + 85 1 ) 0.4167 − 0.2706 = 2.1522.
对显著性水平 α = 0.05 ,检验拒绝域为
{ ∣ u ∣ ≥ 1.96 } ,
观测值落入拒绝域,故认为男女同学在喜爱武侠小说方面有显著差异。
此处检验的 p 值为
p = P ( ∣ u ∣ ≥ 2.1522 ) = 2 [ 1 − Φ ( 2.1522 )] = 0.0314.
假定电话总机在单位时间内接到的呼叫次数服从泊松分布,现观测了 40 个单位时间,接到的呼叫次数如下:
0 , 2 , 3 , 2 , 3 , 2 , 1 , 0 , 2 , 2 , 1 , 2 , 2 , 1 , 3 , 1 , 1 , 4 , 1 , 1 ,
5 , 1 , 2 , 2 , 3 , 3 , 1 , 3 , 1 , 3 , 4 , 0 , 6 , 1 , 1 , 1 , 4 , 0 , 1 , 3.
在显著性水平 0.05 下能否认为该单位时间内平均呼叫次数不低于 2.5 次?并给出检验的 p 值。
解
以 X 记电话总机在该单位时间内接到的呼叫次数,可以认为
X ∼ P ( λ ) ,
则要检验的假设为
H 0 : λ ≥ 2.5 vs H 1 : λ < 2.5.
由于 n = 40 较大,故可以采用大样本检验,泊松分布的均值和方差都是 λ ,而
x ˉ = 40 1 ( 0 + 2 + ⋯ + 0 + 1 + 3 ) = 1.975 ,
因而,检验的统计量为
u = λ n ( x ˉ − λ ) = 2.5 40 ( 1.975 − 2.5 ) = − 2.1.
若取 α = 0.05 ,则
u 0.05 = − 1.645 ,
检验的拒绝域为
W = { u ≤ − 1.645 } .
由于 u = − 2.1 落入拒绝域,故拒绝原假设。
由于 u 在 H 0 成立时,服从标准正态分布,因而检验的 p 值为
P ( u ≤ − 2.1 ) = 0.0179.
通常每平方米某种布上的疵点数服从泊松分布,现观测该种布 100 m 2 ,发现有 126 个疵点,在显著性水平 0.05 下能否认为该种布每平方米上平均疵点数不超过 1 个?并给出检验的 p 值。
解
以 X 记每平方米上的疵点数,则可以认为
X ∼ P ( λ ) ,
需要检验的假设为
H 0 : λ ≤ 1 vs H 1 : λ > 1.
由于 n = 100 ,故可以采用大样本检验,泊松分布的均值和方差都是 λ ,而
x ˉ = 100 126 = 1.26 ,
因而,检验的统计量为
u = λ n ( x ˉ − λ ) = 1 100 ( 1.26 − 1 ) = 2.6.
若取 α = 0.05 ,则
u 0.95 = 1.645 ,
检验的拒绝域为
W = { u ≥ 1.645 } .
这里 u = 2.6 落入拒绝域,故拒绝原假设。认为该种布每平方米上的平均疵点数不超过 1 个的结论不成立。
由于 u 在 H 0 成立时,服从标准正态分布,因而检验的 p 值为
P ( u ≥ 2.6 ) = 0.0047.
某厂的一批电子产品,其寿命 T 服从指数分布,其密度函数为
p ( t ; θ ) = θ − 1 exp { − t / θ } I [ t > 0 ] .
从以往生产情况知平均寿命 θ = 2000 h 。为检验当日生产是否稳定,任取 10 个产品进行寿命试验,到全部失效时试验停止。试验得失效寿命数据之和为 30200 。试在显著性水平 α = 0.05 下检验假设
H 0 : θ = 2000 vs H 1 : θ = 2000.
解
根据《概率论与数理统计教程(第三版)》教材中(7.3.2)式可得,0.05 水平下的该检验的拒绝域为
{ θ 0 2 n x ˉ ≤ χ α /2 2 ( 2 n ) 或 θ 0 2 n x ˉ ≥ χ 1 − α /2 2 ( 2 n ) } .
直接计算可得
θ 0 2 n x ˉ = 2000 2 × 30200 = 30.2 ,
χ α /2 2 ( 2 n ) = 9.5908 , χ 1 − α /2 2 ( 2 n ) = 34.1696.
因为 30.2 并不在拒绝域中,所以,不能拒绝原假设。
设 x 1 , x 2 , … , x n 为取自两点分布 b ( 1 , p ) 的随机样本。
试求单侧假设检验问题
H 0 : p ≤ 0.01 vs H 1 : p > 0.01
的显著性水平 α = 0.05 的检验;
若要这个检验在 p = 0.08 时犯第二类错误的概率不超过 0.10 ,样本容量 n 应为多大?
解
(1) 检验的拒绝域的形式为
W = { i = 1 ∑ n x i > c } ,
其中 c 满足以下两式:
P 0.01 ( i = 1 ∑ n x i > c ) = k = c + 1 ∑ n ( k n ) 0.0 1 k 0.9 9 n − k ≤ 0.05 ,
P 0.01 ( i = 1 ∑ n x i > c − 1 ) = k = c ∑ n ( k n ) 0.0 1 k 0.9 9 n − k > 0.05.
在 n 给定后,具体的 c 值可通过编程计算得到。
(2) 第二类错误的概率
β = 1 − P 0.08 ( i = 1 ∑ n x i > c ) = k = 0 ∑ c ( k n ) 0.0 8 k 0.9 2 n − k .
因此,( n , c ) 可由不等式组
⎩ ⎨ ⎧ P 0.01 ( i = 1 ∑ n x i > c ) 1 − P 0.08 ( i = 1 ∑ n x i > c ) ≤ 0.05 < P 0.01 ( i = 1 ∑ n x i > c − 1 ) , ≤ 0.1
决定,具体的值可由编程搜索得到。
编程的想法是:让 n 从 1 开始,对每一给定的 n ,看是否存在一个 c 满足上述不等式组要求(该过程可如下进行:先找到满足
P 0.01 ( i = 1 ∑ n x i > c ) ≤ 0.05 < P 0.01 ( i = 1 ∑ n x i > c − 1 )
的 c ,在 MATLAB 中,获取这个 c 的语句为 c=binoinv(1-0.05,n,0.01),然后将此时的 ( n , c ) 代入验算
1 − P 0.08 ( i = 1 ∑ n x i > c ) ≤ 0.1
是否成立,成立则 c 存在,否则不存在),若存在,则 n 即为所求;若不存在,则令 n = n + 1 ,直至找到满足不等式组要求的 c 。如此找到的 n 即为满足两类错误概率要求的最小的 n 。
本例中,通过编程搜索可得最小的 n = 65 (此时对应的 c 也可求出,此处为 c = 2 )。此方案下对应的第一类和第二类错误的概率分别为 0.0276 和 0.0991 。
注:该问题常称为抽样检验问题。
有一批电子产品共 50 台,产销双方协商同意找出一个检验方案,使得当次品率 p ≤ p 0 = 0.04 时拒绝的概率不超过 0.05 ,而当 p > p 1 = 0.30 时,接受的概率不超过 0.10 ,请你帮助找出适当的检验方案。
解
此类检验问题的拒绝域为
W = { i = 1 ∑ n x i > c } .
因此,本问题归结为找出 n 与 c ,使得接受概率
L ( p ) = P ( W ) = P ( i = 1 ∑ n x i ≤ c )
满足不等式组
{ L ( p ) L ( p ) ≥ 0.95 , p ≤ 0.04 , ≤ 0.10 , p > 0.30.
由于批量 N = 50 不太大,因此应该用超几何分布计算接受概率
L ( p ) = k = 0 ∑ c ( n N ) ( k N p ) ( n − k N − N p ) .
通过编程搜索可以找到,当 n = 11 , c = 1 时,
1 − L ( p 0 ) = 1 − L ( 0.04 ) = 0.045 , L ( p 1 ) = L ( 0.30 ) = 0.085
可以满足要求。于是检验方案为 ( n , c ) ,它表示抽取 11 件产品检查,若其中的不合格品件数 > 1 ,则拒收该批产品,否则接收。
若在猜硬币正反面的游戏中,某人在 100 次试猜中,共猜中 60 次,你认为他是否有诀窍(取 α = 0.05 )?
解
设 p 为该人猜中概率,则该问题可以归结为如下假设检验问题:
H 0 : p = 2 1 vs H 1 : p > 2 1 .
以 X 记 100 次中猜中的次数,则在原假设成立下,
X ∼ b ( 100 , 0.5 ) ,
由于样本量相当大,检验统计量可取为
u = 100 × 0.5 × 0.5 X − 100 × 0.5 .
在原假设下,该统计量近似服从正态分布 N ( 0 , 1 ) ,故检验拒绝域为
W = { u ≥ u 1 − α } = { u ≥ 1.645 } ,
检验的 p 值近似为
p = P { x ≥ 60 } = P { u ≥ 100 × 0.5 × 0.5 60 − 100 × 0.5 } = P { u ≥ 2 } = 0.0228.
因此应拒绝原假设。看来此人猜硬币有某种诀窍。
设有两工厂生产的同一种产品,要检验假设 H 0 :它们的废品率 p 1 , p 2 相同,在第一、二工厂的产品各抽取 n 1 = 1500 个及 n 2 = 1800 个,分别有废品 300 个及 320 个,问在 5% 显著水平上应接受还是拒绝 H 0 。
解
这里样本量很大,可采用大样本近似。以 p ^ 1 , p ^ 2 分别表示两工厂的废品率,则在 H 0 下,总废品率为
p ^ = n n 1 p ^ 1 + n 2 p ^ 2 ,
检验统计量为
u = p ^ ( 1 − p ^ ) n 1 + n 2 n 1 n 2 ( p ^ 1 − p ^ 2 ) .
在原假设下,该统计量近似服从正态分布 N ( 0 , 1 ) ,故检验拒绝域为
W = { ∣ u ∣ > u 1 − α /2 } .
此处,
n 1 = 1500 , n 2 = 1800 , p ^ 1 = 0.2 , p ^ 2 = 0.1778 , p ^ = 0.1879 ,
故
u = 0.1879 ( 1 − 0.1879 ) 1500 + 1800 1500 × 1800 ( 0.2 − 0.1778 ) = 1.6256.
由于
u 0.975 = 1.96 > 1.6256 ,
故不能拒绝原假设。此处经计算,检验的 p 值近似为 0.1040 。
补充习题及解答
某人声称他能根据股票价格的历史图表预报未来股市的涨跌,若在一场测试中,他共作了 10 次预测,报对 8 次。
在显著性水平 0.05 下,能否相信他具有这种能力?
对什么样的显著性水平,可相信他具有这种能力?
解
我们先对问题作一简单分析:若该人有预测能力,则他预测正确的概率应该大于 1/2 ;若他没有预测的能力,则他胡乱猜测也有 50% 猜对的可能。现以 X 表示他预测 10 次预测正确的次数,则
X ∼ b ( 10 , θ ) ,
要检验的一对假设为
H 0 : θ = 0.5 vs H 1 : θ > 0.5.
若拒绝原假设,则可相信该人有预报能力,否则不能相信他有预报能力。由于检验拒绝域形如
W = { x ≥ c } ,
故检验的 p 值为
p = P 0.5 ( X ≥ 8 ) = P 0.5 ( X = 8 ) + P 0.5 ( X = 9 ) + P 0.5 ( X = 10 ) = 45 × 0. 5 8 × 0. 5 2 + 10 × 0. 5 9 × 0.5 + 0. 5 10 = 56 × 0. 5 10 = 0.0547.
对此 p 值作一些讨论:
由于检验的 p 值大于显著水平 α = 0.05 ,故不应拒绝原假设,不能相信他具有预报未来股市的涨跌的能力。在不拒绝原假设时可能犯第二类错误,犯第二类错误的概率
β ( θ ) = 1 − P θ ( X ≥ 8 ) ,
对具体 θ 可算出 β ( θ ) 的值,如 θ = 0.6 ,则
β ( 0.6 ) = 1 − P 0.6 ( X = 8 ) − P 0.6 ( X = 9 ) − P 0.6 ( X = 10 ) = 0.8327.
类似可算得
β ( 0.7 ) = 0.6172 , β ( 0.8 ) = 0.3222 , β ( 0.9 ) = 0.0702.
可见随着 θ 的增加,犯第二类错误的概率在变小。
我们知道,当 p < α 时应拒绝原假设,因此,当 α > 0.0547 时拒绝原假设。譬如,若取 α = 0.06 ,因为
p = 0.0547 < 0.06 = α ,
则拒绝原假设,可相信他有这种能力。
设 x 1 , x 2 , … , x n 是来自指数分布 E x p ( λ ) 的一个样本,y 1 , y 2 , … , y m 是来自另一指数分布 E x p ( μ ) 的一个样本,且两样本相互独立。若设 Δ = λ / μ ,对如下检验问题:
H 0 : Δ = 1 vs H 1 : Δ = 1
在显著性水平为 α 的场合给出拒绝域。
解
由于指数分布是特殊的伽马分布,具体是
E x p ( λ ) = G a ( 1 , λ ) ,
于是
i = 1 ∑ n x i ∼ G a ( n , λ ) , 2 nλ x ˉ = 2 λ i = 1 ∑ n x i ∼ G a ( n , 2 1 ) = χ 2 ( 2 n ) .
同理可得
2 m μ y ˉ ∼ χ 2 ( 2 m ) ,
由两样本相互独立可知
μ y ˉ λ x ˉ = 2 m μ y ˉ / m 2 nλ x ˉ / n ∼ F ( 2 n , 2 m ) .
在原假设 H 0 : Δ = 1 成立下,有 λ = μ ,从而有
y ˉ x ˉ ∼ F ( 2 n , 2 m ) .
检验拒绝域
W = { y ˉ x ˉ ≤ F α /2 ( 2 n , 2 m ) 或 y ˉ x ˉ ≥ F 1 − α /2 ( 2 n , 2 m ) } .
譬如,若两样本量与样本均值分别为
n = 5 , x ˉ = 1600 , m = 6 , y ˉ = 1200 ,
在给定显著性水平 α = 0.05 ,可查表得
F 0.975 ( 10 , 12 ) = 3.37 , F 0.025 ( 10 , 12 ) = F 0.975 ( 12 , 10 ) 1 = 3.62 1 = 0.276.
从而得拒绝域
W = { y ˉ x ˉ ≤ 0.276 或 y ˉ x ˉ ≥ 3.37 } ,
如今
y ˉ x ˉ = 1200 1600 = 1.333 ,
它不在拒绝域内,故不能拒绝原假设。
§7.4 似然比检验与分布拟合检验
1. 似然比检验
设 x 1 , x 2 , … , x n 为来自密度函数为 p ( x ; θ ) ,θ ∈ Θ 的总体的样本,则对检验问题
H 0 : θ ∈ Θ 0 vs H 1 : θ ∈ Θ 1 = Θ − Θ 0 ,
可用似然比统计量
Λ = sup θ ∈ Θ 0 p ( x 1 , x 2 , … , x n ; θ ) sup θ ∈ Θ p ( x 1 , x 2 , … , x n ; θ )
作检验统计量,该检验称为似然比(likelihood ratio)检验,有时也称之为广义似然比检验。
检验统计量也可以写为
Λ = p ( x 1 , x 2 , … , x n ; θ ^ 0 ) p ( x 1 , x 2 , … , x n ; θ ^ ) ,
其中 θ ^ 表示在全参数空间 Θ 上 θ 的最大似然估计,θ ^ 0 表示在原假设成立时子参数空间 Θ 0 上 θ 的最大似然估计。拒绝域为
W = { Λ ≥ c } ,
其中临界值 c 由
P θ ( Λ ≥ c ) ≤ α , ( ∀ θ ∈ Θ 0 )
确定。
似然比检验是寻找检验统计量的一种思路。该似然比统计量没有统一的精确分布形式,但其对数似然比的 2 倍,即 2 ln Λ ,渐近服从 χ 2 ( k ) 分布,其中 k 为 Λ 中独立参数个数。
2. 总体可以分成 k 类:A 1 , A 2 , … , A k 时的分布拟合优度检验
原假设
H 0 : P ( A i ) = p i , i = 1 , 2 , … , k ,
其中诸 p i ≥ 0 ,且 ∑ i = 1 k p i = 1 ;
数据:对总体作 n 次观察,k 个类各出现的频数分别为 n 1 , n 2 , … , n k ,且 ∑ i = 1 k n i = n 。
分两种情况给出检验统计量及其拒绝域:
诸 p i 均已知,检验统计量
χ 2 = i = 1 ∑ k n p i ( n i − n p i ) 2 ,
拒绝域为
W = { χ 2 ≥ χ 1 − α 2 ( k − 1 )} ;
诸 p i 不完全已知,检验统计量
χ 2 = i = 1 ∑ k n p ^ i ( n i − n p ^ i ) 2 ,
拒绝域为
W = { χ 2 ≥ χ 1 − α 2 ( k − r − 1 )} ,
其中 r 为 p 1 , p 2 , … , p k 中独立参数个数,p ^ i 为 p i 的最大似然估计。
这个检验被 K. 皮尔逊称为 χ 2 拟合优度检验,p = P ( χ 2 ≥ χ 0 2 ) 被称为拟合优度,p 值愈大拟合优度愈好,p 值愈小拟合优度愈差,从而拒绝原假设 H 0 。
3. 列联表的独立性检验
r × c 的二维列联表:总体按两个属性 A 与 B 分类,A 有 r 个类:A 1 , A 2 , … , A r ,B 有 c 个类:B 1 , B 2 , … , B c ,共有 r c 个类;若进行 n 次试验,其中所属 A i 又属 B j 的结果有 n ij 个,按矩阵排列,就得 r × c 二维列联表。
\renewcommand{\arraystretch}{1.2}
A B 行和 1 ⋯ j ⋯ c 1 n 11 ⋯ n 1 j ⋯ n 1 c n 1 ⋅ \vdots \vdots \vdots \vdots i n i 1 ⋯ n ij ⋯ n i c n i ⋅ \vdots \vdots \vdots \vdots r n r 1 ⋯ n r j ⋯ n r c n r ⋅ 列和 n ⋅ 1 ⋯ n ⋅ j ⋯ n ⋅ c n
原假设
H 0 : P ( A i B j ) = p ij = p i ⋅ p ⋅ j = P ( A i ) P ( B j ) , i = 1 , 2 , … , r , j = 1 , 2 , … , c ,
其意为:属性 A 与 B 相互独立;
在诸 p ij 未知(常见)场合,检验统计量为
χ 2 = i = 1 ∑ r j = 1 ∑ c n p ^ ij ( n ij − n p ^ ij ) 2 ,
其中
p ^ ij = p ^ i ⋅ p ^ ⋅ j = n n i ⋅ ⋅ n n ⋅ j
是 p ij 的最大似然估计;
对给定显著性水平 α ( 0 < α < 1 ) ,在 n 较大场合该检验的拒绝域为
W = { χ 2 ≥ χ 1 − α 2 (( r − 1 ) ( c − 1 ))} .
习题与解答 7.4
设 x 1 , x 2 , … , x n 为来自 b ( 1 , p ) 的样本,试求
H 0 : p = p 0 vs H 1 : p = p 0
的似然比检验。
解
样本的联合概率函数为
P ( X 1 = x 1 , X 2 = x 2 , … , X n = x n ) = p ∑ i = 1 n x i ( 1 − p ) n − ∑ i = 1 n x i .
两个参数空间分别为
Θ 0 = { p : p = p 0 } , Θ = { p : 0 < p < 1 } ,
利用微分法,在 Θ 上 p 的 MLE 为
p ^ = x ˉ .
则似然比统计量为
Λ ( x 1 , x 2 , … , x n ) = p 0 n x ˉ ( 1 − p 0 ) n − n x ˉ x ˉ n x ˉ ( 1 − x ˉ ) n − n x ˉ = ( 1 − x ˉ x ˉ ⋅ p 0 1 − p 0 ) x ˉ n ( 1 − p 0 1 − x ˉ ) n .
通过稍显复杂的求导可知,当 x ˉ > p 0 时,
( 1 − x ˉ x ˉ ⋅ p 0 1 − p 0 ) x ˉ ( 1 − p 0 1 − x ˉ )
为 x 的严格增函数,而当 x ˉ < p 0 时,它为 x 的严格减函数。从而拒绝域
{ Λ ( x 1 , x 2 , … , x n ) ≥ c } ⟺ { i = 1 ∑ n x i ≤ d 1 } ∪ { i = 1 ∑ n x i ≥ d 2 } .
这说明此时的似然比检验与传统的关于比率 p 的检验是等价的,其中临界值 d 1 与 d 2 由显著性水平 α 确定。
设 x 1 , x 2 , … , x n 为来自 N ( μ , σ 2 ) 的样本,试求
H 0 : σ 2 = σ 0 2 vs H 1 : σ 2 = σ 0 2
的似然比检验。
解
记 θ = ( μ , σ 2 ) ,样本的联合密度函数为
P ( x 1 , x 2 , … , x n ; θ ) = ( 2 π σ 2 ) − n /2 exp { − 2 σ 2 1 i = 1 ∑ n ( x i − μ ) 2 } .
两个参数空间分别为
Θ 0 = {( μ , σ 0 2 ) ∣ μ ∈ R } , Θ = {( μ , σ 2 ) ∣ μ ∈ R , σ 2 > 0 } .
利用微分法可求出在 Θ 上
μ ^ = x ˉ , s ∗ 2 = n 1 i = 1 ∑ n ( x i − x ˉ ) 2
分别为 μ , σ 2 的 MLE,而在 Θ 0 上
μ ^ 0 = x ˉ
为 μ 的 MLE,于是似然比统计量为
Λ = ( 2 π σ 0 2 ) − n /2 exp { − 2 σ 0 2 n s ∗ 2 } ( 2 π s ∗ 2 ) − n /2 exp { − n /2 } = [ σ 0 2 s ∗ 2 exp { 1 − σ 0 2 s ∗ 2 } ] − n /2 .
通过简单的求导计算可知,函数 x e − x 在 ( 0 , 1 ) 区间内单调递增,在 ( 1 , + ∞ ) 上单调递减,于是
{ Λ ≥ c } ⟺ { σ 0 2 n s ∗ 2 ≤ d 1 } ∪ { σ 0 2 n s ∗ 2 ≥ d 2 } .
从而似然比检验等价于采用
χ 2 = σ 0 2 n s ∗ 2
做检验统计量,也就是说,似然比检验与传统的双侧卡方检验是等价的。
设 x 1 , x 2 , … , x n 为来自指数分布 E x p ( λ 1 ) 的样本,y 1 , y 2 , … , y m 为来自指数分布 E x p ( λ 2 ) 的样本,且两组样本独立,其中 λ 1 , λ 2 是未知的正参数。
求
H 0 : λ 1 = λ 2 vs H 1 : λ 1 = λ 2
的似然比检验;
证明上述检验法的拒绝域仅依赖于比值
i = 1 ∑ n x i / j = 1 ∑ m y j ;
求统计量
i = 1 ∑ n x i / j = 1 ∑ m y j
在原假设成立下的分布。
解
样本的联合密度函数为
P ( x 1 , x 2 , … , x n , y 1 , y 2 , … , y m ; θ ) = λ 1 n e − λ 1 ∑ i = 1 n x i λ 2 m e − λ 2 ∑ j = 1 m y j .
参数空间分别为
Θ 0 = { λ 1 = λ 2 = λ ∣ λ > 0 } , Θ = {( λ 1 , λ 2 ) ∣ λ 1 > 0 , λ 2 > 0 } ,
由微分法容易求出在 Θ 下参数的最大似然估计为
λ ^ 1 = ∑ i = 1 n x i n , λ ^ 2 = ∑ j = 1 m y j m .
而在 Θ 0 下参数的最大似然估计为
λ ^ 0 = ∑ i = 1 n x i + ∑ j = 1 m y j n + m .
则似然比统计量为
Λ = ( ∑ i = 1 n x i + ∑ j = 1 m y j n + m ) n + m ( ∑ i = 1 n x i n ) n ( ∑ j = 1 m y j m ) m
= ( n + m ) n + m n n m m ( 1 + ∑ j = 1 m y j ∑ i = 1 n x i ) m ( 1 + ∑ i = 1 n x i ∑ j = 1 m y j ) n .
由求导可知,函数
( 1 + x ) m ( 1 + x 1 ) n
为先减后增的单峰函数,故此似然比检验拒绝域可等价写为
{ Λ ≥ c } ⟺ { i = 1 ∑ n x i / j = 1 ∑ m y j ≤ d 1 } ∪ { i = 1 ∑ n x i / j = 1 ∑ m y j ≥ d 2 } ,
这就证明了(2)的结论。
注意到指数分布、伽马分布与卡方分布间的关系,可得
i = 1 ∑ n x i ∼ G a ( n , λ 1 ) , 2 λ 1 i = 1 ∑ n x i ∼ G a ( 2 2 n , 2 1 ) = χ 2 ( 2 n ) ,
j = 1 ∑ m y j ∼ G a ( m , λ 2 ) , 2 λ 2 j = 1 ∑ m y j ∼ G a ( 2 2 m , 2 1 ) = χ 2 ( 2 m ) .
再注意到诸 x i 与诸 y j 间的独立性,在原假设 H 0 : λ 1 = λ 2 成立下,有如下抽样分布:
i = 1 ∑ n x i / j = 1 ∑ m y j ∼ F ( 2 n , 2 m ) .
设 x 1 , x 2 , … , x n 为来自正态总体 N ( μ , σ 2 ) 的 i.i.d. 样本,其中 μ , σ 2 未知。证明关于检验问题
H 0 : μ ≤ μ 0 vs H 1 : μ > μ 0
的单侧 t 检验是似然比检验(显著性水平 α < 1/2 )。
解
记 θ = ( μ , σ 2 ) ,样本的联合密度函数为
p ( x 1 , x 2 , … , x n ; θ ) = ( 2 π σ 2 ) − n /2 exp { − 2 σ 2 1 i = 1 ∑ n ( x i − μ ) 2 } ,
两个参数空间分别为
Θ 0 = {( μ , σ 2 ) ∣ μ ≤ μ 0 , σ 2 > 0 } , Θ = {( μ , σ 2 ) ∣ μ ∈ R , σ 2 > 0 } .
利用微分法,在 Θ 下
μ ^ = x ˉ , σ ^ 2 = n 1 i = 1 ∑ n ( x i − x ˉ ) 2
分别为 μ , σ 2 的 MLE,而在 Θ 0 下 μ , σ 2 的 MLE 为
μ ^ 0 = min { x ˉ , μ 0 } , σ ^ 0 2 = n 1 i = 1 ∑ n ( x i − μ ^ 0 ) 2 .
于是似然比统计量为
Λ = ( σ ^ 0 2 σ ^ 2 ) − n /2 = ⎩ ⎨ ⎧ 1 , ( 1 + ( n − 1 ) s 2 n ( x ˉ − μ 0 ) 2 ) n /2 , x ˉ ≤ μ 0 , x ˉ > μ 0 .
在 μ = μ 0 时 P ( x ˉ ≤ μ 0 ) = 1/2 ,由于 α < 1/2 ,故只需考虑 x ˉ > μ 0 的情形,此时
Λ
为
t = s n ( x ˉ − μ 0 )
的单调增函数,故此时的似然比统计量 Λ 是传统的 t 统计量的增函数,即此时的似然比检验等价于单侧的 t 检验,拒绝域
{ Λ ≥ c } ⟺ { s n ( x ˉ − μ 0 ) ≥ d } .
由 t 检验的结论知,
d = t 1 − α ( n − 1 ) ,
这就完成了证明。
按孟德尔遗传规律,让开淡红花的豌豆随机交配,子代可区分为红花、淡红花和白花三类,其比例是 1 : 2 : 1 ,为了验证这一理论,观察一次实验,得到红花、淡红花和白花的豌豆株数分别为 26 , 66 , 28 ,这些数据与孟德尔定律是否一致(α = 0.05 )?
解
这是一个分类数据的拟合优度检验,总体可分为三类。若记子代出现红花、淡红花和白花的分别概率为 p 1 , p 2 , p 3 ,则要检验的假设为
H 0 : p 10 = 4 1 , p 20 = 2 1 , p 30 = 4 1 .
此处 r = 3 , n = 120 , n 1 = 26 , n 2 = 66 , n 3 = 28 ,
n p 10 = 30 , n p 20 = 60 , n p 30 = 30.
故
χ 2 = i = 1 ∑ r n p i 0 ( n i − n p i 0 ) 2 = 30 ( 26 − 30 ) 2 + 60 ( 66 − 60 ) 2 + 30 ( 28 − 30 ) 2 = 1.2667.
而
χ 0.95 2 ( 2 ) = 5.9915 > 1.2667 ,
故没有理由拒绝 H 0 ,即认为孟德尔定律是可接受的。经计算,该检验的 p 值为
p = P ( χ 2 ( 2 ) ≥ 1.2667 ) = 0.5308.
掷一颗骰子 60 次,结果如下:
点数 次数 1 7 2 8 3 12 4 11 5 9 6 13
试在显著性水平 0.05 下检验这颗骰子是否均匀。
解
这是一个分布拟合优度检验,总体总共分 6 类。若记出现点数 i 的概率为 p i ,则要检验的假设为
H 0 : p 1 = p 2 = ⋯ = p 6 = 6 1 .
这里 k = 6 ,检验拒绝域为
{ χ 2 ≥ χ 1 − α 2 ( 5 )} .
若取 α = 0.05 ,则查表知
χ 0.95 2 ( 5 ) = 11.0705 ,
检验的统计量为
χ 2 = 10 ( 7 − 10 ) 2 + 10 ( 8 − 10 ) 2 + ⋯ + 10 ( 13 − 10 ) 2 = 2.8.
由于 χ 2 = 2.8 未落入拒绝域,故不拒绝原假设。在显著性水平为 0.05 下可以认为这颗骰子是均匀的。此处检验的 p 值为
p = P ( χ 2 ( 5 ) ≥ 2.8 ) = 0.7308.
检查了一批产品的 100 箱,记录各箱中的不合格品的个数,其结果如下:
不合格品个数 箱数 0 35 1 40 2 19 3 3 4 2 5 1 ≥ 6 0
问能否认为一箱的不合格品个数服从泊松分布(取 α = 0.05 )?
解
这是一个要检验总体是否服从泊松分布的假设检验问题。由于有几类的观察个数偏少,为使用近似分布,需要把后面四类合并为一类。于是我们把总体分成 4 类;在原假设下,每类出现的概率为
p i = i ! λ i e − λ , i = 0 , 1 , 2 , p 3 = i = 3 ∑ ∞ i ! λ i e − λ .
未知参数 λ 可采用最大似然方法进行估计,为
λ ^ = 100 1 ( 1 × 40 + 2 × 19 + ⋯ + 5 × 1 ) = 1.
将 λ ^ 代入可以估计出诸 p ^ i 。于是可计算出检验统计量 χ 2 ,如下表:
\renewcommand{\arraystretch}{1.2}
i n i p ^ i n p ^ i ( n i − n p ^ i ) 2 / n p ^ i 0 35 0.3679 36.79 0.0871 1 40 0.3679 36.79 0.2801 2 19 0.1839 18.39 0.0202 3 6 0.0803 8.03 0.5132 合计 100 1.0000 100 χ 2 = 0.9006
若取 α = 0.05 ,查表知
χ 0.95 2 ( 2 ) = 5.9915 ,
故拒绝域为
W = { χ 2 ≥ 5.9915 } .
由于 χ 2 = 0.9006 < 5.9915 ,故不拒绝原假设,在显著性水平 0.05 下可以认为一箱的不合格品数是服从泊松分布的。此处检验的 p 值为
p = P ( χ 2 ≥ 0.9006 ) = 0.6374.
某建筑工地每天发生事故数现场记录如下:
一天发生的事故数 天数 0 102 1 59 2 30 3 8 4 0 5 1 ≥ 6 0 合计 200
试在显著性水平 α = 0.05 下检验这批数据是否服从泊松分布。
解
本题与上题完全类似,仍为检验总体是否服从泊松分布的分布拟合检验问题。由于有几类的观察个数偏少,为使用近似分布,需要把后面四类合并为一类。于是我们把总体分成 4 类;在原假设下,每类出现的概率为
p i = i ! λ i e − λ , i = 0 , 1 , 2 , p 3 = i = 3 ∑ ∞ i ! λ i e − λ .
未知参数 λ 采用最大似然估计得
λ ^ = 200 1 ( 1 × 59 + 2 × 30 + 3 × 8 + 5 × 1 ) = 0.74.
将 λ ^ 代入可估计出诸 p ^ i 。于是可计算出检验统计量 χ 2 ,如下表:
\renewcommand{\arraystretch}{1.2}
i n i p ^ i n p ^ i ( n i − n p ^ i ) 2 / n p ^ i 0 102 0.4771 95.42 0.4537 1 59 0.3531 70.62 1.9120 2 30 0.1306 26.12 0.5764 3 9 0.0392 7.84 0.1716 合计 200 1.0000 200 χ 2 = 3.1137
若取 α = 0.05 ,查表知
χ 0.95 2 ( 2 ) = 5.9915 ,
故拒绝域为
W = { χ 2 ≥ 5.9915 } .
由于 χ 2 = 3.1137 < 5.9915 ,故不拒绝原假设,在显著性水平 0.05 下可以认为这批数据服从泊松分布。此处检验的 p 值为
p = P ( χ 2 ≥ 3.1137 ) = 0.2108.
在一批灯泡中抽取 300 只作寿命试验,其结果如下:
寿命 /h 灯泡数 < 100 121 [ 100 , 200 ) 78 [ 200 , 300 ) 43 ≥ 300 58
在显著性水平 0.05 下能否认为灯泡寿命服从指数分布 E x p ( 0.005 ) ?
解
这是一个检验总体是否服从指数分布 E x p ( 0.005 ) 的假设检验问题。本题中总体分成 4 类;在原假设成立下,每类出现的概率 p i 及 n p i 分别为
p 1 = 1 − e − λ t = 1 − e − 0.005 × 100 = 0.3935 , n p 1 = 300 × 0.3935 = 118.05 ,
p 2 = e − 100 λ − e − 200 λ = 0.2387 , n p 2 = 300 × 0.2387 = 71.61 ,
p 3 = e − 200 λ − e − 300 λ = 0.1447 , n p 3 = 300 × 0.1447 = 43.41 ,
p 4 = e − 300 λ = 0.2231 , n p 4 = 300 × 0.2231 = 66.93.
因而,检验的统计量为
χ 2 = 118.05 ( 121 − 118.05 ) 2 + 71.61 ( 78 − 71.61 ) 2 + 43.41 ( 43 − 43.41 ) 2 + 66.93 ( 58 − 66.93 ) 2 = 1.8393.
这里 r = 4 ,检验拒绝域为
{ χ 2 ≥ χ 1 − α 2 ( 3 )} .
若取 α = 0.05 ,则
χ 0.95 2 ( 3 ) = 7.8147.
由于 χ 2 = 1.8393 未落入拒绝域,故不拒绝原假设,在显著性水平 0.05 下可以认为灯泡寿命服从指数分布 E x p ( 0.005 ) 。此处检验的 p 值为
p = P ( χ 2 ≥ 1.8393 ) = 0.6064.
下表是上海 1875 年到 1955 年的 81 年间,根据其中 63 年观察到的一年中(5 月到 9 月)下暴雨次数的整理资料
i n i 0 4 1 8 2 14 3 19 4 10 5 4 6 2 7 1 8 1 ≥ 9 0
试检验一年中暴雨次数是否服从泊松分布(α = 0.05 )。
解
这是一个检验总体是否服从泊松分布的假设检验问题。为了满足每一类出现的样本观测次数不小于 5 ,我们把 k ≤ 1 和 k ≥ 5 分别合并为一类,把总体分为 5 类,在原假设下每类出现的概率为
p 1 = ( λ + 1 ) e − λ , p i = i ! λ i e − λ , i = 2 , 3 , 4 , p 5 = i = 5 ∑ ∞ i ! λ i e − λ .
未知参数 λ 采用最大似然方法估计得
λ ^ = 63 1 ( 1 × 8 + 2 × 14 + 3 × 19 + 4 × 10 + 5 × 4 + 6 × 2 + 7 × 1 + 8 × 1 ) = 2.8571.
将 λ ^ 代入可计算相关概率估计值 p ^ k , k = 1 , 2 , ⋯ , 9 ,进而算出检验统计量 χ 2 ,如下表:
序号 i 1 2 3 4 5 总和 暴雨次数 ≤ 1 2 3 4 ≥ 5 n i 12 14 19 10 8 63 p ^ i 0.2215 0.2344 0.2233 0.1595 0.1613 1 n p ^ i 13.95 14.77 14.07 10.05 10.16 63 n p ^ i ( n i − n p ^ i ) 2 0.2726 0.0401 1.7274 0.0002 0.4592 2.4995
而
χ 0.95 2 ( r − k − 1 ) = χ 0.95 2 ( 3 ) = 7.8147 ,
故拒绝域为
W = { χ 2 ≥ 7.8147 } ,
观察结果 χ 2 不落在拒绝域,因此不能拒绝 H 0 ,即可以认为一年中暴雨的次数服从泊松分布。此处的 p 值为
p = P ( χ 2 ≥ 2.4995 ) = 0.4754.
某种配偶的后代按体格的属性分为三类,各类的数目分别是 10 , 53 , 46 。按照某种遗传模型其频率之比应为
p 2 : 2 p ( 1 − p ) : ( 1 − p ) 2 ,
问数据与模型是否相符(α = 0.05 )?
解
这是一个分布拟合优度检验,总体可分为三类。若记三类出现的概率分别为 p 1 , p 2 , p 3 ,则要检验的假设为
H 0 : p 1 = p 2 , p 2 = 2 p ( 1 − p ) , p 3 = ( 1 − p ) 2 .
此处 r = 3 , n = 109 , n 1 = 10 , n 2 = 53 , n 3 = 46 。由于含有一个未知参数 p ,需要将之估计出来,用最大似然法估计 p 。其似然函数为
L = ( p 2 ) n 1 ⋅ [ 2 p ( 1 − p ) ] n 2 ⋅ [( 1 − p ) 2 ] n 3 = 2 n 2 p 2 n 1 + n 2 ( 1 − p ) n 2 + 2 n 3 ,
ln L = ( 2 n 1 + n 2 ) ln p + ( n 2 + 2 n 3 ) ln ( 1 − p ) + n 2 ln 2 ,
再微分法可得
p ^ = 2 n 2 n 1 + n 2 = 2 ( 10 + 53 + 46 ) 2 × 10 + 53 = 0.3349 ,
于是
p ^ 1 = 0.1121 , p ^ 2 = 0.4455 , p ^ 3 = 0.4424 ,
从而
χ 2 = 109 × 0.1121 ( 10 − 109 × 0.1121 ) 2 + 109 × 0.4455 ( 53 − 109 × 0.4455 ) 2 + 109 × 0.4424 ( 46 − 109 × 0.4424 ) 2 = 0.9114.
查表知
χ 0.95 2 ( 1 ) = 3.8415 ,
故拒绝域为
W = { χ 2 ≥ 3.8415 } ,
观察结果 χ 2 不落在拒绝域,因此不能拒绝 H 0 ,即可认为数据与模型是相符的。此处的 p 值为
p = P ( χ 2 ≥ 0.9114 ) = 0.3397.
设按有无特性 A 与 B 将 n 个样品分成四类,组成 2 × 2 列联表:
A A ˉ 合计 B a c a + c B ˉ b d b + d 合计 a + b c + d n
其中 n = a + b + c + d ,试证明此列联表独立性检验的 χ 2 统计量可以表示成
χ 2 = ( a + b ) ( c + d ) ( a + c ) ( b + d ) n ( a d − b c ) 2 .
解
检验的假设问题为 H 0 : A 与 B 是独立的。统计表示如下:
H 0 : p ij = p i ⋅ p ⋅ j , i = 1 , 2 , j = 1 , 2.
在原假设成立下,我们计算诸参数的最大似然估计,为
p ^ 1 ⋅ = n a + b , p ^ 2 ⋅ = n c + d , p ^ ⋅ 1 = n a + c , p ^ ⋅ 2 = n b + d .
进而得到
n p ^ 11 = n ( a + b ) ( a + c ) , n p ^ 12 = n ( a + b ) ( b + d ) ,
n p ^ 21 = n ( a + c ) ( c + d ) , n p ^ 22 = n ( c + d ) ( b + d ) .
因而检验统计量为
χ 2 = n ( a + b ) ( a + c ) ( a − n ( a + b ) ( a + c ) ) 2 + n ( a + b ) ( b + d ) ( b − n ( a + b ) ( b + d ) ) 2 + n ( a + c ) ( c + d ) ( c − n ( a + c ) ( c + d ) ) 2 + n ( c + d ) ( b + d ) ( d − n ( c + d ) ( b + d ) ) 2 = ( a + b ) ( a + c ) n [ na − ( a + b ) ( a + c ) ] 2 + ( a + b ) ( b + d ) n [ nb − ( a + b ) ( b + d ) ] 2 + ( a + c ) ( c + d ) n [ n c − ( a + c ) ( c + d ) ] 2 + ( c + d ) ( b + d ) n [ n d − ( c + d ) ( b + d ) ] 2 = ( a + b ) ( a + c ) ( c + d ) ( b + d ) n ( a d − b c ) 2 ( c + d ) ( b + d ) + ( a + b ) ( a + c ) ( c + d ) ( b + d ) n ( a d − b c ) 2 ( a + c ) ( c + d ) + ( a + b ) ( a + c ) ( c + d ) ( b + d ) n ( a d − b c ) 2 ( a + b ) ( b + d ) + ( a + b ) ( a + c ) ( c + d ) ( b + d ) n ( a d − b c ) 2 ( a + b ) ( a + c ) = ( a + b ) ( a + c ) ( c + d ) ( b + d ) n ( a d − b c ) 2 [ n ( a + b ) + n ( c + d ) ] = ( a + b ) ( a + c ) ( c + d ) ( b + d ) n ( a d − b c ) 2 .
证明完成。
在研究某种新措施对猪白痢的防治效果问题时,获得了如下数据:
对照 新措施 合计 存活数 114 132 246 死亡数 36 18 54 合计 150 150 300 死亡率 24% 12% 18%
试问新旧措施对防治该种疾病的疗效是否有显著差异(α = 0.05 )?
解
用 A 表示有无使用新措施,它有两个水平:A 1 表示对照组,A 2 表示新措施组,用 B 表示防治效果,它也有两个水平:B 1 表示存活,B 2 表示死亡。检验的假设为
H 0 : 新措施与防治该疾病无关系,即 A 与 B 是独立的。
统计表示如下:
H 0 : p ij = p i ⋅ p ⋅ j , i = 1 , 2 , j = 1 , 2.
由第 12 题可知,此列联表独立性检验的 χ 2 统计量可以表示成
χ 2 = ( 114 + 36 ) ( 132 + 18 ) ( 114 + 132 ) ( 36 + 18 ) 300 × ( 114 × 18 − 132 × 36 ) 2 = 150 × 150 × 246 × 54 300 × ( − 2700 ) 2 = 7.3171.
此处 r = c = 2 , ( r − 1 ) ( c − 1 ) = 1 ,
χ 0.95 2 ( 1 ) = 3.8415 < χ 2 = 7.3171 ,
故拒绝原假设,即认为新旧措施对防治该疾病的疗效有显著差异。此处的 p 值为
p = P ( χ 2 ≥ 7.3171 ) = 0.0068.
某单位调查了 520 名中年以上的脑力劳动者,其中 136 人有高血压史,另外 384 人则无。在有高血压史的 136 人中,经诊断冠心病及可疑者的有 48 人,在无高血压史的 384 人中,经诊断为冠心病及可疑者的有 36 人。从这个资料,对高血压与冠心病有无关系作检验,取 α = 0.01 。
解
该题完全类似于上题。用 A 表示有无高血压,它有两个水平:A 1 表示有高血压史,A 2 表示无高血压史;用 B 表示诊断结果,它也有两个水平:B 1 表示诊断为冠心病及可疑者,B 2 表示诊断结果正常。则由已知得下表:
A 1 A 2 合计 B 1 48 36 84 B 2 88 348 436 合计 136 384 520
检验的假设为
H 0 : 高血压与冠心病无关联,即 A 与 B 是独立的。
统计表示如下:
H 0 : p ij = p i ⋅ p ⋅ j , i = 1 , 2 , j = 1 , 2.
由 12 题可知,此列联表独立性检验的 χ 2 统计量可以表示成
χ 2 = ( 48 + 88 ) ( 36 + 348 ) ( 48 + 36 ) ( 88 + 348 ) 520 × ( 48 × 348 − 88 × 36 ) 2 = 136 × 384 × 84 × 436 520 × 1353 6 2 = 49.8136.
此处 r = c = 2 , ( r − 1 ) ( c − 1 ) = 1 ,
χ 0.99 2 ( 1 ) = 6.6349 ,
此处观测值远远超过临界值,故拒绝原假设,即认为高血压与冠心病有关系。此处的 p 值为
p = P ( χ 2 ≥ 49.8136 ) ≐ 0.
一项是否应提高小学生的计算机课程的比例的调查结果如下:
年龄 55 岁以上 36 ∼ 55 岁 15 ∼ 35 岁 同意 32 44 47 不同意 28 21 12 不知道 14 17 13
问年龄因素是否影响了对问题的回答(α = 0.05 )?
解
待检验的假设为
H 0 : 年龄因素对问题的回答无关联。
统计表示如下:
H 0 : p ij = p i ⋅ p ⋅ j , i = 1 , 2 , 3 , j = 1 , 2 , 3.
在原假设成立下,我们计算诸参数的最大似然估计,为
p ^ ⋅ 1 = 228 74 = 0.3246 , p ^ ⋅ 2 = 228 82 = 0.3596 , p ^ ⋅ 3 = 228 72 = 0.3158 ,
p ^ 1 ⋅ = 228 123 = 0.5395 , p ^ 2 ⋅ = 228 61 = 0.2675 , p ^ 3 ⋅ = 228 44 = 0.1930.
进而利用 p ^ ij = p ^ i ⋅ p ^ ⋅ j 得到
n p ^ 11 = 39.9277 , n p ^ 12 = 19.7974 , n p ^ 13 = 14.2837 ,
n p ^ 21 = 44.2330 , n p ^ 22 = 21.9320 , n p ^ 23 = 15.8238 ,
n p ^ 31 = 38.8453 , n p ^ 32 = 19.2606 , n p ^ 33 = 13.8965.
由以上结果可计算出检验的统计量
χ 2 = i = 1 ∑ 3 j = 1 ∑ 3 n p ^ ij ( n ij − n p ^ ij ) 2 = 9.6133.
此处 r = c = 3 , ( r − 1 ) ( c − 1 ) = 4 ,
χ 0.95 2 ( 4 ) = 9.4877 < χ 2 = 9.6133 ,
故拒绝原假设,即认为年龄因素与问题的回答有关联。此处的 p 值为
p = P ( χ 2 ≥ 9.6133 ) = 0.0475.
§7.5 正态性检验
正态概率纸检验 具体步骤如下:
首先将数据按从小到大的次序排列:
x ( 1 ) ≤ x ( 2 ) ≤ ⋯ ≤ x ( n ) ;
对每一个 i ,计算修正频率
F ^ i = n + 0.25 i − 0.375 , i = 1 , 2 , ⋯ , n ,
将 F ^ i 看作概率 F ( x ( i ) ) 的估计;
将点 ( x ( i ) , F ^ i ) , i = 1 , 2 , ⋯ , n 逐一描在正态概率纸上;
判断:若诸点在一条直线附近,则认为该数据来自正态总体;若诸点明显不在一条直线附近,则认为该数据不是来自正态分布总体;
如果从正态概率纸上确认总体是非正态分布时,可从如下变换
y = ln x , y = x 1 , y = x
中选一个作数据变换,然后用 ( y ( i ) , F ^ i ) 再描点,判断变换后的数据是否来自正态分布,若 ln x ∼ N ( μ , σ 2 ) ,则 x ∼ L N ( μ , σ 2 ) ,若 x 1 ∼ N ( μ , σ 2 ) ,则 x ∼ I N ( μ , σ 2 ) (倒正态分布),若 x ∼ N ( μ , σ 2 ) ,则 x 服从非中心 χ 2 分布(更一般的 χ 2 分布)。
W 检验 具体步骤如下:
首先将观测值按从小到大的次序排列:
x ( 1 ) ≤ x ( 2 ) ≤ ⋯ ≤ x ( n ) ;
从附表 6 中查得对应 n 的系数 a 1 , a 2 , ⋯ , a n ,其中
a n + 1 − i = − a i , i = 1 , 2 , ⋯ , [ 2 n ] ;
计算检验统计量
W = i = 1 ∑ n ( x ( i ) − x ˉ ) 2 i = 1 ∑ [ n /2 ] a i ( x ( n + 1 − i ) − x ( i ) ) 2 ;
拒绝域
W = { W ≤ W α } ,
其中 W α 可查附表 7 。
注:国家标准 GB/T4882—2001 中规定:样本量 n ≥ 8 ,因为在 n < 8 时,对偏离正态分布的检验不太有效。
爱泼斯坦—普利检验(EP 检验) EP 检验统计量定义为
T EP = 1 + 3 n + n 2 i = 2 ∑ n j = 1 ∑ i − 1 exp { − 2 s n 2 ( x j − x i ) 2 } − 2 i = 1 ∑ n exp { − 4 s n 2 ( x i − x ˉ ) 2 } ,
其中 x ˉ , s n 2 就是前述的样本均值和(除以 n 的)样本方差。该统计量通常需要编程计算,其拒绝域为
{ T EP > T 1 − α , EP ( n )} ,
T 1 − α , EP ( n ) 可查附表 11 ,当 n > 200 时,统计量 T EP 的分位数可以用 n = 200 时的分位数代替;对小于 200 而不在表内的 n ,可采用线性插值的方法得到近似的分位数。
注意:样本观测值的次序是随机的,但一经选定后在计算 T EP 中必须保持不变。计算 T EP 的程序框图如图 7.4 所示(引自国标 GB/T4882—2001)。
\FigureSevenFour
习题与解答 7.5
在检查了一个车间生产的 20 个轴承外座圈的内径(单位:mm )后得到下面数据:
15.04 , 15.36 , 14.57 , 14.53 , 15.57 , 14.69 , 15.37 , 14.66 , 14.52 , 15.41 ,
15.34 , 14.28 , 15.01 , 14.76 , 14.38 , 15.87 , 13.66 , 14.97 , 15.29 , 14.95.
作正态概率图,并作初步判断;
请用 W 检验方法检验这组数据是否来自正态分布(α = 0.05 )。
解
(1) 首先将数据按从小到大的顺序排列:
x ( 1 ) ≤ x ( 2 ) ≤ ⋯ ≤ x ( 20 ) .
具体数据为
13.66 , 14.28 , 14.38 , 14.52 , 14.53 , 14.57 , 14.66 , 14.69 , 14.76 , 14.95 ,
14.97 , 15.01 , 15.04 , 15.29 , 15.34 , 15.36 , 15.37 , 15.41 , 15.57 , 15.87.
对每一个 i ,计算修正频率
20 + 0.25 i − 0.375 ,
结果见表:
i 1 2 3 4 5 6 7 8 9 10 x ( i ) 13.66 14.28 14.38 14.52 14.53 14.57 14.66 14.69 14.76 14.95 20 + 0.25 i − 0.375 0.0309 0.0802 0.1296 0.1790 0.2284 0.2778 0.3272 0.3765 0.4259 0.4753 i 11 12 13 14 15 16 17 18 19 20 x ( i ) 14.97 15.01 15.04 15.29 15.34 15.36 15.37 15.41 15.57 15.87 20 + 0.25 i − 0.375 0.5247 0.5741 0.6235 0.6728 0.7222 0.7716 0.8210 0.8704 0.9198 0.9691
将点
( x ( i ) , 20 + 0.25 i − 0.375 )
逐一描在正态概率纸上(利用软件),得到内径数据的概率图。
\FigureSevenFive
观察上述点的分布,可以判断上述 20 个点基本在一条直线附近。
(2) W 检验。由数据可算得
x ˉ = 14.9115 , i = 1 ∑ 20 ( x ( i ) − x ˉ ) 2 = 5.1685 ,
为计算方便,建立如下表格
k 1 2 3 4 5 x ( k ) 13.66 14.28 14.38 14.52 14.53 x ( n − k + 1 ) 15.87 15.57 15.41 15.37 15.36 d k 2.21 1.29 1.03 0.85 0.83 a k 0.4734 0.3211 0.2565 0.2085 0.1686 k 6 7 8 9 10 x ( k ) 14.57 14.66 14.69 14.76 14.95 x ( n − k + 1 ) 15.34 15.29 15.04 15.01 14.97 d k 0.77 0.63 0.35 0.25 0.02 a k 0.1334 0.1013 0.0711 0.0422 0.0140
从上表中可计算出 W 的值:
W = 5.1685 ( 0.4734 × 2.21 + 0.3211 × 1.29 + ⋯ + 0.0140 × 0.02 ) 2 = 0.9743.
当 n = 20 时,查表知
W 0.05 = 0.905 ,
拒绝域为
{ W ≤ 0.905 } ,
由于样本观测值没有落入拒绝域内,故在显著性水平 α = 0.05 下不拒绝原假设,即可以认为这批数据服从正态分布。
抽查克矽平治疗矽肺患者 10 名,得到他们治疗前后的血红蛋白量之差如下:
2.7 , − 1.2 , − 1.0 , 0 , 0.7 , 2.0 , 3.7 , − 0.6 , 0.8 , − 0.3.
作正态概率图,并作初步判断;
请用 W 检验方法检验治疗前后的血红蛋白量之差是否服从正态分布(α = 0.05 )?
解
(1) 仿上题,首先将数据排序,得到
− 1.2 , − 1.0 , − 0.6 , − 0.3 , 0 , 0.7 , 0.8 , 2.0 , 2.7 , 3.7 ,
对每一个 i ,计算修正频率
10 + 0.25 i − 0.375 , i = 1 , 2 , ⋯ , 10.
结果见表:
i 1 2 3 4 5 6 7 8 9 10 x ( i ) − 1.2 − 1.0 − 0.6 − 0.3 0 0.7 0.8 2.0 2.7 3.7 10 + 0.25 i − 0.375 0.0610 0.1585 0.2561 0.3537 0.4512 0.5488 0.6463 0.7439 0.8415 0.9390
利用软件可得到正态概率图如下:
\FigureSevenSix
(2) W 检验。由数据可算得
x ˉ = 0.68 , i = 1 ∑ 10 ( x ( i ) − x ˉ ) 2 = 24.376 ,
为计算方便,建立如下表格
k 1 2 3 4 5 x ( k ) − 1.2 − 1.0 − 0.6 − 0.3 0.0 x ( n − k + 1 ) 3.7 2.7 2.0 0.8 0.7 d k 4.9 3.7 2.6 1.1 0.7 a k 0.5739 0.3291 0.2141 0.1224 0.0399
从上表中可计算出 W 的值:
W = 24.376 ( 0.5739 × 4.9 + 0.3291 × 3.7 + 0.2141 × 2.6 + 0.1224 × 1.1 + 0.0399 × 0.7 ) 2 = 0.9252.
当 n = 10 时,查表知
W 0.05 = 0.842 ,
拒绝域为
{ W ≤ 0.842 } ,
由于样本观测值没有落入拒绝域内,故在显著性水平 α = 0.05 下不拒绝原假设,即可以认为治疗前后的血红蛋白量之差服从正态分布。
某种岩石中的一种元素的含量在 25 个样本中为
0.32 , 0.25 , 0.29 , 0.25 , 0.28 , 0.30 , 0.23 , 0.23 , 0.40 , 0.32 , 0.35 ,
0.19 , 0.34 , 0.33 , 0.33 , 0.28 , 0.28 , 0.22 , 0.30 , 0.24 , 0.35 , 0.24 ,
0.30 , 0.23 , 0.22.
有专家认为该样本来自对数正态分布总体,试设法用 W 检验方法作检验(α = 0.05 )。
解
首先应对数据进行对数变换。记 y = ln x ,则 25 个 y 的观测值可算出,我们把它列在下表中,由此可算得
y ˉ = − 1.28 , i = 1 ∑ 25 ( y ( i ) − y ˉ ) 2 = 0.8246 ,
为计算方便,建立如下表格
k 1 2 3 4 5 6 y ( k ) − 1.66 − 1.51 − 1.51 − 1.47 − 1.47 − 1.47 y ( n − k + 1 ) − 0.92 − 1.05 − 1.05 − 1.08 − 1.11 − 1.11 d k 0.74 0.46 0.46 0.39 0.36 0.36 a k 0.4450 0.3069 0.2543 0.2148 0.1822 0.1539 k 7 8 9 10 11 12 y ( k ) − 1.43 − 1.43 − 1.39 − 1.39 − 1.27 − 1.27 y ( n − k + 1 ) − 1.14 − 1.14 − 1.20 − 1.20 − 1.20 − 1.24 d k 0.29 0.29 0.19 0.19 0.07 0.03 a k 0.1283 0.1046 0.0823 0.0610 0.0403 0.0200
从上表中可计算出 W 的值为
W = 0.8246 ( 0.4450 × 0.74 + 0.3069 × 0.46 + ⋯ + 0.0200 × 0.03 ) 2 = 0.9615.
当 n = 25 时,查表知
W 0.05 = 0.918 ,
拒绝域为
{ W ≤ 0.918 } ,
由于样本观测值没有落入拒绝域内,故在显著性水平 α = 0.05 下不拒绝原假设,即可以认为样本来自对数正态分布。
对第 3 题的数据,试用 EP 检验方法检验这些数据是否来自正态总体(取 α = 0.05 )。
解
该问题可按计算 T EP 的框图用任一种软件编程计算,这里用 SAS 软件编程算得
T EP = 0.0831.
若取显著性水平 α = 0.05 ,在附表 11 中通过线性插值得到 n = 25 时的 0.95 分位数约为
0.368 + 30 − 20 0.371 − 0.368 × ( 25 − 20 ) = 0.3695.
计算得到的 T EP 小于该临界值。因此在显著性水平 0.05 下接受这些数据是来自正态总体的。
§7.6 非参数检验
游程检验 在怀疑数据可能不符合随机选取的原则时可对数据进行游程检验。
设 x 1 , x 2 , ⋯ , x n 为依时间顺序连续得到的一组样本观测值序列,要考察如下原假设是否成立:
H 0 : 样本观察值序列符合随机抽取的原则。
为此记样本中位数为 m e ,把序列中小于 m e 的那些 x i 换成 0 ;大于或等于 m e 的那些 x i 换成 1 。把以 0 为界的一连串的 1 称为 1 游程,以 1 为界的一连串的 0 称为 0 游程,统称为游程。设序列中 0 和 1 的个数分别为 n 1 和 n 2 ,设 R 表示样本序列的总游程数,则检验的拒绝域为
{ R ≤ c 1 } ∪ { R ≥ c 2 } ,
其中临界值 c 1 和 c 2 根据 H 0 为真时 R 的分布确定,可查表。
当 n 1 , n 2 都不太大时,游程检验用 p 值进行更为方便,记 R 的观测值为 R 0 ,则
p = 2 min { P ( R ≤ R 0 ) , P ( R ≥ R 0 )} ,
其概率可用下述两式进行计算
P ( R = 2 k ) = ( n 1 n 1 + n 2 ) 2 ( k − 1 n 1 − 1 ) ( k − 1 n 2 − 1 ) , k = 1 , 2 , ⋯ , [ 2 n ] ,
P ( R = 2 k + 1 ) = ( n 1 n 1 + n 2 ) ( k − 1 n 1 − 1 ) ( k n 2 − 1 ) + ( k n 1 − 1 ) ( k − 1 n 2 − 1 ) , k = 1 , 2 , ⋯ , [ 2 n − 1 ] .
对比较大的 n 1 , n 2 ,可以使用渐近分布。对给定的显著性水平 α ,两个临界值可近似取为
c 1 = [ n 1 + n 2 2 n 1 n 2 ( 1 + n 1 + n 2 u α /2 ) ] , c 2 = [ n 1 + n 2 2 n 1 n 2 ( 1 + n 1 + n 2 u 1 − α /2 ) ] + 1.
研究表明,当 n 1 , n 2 都大于 20 时,上式近似效果是足够好的。游程检验还可以用于检验两个总体是否有相同分布。
符号检验 符号检验主要用来对总体 p 的分位数 x p 进行检验。
设 x 1 , x 2 , ⋯ , x n 是来自总体 X 的样本,欲检验
H 0 : x p ≤ x 0 vs H 1 : x p > x 0 ,
其中 x 0 是某个给定常数,记
γ i = { 1 , 0 , x i > x 0 , x i ≤ x 0 ,
符号检验统计量为
S + = i = 1 ∑ n γ i ,
拒绝域为
W = { S + ≥ c } , c = k inf { k : i = k ∑ n ( i n ) p 0 i ( 1 − p 0 ) n − i ≤ α } .
对符号检验,使用检验的 p 值较为简便。记 S 0 + 为符号统计量的观测值,则检验的 p 值为
p = P ( S + ≥ S 0 + ) = i = S 0 + ∑ n b ( i ; n , 1 − p ) ,
其中
b ( i ; n , 1 − p ) = ( i n ) ( 1 − p ) i p n − i
表示二项分布的概率函数。
三种假设下的符号检验:
H 0 x p ≤ x 0 x p ≥ x 0 x p = x 0 H 1 x p > x 0 x p < x 0 x p = x 0 拒绝域形式 W I = { S + ≥ c } W II = { S + ≤ c } W III = { S + ≤ c 1 或 S + ≥ c 2 } 检验的 p 值 i = s 0 + ∑ n b ( i ; n , 1 − p ) i = 0 ∑ s 0 + b ( i ; n , 1 − p ) 2 min ⎩ ⎨ ⎧ i = 0 ∑ s 0 + b ( i ; n , 1 − p ) , i = s 0 + ∑ n b ( i ; n , 1 − p ) , 0.5 ⎭ ⎬ ⎫
符号检验还可用于成对数据的比较。
符号秩和检验 秩检验主要用于对对称分布的分布中心进行检验。观测值在有序样本中的序称为它的秩。
设连续总体关于某个参数 θ 对称,其分布函数记为 F ( x − θ ) ,要检验的假设为:
H 0 : θ = 0 vs H 1 : θ = 0.
设 x 1 , x 2 , ⋯ , x n 是样本,记 R i 为 ∣ x i ∣ 在 ( ∣ x 1 ∣ , ∣ x 2 ∣ , ⋯ , ∣ x n ∣ ) 中的秩,符号秩和统计量
W + = i = 1 ∑ n R i I ( x i > 0 ) ,
拒绝域为
{ W + ≤ W α /2 + ( n )} ∪ { W + ≥ W 1 − α /2 + ( n )} .
附表 13 给出了 n ≤ 50 时满足条件
P ( W + ≤ W α + ( n ) ) ≤ α
的 W α + ( n ) ,至于满足条件
P ( W + ≥ W 1 − α + ( n ) ) ≤ α
的 W 1 − α + ( n ) ,它等于
2 1 n ( n + 1 ) − W α + ( n ) .
当 n > 50 时可采用正态近似
24 n ( n + 1 ) ( 2 n + 1 ) W + − 4 n ( n + 1 ) L N ( 0 , 1 )
计算检验临界值。
秩和检验 秩和检验常用来对两个总体的位置进行比较。设有两个总体,分布函数分别为 F ( x − θ 1 ) 和 F ( x − θ 2 ) ,x 1 , x 2 , ⋯ , x m 和 y 1 , y 2 , ⋯ , y n 分别为其样本,对合样本 x 1 , x 2 , ⋯ , x m , y 1 , y 2 , ⋯ , y n 进行排序,对应的秩为
R = ( Q 1 , Q 2 , ⋯ , Q m , R 1 , R 2 , ⋯ , R n ) .
在比较 θ 1 , θ 2 的大小时,采用如下威尔科克森秩和统计量
W = i = 1 ∑ n R i ,
假设与拒绝域分别为
I H 0 : θ 1 ≤ θ 2 vs H 1 : θ 1 > θ 2 , W I = { W ≤ W α ( m , n )} ;
II H 0 : θ 1 ≥ θ 2 vs H 1 : θ 1 < θ 2 , W II = { W ≥ W 1 − α ( m , n )} ;
III H 0 : θ 1 = θ 2 vs H 1 : θ 1 = θ 2 , W III = { W ≤ W α /2 ( m , n ) 或 W ≥ W 1 − α /2 ( m , n )} .
在样本容量较大时,可以用大样本近似公式
W ∗ = 12 mn ( m + n + 1 ) W − 2 n ( m + n + 1 ) ∼ N ( 0 , 1 )
作上述检验。在 m 与 n 都大于等于 20 时,此种近似效果很好。
习题与解答 7.6
说明:除非特别指出,以下检验的显著性水平均取为 α = 0.05 。
在某保险种类中,一次关于 2008 年的索赔数额(单位:元)的随机抽样为(按升序排列):
4632 , 4728 , 5052 , 5064 , 5484 , 6972 , 7596 , 9480 ,
14760 , 15012 , 18720 , 21240 , 22836 , 52788 , 67200.
已知 2007 年的索赔数额的中位数为 5063 元。2008 年索赔的中位数比前一年是否有所变化?请用双侧符号检验方法检验,求检验的 p 值,并写出结论。
解
原假设
H 0 : x 0.5 = 5063 ,
备择假设
H 1 : x 0.5 = 5063 ,
作差 x i − 5063 ,得到检验统计量值为
S 0 + = 12 ,
检验的 p 值为
p = 2 min { i = 0 ∑ 12 ( i 15 ) 0. 5 15 , i = 12 ∑ 15 ( i 15 ) 0. 5 15 , 0.5 } = 2 min { 0.9963 , 0.0176 , 0.5 } = 0.0352.
p 值小于 0.05 ,所以拒绝原假设。从而认为 2008 年的索赔中位数与前一年相比有变化。
1984 年一些国家每平方千米可开发水资源数据(单位:万吨/年)如下表所示:
国家 苏联 巴西 美国 加拿大 扎伊尔 墨西哥 瑞典 意大利 奥地利 南斯拉夫 挪威 每平方千米可开发水资源 4.9 4.1 7.5 5.4 28.1 4.9 22.3 16.8 58.6 24.8 37.4 国家 印度 哥伦比亚 日本 阿根廷 印度尼西亚 瑞士 罗马尼亚 联邦德国 英国 法国 西班牙 每平方千米可开发水资源 8.5 26.3 34.9 6.9 7.9 78.0 10.1 8.8 1.7 11.5 13.4
而当年中国的该项指标为 20 万吨/年,请用符号检验方法检验:这 22 个国家每平方千米可开发的水资源的中位数不高于中国。求检验的 p 值,并写出结论。
解
原假设
H 0 : x 0.5 ≤ 20 ,
备择假设
H 1 : x 0.5 > 20 ,
作差 x i − 20 ,发现正数的个数为
S 0 + = 8 ,
从而检验的 p 值为
p = i = 8 ∑ 22 ( i 22 ) 0. 5 22 = 0.9331 ,
p 值很大,所以可以认为这 22 个国家可开发水资源的中位数不高于中国。
下面是亚洲十个国家 1996 年的每 1000 个新生儿中的死亡数(按从小到大的次序排列):
日本 4 , 以色列 6 , 韩国 9 , 斯里兰卡 15 , 中国 23 ,
叙利亚 31 , 伊朗 36 , 印度 65 , 孟加拉国 77 , 巴基斯坦 88.
以 M 表示 1996 年亚洲国家中 1000 个新生儿中的死亡数的中位数,试检验:
H 0 : M ≥ 34 vs H 1 : M < 34.
求检验的 p 值,并写出结论。
解
作差 x i − 34 ,发现正数的个数为
S 0 + = 4 ,
从而检验的 p 值为
p = i = 0 ∑ 4 ( i 10 ) 0. 5 10 = 0.3770 ,
p 值大于 0.05 ,不拒绝原假设,即可以认为中位数不低于 34 。
某烟厂称其生产的每支香烟的尼古丁含量在 12 mg 以下。实验室测定的该烟厂的 12 支香烟的尼古丁含量(单位:mg )分别为
16.7 , 17.7 , 14.1 , 11.4 , 13.4 , 10.5 ,
13.6 , 11.6 , 12.0 , 12.6 , 11.7 , 13.7.
该烟厂所说的尼古丁含量是否比实际要少?求检验的 p 值,并写出结论。
解
我们可用中位数来刻画此问题,于是一对假设为
H 0 : x 0.5 ≤ 12 vs H 1 : x 0.5 > 12.
作差 x i − 12 得正值个数为 7 ,检验的 p 值为
p = i = 7 ∑ 12 ( i 12 ) 0. 5 12 = 0.3872.
与 0.05 比较,我们不能确认该厂的说法不真实。
9 名学生到英语培训班学习,培训前后各进行了一次水平测试,成绩为
学生编号 i 入学前成绩 x i 入学后成绩 y i z i = x i − y i 1 76 81 − 5 2 71 85 − 14 3 70 70 0 4 57 52 5 5 49 52 − 3 6 69 63 6 7 65 83 − 18 8 26 33 − 7 9 59 62 − 3
假设测验成绩服从正态分布,问学生的培训效果是否显著?
不假定总体分布,采用符号检验方法检验学生的培训效果是否显著;
采用符号秩和检验方法检验学生的培训效果是否显著。三种检验方法结论相同吗?
解
(1) 这是成对数据的检验问题,在假定正态分布下,可通过对
z i = x i − y i
作单样本 t 检验。一对假设为
H 0 : μ z ≥ 0 vs H 1 : μ z < 0.
由于
z ˉ = − 4.3333 , s z = 7.9373 ,
故可算出检验统计量值为
t = 7.9373 9 × ( − 4.3333 ) = − 1.6378 ,
于是检验的 p 值为
p = P ( t ≤ − 1.6378 ) = 0.0700 ,
p 值大于 0.05 ,在显著性水平 0.05 下不能认为学生的培训效果显著。
(2) 由于 z 1 , z 2 , ⋯ , z 9 正数的个数为 2 ,从而检验的 p 值为
p = i = 0 ∑ 2 ( i 9 ) 0. 5 9 = 0.0898 ,
p 值大于 0.05 ,在显著性水平 0.05 下也不能认为学生的培训效果显著。
(3) 由于两个正的差值的秩分别为 4.5 和 6 ,故符号秩和检验统计量为
W + = 10.5 ,
这是一个单侧假设检验,检验拒绝域为
{ W + ≤ W α + ( n )} ,
在给定 n = 9 , α = 0.05 下,查表 13 可知
W 0.05 + ( 9 ) = 8 ,
观测值没有落入拒绝域,故也不能认为学生的培训效果显著,三者结果一致。
为了比较用来做鞋子后跟的两种材料的质量,选取了 15 个男子(他们的生活条件各不相同),每人穿着一双新鞋,其中一只是以材料 A 做后跟,另一只以材料 B 做后跟,其厚度均为 10 mm ,过了一个月再测量厚度,得到数据如下:
序号 材料 A 材料 B 1 6.6 7.4 2 7.0 5.4 3 8.3 8.8 4 8.2 8.0 5 5.2 6.8 6 9.3 9.1 7 7.9 6.3 8 8.5 7.5 9 7.8 7.0 10 7.5 6.5 11 6.1 4.4 12 8.9 7.7 13 6.1 4.2 14 9.4 9.4 15 9.1 9.1
问是否可以认定以材料 A 制成的后跟比材料 B 的耐穿?
设 d i = x i − y i ( i = 1 , 2 , ⋯ , 15 ) 来自正态总体,结论是什么?
采用符号秩和检验方法检验,结论是什么?
解
(1) 这是成对数据的检验问题,在假定正态分布下,以 μ 记差值 d 的均值,则需检验的假设为
H 0 : μ d ≤ 0 vs H 1 : μ d > 0.
此处 15 个差值为
− 0.8 , 1.6 , − 0.5 , 0.2 , − 1.6 , 0.2 , 1.6 , 1 , 0.8 , 1 , 1.7 , 1.2 , 1.9 , 0 , 0.
由于
d ˉ = 0.5533 , s d = 1.0225 ,
故可算出检验统计量值为
t = 1.0225 15 × 0.5533 = 2.0958 ,
于是检验的 p 值为
p = P ( t ≥ 2.0958 ) = 0.0274.
p 值小于 0.05 ,在显著性水平 0.05 下可以认定以材料 A 制成的后跟比材料 B 的耐穿。
(2) 由于 3 个负的差值的秩分别为 5 , 6.5 , 12 ,故符号秩和检验统计量为
W − = 23.5
(正号和负号在使用中是完全等价的),这是一个单边假设检验,检验拒绝域为
{ W − ≤ W α − ( n )} ,
在给定 n = 15 , α = 0.05 下,查表 13 可知
W 0.05 − ( 15 ) = 30 ,
观测值落入拒绝域,拒绝原假设,可以认定以材料 A 制成的后跟比材料 B 的耐穿,二者结果一致。
某饮料商用两种不同配方推出了两种新的饮料,现抽取了 10 位消费者,让他们分别品尝两种饮料并加以评分,从不喜欢到喜欢,评分由 1 —10 ,评分结果如下:
品尝者 A 饮料 B 饮料 1 10 6 2 8 5 3 6 2 4 8 2 5 7 4 6 5 6 7 1 4 8 3 5 9 9 9 10 7 8
问两种饮料评分是否有显著差异?
采用符号检验方法作检验;
采用符号秩和检验方法作检验。
解
10 个差值为
4 , 3 , 4 , 6 , 3 , − 1 , − 3 , − 2 , 0 , − 1.
(1) 由于差值中正数的个数为 5 ,从而检验的 p 值为
p = 2 min { i = 0 ∑ 5 ( i 10 ) 0. 5 10 , i = 5 ∑ 10 ( i 10 ) 0. 5 10 , 0.5 } = 2 min { 0.6230 , 0.6230 , 0.5 } = 1 ,
p 值很大,故不能认为两种饮料评分有显著差异。
(2) 四个负的差值的秩分别为 2.5 , 2.5 , 4 , 6 ,故符号秩和检验统计量为
W − = 15 ,
这是一个双侧假设检验,检验拒绝域为
{ W − ≤ W α /2 − ( n )} ∪ { W − ≥ W 1 − α /2 − ( n )} ,
在给定 n = 10 , α = 0.05 下,查表 13 知
W 0.025 − ( 10 ) = 8 ,
而
W 0.975 − ( 10 ) = 2 10 × 11 − W 0.025 − ( 10 ) = 47 ,
观测值没有落入拒绝域,故不能认为两种饮料评分有显著差异,二者结果一致。
测试在有精神压力和没有精神压力时血压的差别,10 个志愿者进行了相应的试验,结果为(单位:mmHg ):
无精神压力 有精神压力 107 127 108 119 122 123 119 113 116 125 118 132 121 121 111 131 114 116 108 124
是否该数据表明有精神压力下的血压有所增加?
解
对此问题也可类似于本节第 5 题进行分析,首先明确要检验的一对假设为:
H 0 : 有无精神压力下的血压不变 vs H 1 : 有精神压力下的血压有增加 .
为此,先给出血压增加值 z i 的 10 个观测值,为
20 , 11 , 1 , − 6 , 9 , 14 , 0 , 20 , 2 , 16.
(1) 若假定增加值服从正态分布,可通过对增加值做单样本 t 检验。此一对假设为
H 0 : μ z = 0 vs H 1 : μ z > 0.
由数据可计算得到
z ˉ = 8.7 , s z = 9.056 ,
故可算出检验统计量值
t = 9.056 10 × 8.7 = 3.0380 ,
于是检验的 p 值为
p = P ( t ≥ 3.0380 ) = 0.0070 ,
p 值小于 0.05 ,可以认为有精神压力下的血压有所增加。
(2) 由于 z 1 , z 2 , ⋯ , z 10 正数的个数为 8 ,从而检验的 p 值为
p = i = 8 ∑ 10 ( i 10 ) 0. 5 10 = 0.0547 ,
p 值大于 0.05 ,在显著性水平 0.05 得不到显著的结论,即不能认为有精神压力下的血压有所增加。
(3) 由于负的差值只有一个,其秩为 4 ,故符号秩和检验统计量为
W − = 4 ,
这是一个单侧假设检验,检验拒绝域为
{ W − ≤ W α − ( n )} ,
在给定 n = 10 , α = 0.05 下,查表 13 可知
W 0.05 − ( 10 ) = 10 ,
观测值 4 落入拒绝域,故拒绝原假设,可以认为有精神压力下的血压有所增加。
三者结果并不完全一致。
评论
支持 Markdown 和 LaTeX 数学公式。