§7.4 似然比检验与分布拟合检验
依赖于
被以下题目直接调用
正文部分
§7.4 似然比检验与分布拟合检验
1. 似然比检验
设 x 1 , x 2 , … , x n 为来自密度函数为 p ( x ; θ ) ,θ ∈ Θ 的总体的样本,则对检验问题
H 0 : θ ∈ Θ 0 vs H 1 : θ ∈ Θ 1 = Θ − Θ 0 ,
可用似然比统计量
Λ = sup θ ∈ Θ 0 p ( x 1 , x 2 , … , x n ; θ ) sup θ ∈ Θ p ( x 1 , x 2 , … , x n ; θ )
作检验统计量,该检验称为似然比(likelihood ratio)检验,有时也称之为广义似然比检验。
检验统计量也可以写为
Λ = p ( x 1 , x 2 , … , x n ; θ ^ 0 ) p ( x 1 , x 2 , … , x n ; θ ^ ) ,
其中 θ ^ 表示在全参数空间 Θ 上 θ 的最大似然估计,θ ^ 0 表示在原假设成立时子参数空间 Θ 0 上 θ 的最大似然估计。拒绝域为
W = { Λ ≥ c } ,
其中临界值 c 由
P θ ( Λ ≥ c ) ≤ α , ( ∀ θ ∈ Θ 0 )
确定。
似然比检验是寻找检验统计量的一种思路。该似然比统计量没有统一的精确分布形式,但其对数似然比的 2 倍,即 2 ln Λ ,渐近服从 χ 2 ( k ) 分布,其中 k 为 Λ 中独立参数个数。
2. 总体可以分成 k 类:A 1 , A 2 , … , A k 时的分布拟合优度检验
原假设
H 0 : P ( A i ) = p i , i = 1 , 2 , … , k ,
其中诸 p i ≥ 0 ,且 ∑ i = 1 k p i = 1 ;
数据:对总体作 n 次观察,k 个类各出现的频数分别为 n 1 , n 2 , … , n k ,且 ∑ i = 1 k n i = n 。
分两种情况给出检验统计量及其拒绝域:
诸 p i 均已知,检验统计量
χ 2 = i = 1 ∑ k n p i ( n i − n p i ) 2 ,
拒绝域为
W = { χ 2 ≥ χ 1 − α 2 ( k − 1 )} ;
诸 p i 不完全已知,检验统计量
χ 2 = i = 1 ∑ k n p ^ i ( n i − n p ^ i ) 2 ,
拒绝域为
W = { χ 2 ≥ χ 1 − α 2 ( k − r − 1 )} ,
其中 r 为 p 1 , p 2 , … , p k 中独立参数个数,p ^ i 为 p i 的最大似然估计。
这个检验被 K. 皮尔逊称为 χ 2 拟合优度检验,p = P ( χ 2 ≥ χ 0 2 ) 被称为拟合优度,p 值愈大拟合优度愈好,p 值愈小拟合优度愈差,从而拒绝原假设 H 0 。
3. 列联表的独立性检验
r × c 的二维列联表:总体按两个属性 A 与 B 分类,A 有 r 个类:A 1 , A 2 , … , A r ,B 有 c 个类:B 1 , B 2 , … , B c ,共有 r c 个类;若进行 n 次试验,其中所属 A i 又属 B j 的结果有 n ij 个,按矩阵排列,就得 r × c 二维列联表。
\renewcommand{\arraystretch}{1.2}
A B 行和 1 ⋯ j ⋯ c 1 n 11 ⋯ n 1 j ⋯ n 1 c n 1 ⋅ \vdots \vdots \vdots \vdots i n i 1 ⋯ n ij ⋯ n i c n i ⋅ \vdots \vdots \vdots \vdots r n r 1 ⋯ n r j ⋯ n r c n r ⋅ 列和 n ⋅ 1 ⋯ n ⋅ j ⋯ n ⋅ c n
原假设
H 0 : P ( A i B j ) = p ij = p i ⋅ p ⋅ j = P ( A i ) P ( B j ) , i = 1 , 2 , … , r , j = 1 , 2 , … , c ,
其意为:属性 A 与 B 相互独立;
在诸 p ij 未知(常见)场合,检验统计量为
χ 2 = i = 1 ∑ r j = 1 ∑ c n p ^ ij ( n ij − n p ^ ij ) 2 ,
其中
p ^ ij = p ^ i ⋅ p ^ ⋅ j = n n i ⋅ ⋅ n n ⋅ j
是 p ij 的最大似然估计;
对给定显著性水平 α ( 0 < α < 1 ) ,在 n 较大场合该检验的拒绝域为
W = { χ 2 ≥ χ 1 − α 2 (( r − 1 ) ( c − 1 ))} .
习题与解答 7.4
设 x 1 , x 2 , … , x n 为来自 b ( 1 , p ) 的样本,试求
H 0 : p = p 0 vs H 1 : p = p 0
的似然比检验。
解
样本的联合概率函数为
P ( X 1 = x 1 , X 2 = x 2 , … , X n = x n ) = p ∑ i = 1 n x i ( 1 − p ) n − ∑ i = 1 n x i .
两个参数空间分别为
Θ 0 = { p : p = p 0 } , Θ = { p : 0 < p < 1 } ,
利用微分法,在 Θ 上 p 的 MLE 为
p ^ = x ˉ .
则似然比统计量为
Λ ( x 1 , x 2 , … , x n ) = p 0 n x ˉ ( 1 − p 0 ) n − n x ˉ x ˉ n x ˉ ( 1 − x ˉ ) n − n x ˉ = ( 1 − x ˉ x ˉ ⋅ p 0 1 − p 0 ) x ˉ n ( 1 − p 0 1 − x ˉ ) n .
通过稍显复杂的求导可知,当 x ˉ > p 0 时,
( 1 − x ˉ x ˉ ⋅ p 0 1 − p 0 ) x ˉ ( 1 − p 0 1 − x ˉ )
为 x 的严格增函数,而当 x ˉ < p 0 时,它为 x 的严格减函数。从而拒绝域
{ Λ ( x 1 , x 2 , … , x n ) ≥ c } ⟺ { i = 1 ∑ n x i ≤ d 1 } ∪ { i = 1 ∑ n x i ≥ d 2 } .
这说明此时的似然比检验与传统的关于比率 p 的检验是等价的,其中临界值 d 1 与 d 2 由显著性水平 α 确定。
设 x 1 , x 2 , … , x n 为来自 N ( μ , σ 2 ) 的样本,试求
H 0 : σ 2 = σ 0 2 vs H 1 : σ 2 = σ 0 2
的似然比检验。
解
记 θ = ( μ , σ 2 ) ,样本的联合密度函数为
P ( x 1 , x 2 , … , x n ; θ ) = ( 2 π σ 2 ) − n /2 exp { − 2 σ 2 1 i = 1 ∑ n ( x i − μ ) 2 } .
两个参数空间分别为
Θ 0 = {( μ , σ 0 2 ) ∣ μ ∈ R } , Θ = {( μ , σ 2 ) ∣ μ ∈ R , σ 2 > 0 } .
利用微分法可求出在 Θ 上
μ ^ = x ˉ , s ∗ 2 = n 1 i = 1 ∑ n ( x i − x ˉ ) 2
分别为 μ , σ 2 的 MLE,而在 Θ 0 上
μ ^ 0 = x ˉ
为 μ 的 MLE,于是似然比统计量为
Λ = ( 2 π σ 0 2 ) − n /2 exp { − 2 σ 0 2 n s ∗ 2 } ( 2 π s ∗ 2 ) − n /2 exp { − n /2 } = [ σ 0 2 s ∗ 2 exp { 1 − σ 0 2 s ∗ 2 } ] − n /2 .
通过简单的求导计算可知,函数 x e − x 在 ( 0 , 1 ) 区间内单调递增,在 ( 1 , + ∞ ) 上单调递减,于是
{ Λ ≥ c } ⟺ { σ 0 2 n s ∗ 2 ≤ d 1 } ∪ { σ 0 2 n s ∗ 2 ≥ d 2 } .
从而似然比检验等价于采用
χ 2 = σ 0 2 n s ∗ 2
做检验统计量,也就是说,似然比检验与传统的双侧卡方检验是等价的。
设 x 1 , x 2 , … , x n 为来自指数分布 E x p ( λ 1 ) 的样本,y 1 , y 2 , … , y m 为来自指数分布 E x p ( λ 2 ) 的样本,且两组样本独立,其中 λ 1 , λ 2 是未知的正参数。
求
H 0 : λ 1 = λ 2 vs H 1 : λ 1 = λ 2
的似然比检验;
证明上述检验法的拒绝域仅依赖于比值
i = 1 ∑ n x i / j = 1 ∑ m y j ;
求统计量
i = 1 ∑ n x i / j = 1 ∑ m y j
在原假设成立下的分布。
解
样本的联合密度函数为
P ( x 1 , x 2 , … , x n , y 1 , y 2 , … , y m ; θ ) = λ 1 n e − λ 1 ∑ i = 1 n x i λ 2 m e − λ 2 ∑ j = 1 m y j .
参数空间分别为
Θ 0 = { λ 1 = λ 2 = λ ∣ λ > 0 } , Θ = {( λ 1 , λ 2 ) ∣ λ 1 > 0 , λ 2 > 0 } ,
由微分法容易求出在 Θ 下参数的最大似然估计为
λ ^ 1 = ∑ i = 1 n x i n , λ ^ 2 = ∑ j = 1 m y j m .
而在 Θ 0 下参数的最大似然估计为
λ ^ 0 = ∑ i = 1 n x i + ∑ j = 1 m y j n + m .
则似然比统计量为
Λ = ( ∑ i = 1 n x i + ∑ j = 1 m y j n + m ) n + m ( ∑ i = 1 n x i n ) n ( ∑ j = 1 m y j m ) m
= ( n + m ) n + m n n m m ( 1 + ∑ j = 1 m y j ∑ i = 1 n x i ) m ( 1 + ∑ i = 1 n x i ∑ j = 1 m y j ) n .
由求导可知,函数
( 1 + x ) m ( 1 + x 1 ) n
为先减后增的单峰函数,故此似然比检验拒绝域可等价写为
{ Λ ≥ c } ⟺ { i = 1 ∑ n x i / j = 1 ∑ m y j ≤ d 1 } ∪ { i = 1 ∑ n x i / j = 1 ∑ m y j ≥ d 2 } ,
这就证明了(2)的结论。
注意到指数分布、伽马分布与卡方分布间的关系,可得
i = 1 ∑ n x i ∼ G a ( n , λ 1 ) , 2 λ 1 i = 1 ∑ n x i ∼ G a ( 2 2 n , 2 1 ) = χ 2 ( 2 n ) ,
j = 1 ∑ m y j ∼ G a ( m , λ 2 ) , 2 λ 2 j = 1 ∑ m y j ∼ G a ( 2 2 m , 2 1 ) = χ 2 ( 2 m ) .
再注意到诸 x i 与诸 y j 间的独立性,在原假设 H 0 : λ 1 = λ 2 成立下,有如下抽样分布:
i = 1 ∑ n x i / j = 1 ∑ m y j ∼ F ( 2 n , 2 m ) .
设 x 1 , x 2 , … , x n 为来自正态总体 N ( μ , σ 2 ) 的 i.i.d. 样本,其中 μ , σ 2 未知。证明关于检验问题
H 0 : μ ≤ μ 0 vs H 1 : μ > μ 0
的单侧 t 检验是似然比检验(显著性水平 α < 1/2 )。
解
记 θ = ( μ , σ 2 ) ,样本的联合密度函数为
p ( x 1 , x 2 , … , x n ; θ ) = ( 2 π σ 2 ) − n /2 exp { − 2 σ 2 1 i = 1 ∑ n ( x i − μ ) 2 } ,
两个参数空间分别为
Θ 0 = {( μ , σ 2 ) ∣ μ ≤ μ 0 , σ 2 > 0 } , Θ = {( μ , σ 2 ) ∣ μ ∈ R , σ 2 > 0 } .
利用微分法,在 Θ 下
μ ^ = x ˉ , σ ^ 2 = n 1 i = 1 ∑ n ( x i − x ˉ ) 2
分别为 μ , σ 2 的 MLE,而在 Θ 0 下 μ , σ 2 的 MLE 为
μ ^ 0 = min { x ˉ , μ 0 } , σ ^ 0 2 = n 1 i = 1 ∑ n ( x i − μ ^ 0 ) 2 .
于是似然比统计量为
Λ = ( σ ^ 0 2 σ ^ 2 ) − n /2 = ⎩ ⎨ ⎧ 1 , ( 1 + ( n − 1 ) s 2 n ( x ˉ − μ 0 ) 2 ) n /2 , x ˉ ≤ μ 0 , x ˉ > μ 0 .
在 μ = μ 0 时 P ( x ˉ ≤ μ 0 ) = 1/2 ,由于 α < 1/2 ,故只需考虑 x ˉ > μ 0 的情形,此时
Λ
为
t = s n ( x ˉ − μ 0 )
的单调增函数,故此时的似然比统计量 Λ 是传统的 t 统计量的增函数,即此时的似然比检验等价于单侧的 t 检验,拒绝域
{ Λ ≥ c } ⟺ { s n ( x ˉ − μ 0 ) ≥ d } .
由 t 检验的结论知,
d = t 1 − α ( n − 1 ) ,
这就完成了证明。
按孟德尔遗传规律,让开淡红花的豌豆随机交配,子代可区分为红花、淡红花和白花三类,其比例是 1 : 2 : 1 ,为了验证这一理论,观察一次实验,得到红花、淡红花和白花的豌豆株数分别为 26 , 66 , 28 ,这些数据与孟德尔定律是否一致(α = 0.05 )?
解
这是一个分类数据的拟合优度检验,总体可分为三类。若记子代出现红花、淡红花和白花的分别概率为 p 1 , p 2 , p 3 ,则要检验的假设为
H 0 : p 10 = 4 1 , p 20 = 2 1 , p 30 = 4 1 .
此处 r = 3 , n = 120 , n 1 = 26 , n 2 = 66 , n 3 = 28 ,
n p 10 = 30 , n p 20 = 60 , n p 30 = 30.
故
χ 2 = i = 1 ∑ r n p i 0 ( n i − n p i 0 ) 2 = 30 ( 26 − 30 ) 2 + 60 ( 66 − 60 ) 2 + 30 ( 28 − 30 ) 2 = 1.2667.
而
χ 0.95 2 ( 2 ) = 5.9915 > 1.2667 ,
故没有理由拒绝 H 0 ,即认为孟德尔定律是可接受的。经计算,该检验的 p 值为
p = P ( χ 2 ( 2 ) ≥ 1.2667 ) = 0.5308.
掷一颗骰子 60 次,结果如下:
点数 次数 1 7 2 8 3 12 4 11 5 9 6 13
试在显著性水平 0.05 下检验这颗骰子是否均匀。
解
这是一个分布拟合优度检验,总体总共分 6 类。若记出现点数 i 的概率为 p i ,则要检验的假设为
H 0 : p 1 = p 2 = ⋯ = p 6 = 6 1 .
这里 k = 6 ,检验拒绝域为
{ χ 2 ≥ χ 1 − α 2 ( 5 )} .
若取 α = 0.05 ,则查表知
χ 0.95 2 ( 5 ) = 11.0705 ,
检验的统计量为
χ 2 = 10 ( 7 − 10 ) 2 + 10 ( 8 − 10 ) 2 + ⋯ + 10 ( 13 − 10 ) 2 = 2.8.
由于 χ 2 = 2.8 未落入拒绝域,故不拒绝原假设。在显著性水平为 0.05 下可以认为这颗骰子是均匀的。此处检验的 p 值为
p = P ( χ 2 ( 5 ) ≥ 2.8 ) = 0.7308.
检查了一批产品的 100 箱,记录各箱中的不合格品的个数,其结果如下:
不合格品个数 箱数 0 35 1 40 2 19 3 3 4 2 5 1 ≥ 6 0
问能否认为一箱的不合格品个数服从泊松分布(取 α = 0.05 )?
解
这是一个要检验总体是否服从泊松分布的假设检验问题。由于有几类的观察个数偏少,为使用近似分布,需要把后面四类合并为一类。于是我们把总体分成 4 类;在原假设下,每类出现的概率为
p i = i ! λ i e − λ , i = 0 , 1 , 2 , p 3 = i = 3 ∑ ∞ i ! λ i e − λ .
未知参数 λ 可采用最大似然方法进行估计,为
λ ^ = 100 1 ( 1 × 40 + 2 × 19 + ⋯ + 5 × 1 ) = 1.
将 λ ^ 代入可以估计出诸 p ^ i 。于是可计算出检验统计量 χ 2 ,如下表:
\renewcommand{\arraystretch}{1.2}
i n i p ^ i n p ^ i ( n i − n p ^ i ) 2 / n p ^ i 0 35 0.3679 36.79 0.0871 1 40 0.3679 36.79 0.2801 2 19 0.1839 18.39 0.0202 3 6 0.0803 8.03 0.5132 合计 100 1.0000 100 χ 2 = 0.9006
若取 α = 0.05 ,查表知
χ 0.95 2 ( 2 ) = 5.9915 ,
故拒绝域为
W = { χ 2 ≥ 5.9915 } .
由于 χ 2 = 0.9006 < 5.9915 ,故不拒绝原假设,在显著性水平 0.05 下可以认为一箱的不合格品数是服从泊松分布的。此处检验的 p 值为
p = P ( χ 2 ≥ 0.9006 ) = 0.6374.
某建筑工地每天发生事故数现场记录如下:
一天发生的事故数 天数 0 102 1 59 2 30 3 8 4 0 5 1 ≥ 6 0 合计 200
试在显著性水平 α = 0.05 下检验这批数据是否服从泊松分布。
解
本题与上题完全类似,仍为检验总体是否服从泊松分布的分布拟合检验问题。由于有几类的观察个数偏少,为使用近似分布,需要把后面四类合并为一类。于是我们把总体分成 4 类;在原假设下,每类出现的概率为
p i = i ! λ i e − λ , i = 0 , 1 , 2 , p 3 = i = 3 ∑ ∞ i ! λ i e − λ .
未知参数 λ 采用最大似然估计得
λ ^ = 200 1 ( 1 × 59 + 2 × 30 + 3 × 8 + 5 × 1 ) = 0.74.
将 λ ^ 代入可估计出诸 p ^ i 。于是可计算出检验统计量 χ 2 ,如下表:
\renewcommand{\arraystretch}{1.2}
i n i p ^ i n p ^ i ( n i − n p ^ i ) 2 / n p ^ i 0 102 0.4771 95.42 0.4537 1 59 0.3531 70.62 1.9120 2 30 0.1306 26.12 0.5764 3 9 0.0392 7.84 0.1716 合计 200 1.0000 200 χ 2 = 3.1137
若取 α = 0.05 ,查表知
χ 0.95 2 ( 2 ) = 5.9915 ,
故拒绝域为
W = { χ 2 ≥ 5.9915 } .
由于 χ 2 = 3.1137 < 5.9915 ,故不拒绝原假设,在显著性水平 0.05 下可以认为这批数据服从泊松分布。此处检验的 p 值为
p = P ( χ 2 ≥ 3.1137 ) = 0.2108.
在一批灯泡中抽取 300 只作寿命试验,其结果如下:
寿命 /h 灯泡数 < 100 121 [ 100 , 200 ) 78 [ 200 , 300 ) 43 ≥ 300 58
在显著性水平 0.05 下能否认为灯泡寿命服从指数分布 E x p ( 0.005 ) ?
解
这是一个检验总体是否服从指数分布 E x p ( 0.005 ) 的假设检验问题。本题中总体分成 4 类;在原假设成立下,每类出现的概率 p i 及 n p i 分别为
p 1 = 1 − e − λ t = 1 − e − 0.005 × 100 = 0.3935 , n p 1 = 300 × 0.3935 = 118.05 ,
p 2 = e − 100 λ − e − 200 λ = 0.2387 , n p 2 = 300 × 0.2387 = 71.61 ,
p 3 = e − 200 λ − e − 300 λ = 0.1447 , n p 3 = 300 × 0.1447 = 43.41 ,
p 4 = e − 300 λ = 0.2231 , n p 4 = 300 × 0.2231 = 66.93.
因而,检验的统计量为
χ 2 = 118.05 ( 121 − 118.05 ) 2 + 71.61 ( 78 − 71.61 ) 2 + 43.41 ( 43 − 43.41 ) 2 + 66.93 ( 58 − 66.93 ) 2 = 1.8393.
这里 r = 4 ,检验拒绝域为
{ χ 2 ≥ χ 1 − α 2 ( 3 )} .
若取 α = 0.05 ,则
χ 0.95 2 ( 3 ) = 7.8147.
由于 χ 2 = 1.8393 未落入拒绝域,故不拒绝原假设,在显著性水平 0.05 下可以认为灯泡寿命服从指数分布 E x p ( 0.005 ) 。此处检验的 p 值为
p = P ( χ 2 ≥ 1.8393 ) = 0.6064.
下表是上海 1875 年到 1955 年的 81 年间,根据其中 63 年观察到的一年中(5 月到 9 月)下暴雨次数的整理资料
i n i 0 4 1 8 2 14 3 19 4 10 5 4 6 2 7 1 8 1 ≥ 9 0
试检验一年中暴雨次数是否服从泊松分布(α = 0.05 )。
解
这是一个检验总体是否服从泊松分布的假设检验问题。为了满足每一类出现的样本观测次数不小于 5 ,我们把 k ≤ 1 和 k ≥ 5 分别合并为一类,把总体分为 5 类,在原假设下每类出现的概率为
p 1 = ( λ + 1 ) e − λ , p i = i ! λ i e − λ , i = 2 , 3 , 4 , p 5 = i = 5 ∑ ∞ i ! λ i e − λ .
未知参数 λ 采用最大似然方法估计得
λ ^ = 63 1 ( 1 × 8 + 2 × 14 + 3 × 19 + 4 × 10 + 5 × 4 + 6 × 2 + 7 × 1 + 8 × 1 ) = 2.8571.
将 λ ^ 代入可计算相关概率估计值 p ^ k , k = 1 , 2 , ⋯ , 9 ,进而算出检验统计量 χ 2 ,如下表:
序号 i 1 2 3 4 5 总和 暴雨次数 ≤ 1 2 3 4 ≥ 5 n i 12 14 19 10 8 63 p ^ i 0.2215 0.2344 0.2233 0.1595 0.1613 1 n p ^ i 13.95 14.77 14.07 10.05 10.16 63 n p ^ i ( n i − n p ^ i ) 2 0.2726 0.0401 1.7274 0.0002 0.4592 2.4995
而
χ 0.95 2 ( r − k − 1 ) = χ 0.95 2 ( 3 ) = 7.8147 ,
故拒绝域为
W = { χ 2 ≥ 7.8147 } ,
观察结果 χ 2 不落在拒绝域,因此不能拒绝 H 0 ,即可以认为一年中暴雨的次数服从泊松分布。此处的 p 值为
p = P ( χ 2 ≥ 2.4995 ) = 0.4754.
某种配偶的后代按体格的属性分为三类,各类的数目分别是 10 , 53 , 46 。按照某种遗传模型其频率之比应为
p 2 : 2 p ( 1 − p ) : ( 1 − p ) 2 ,
问数据与模型是否相符(α = 0.05 )?
解
这是一个分布拟合优度检验,总体可分为三类。若记三类出现的概率分别为 p 1 , p 2 , p 3 ,则要检验的假设为
H 0 : p 1 = p 2 , p 2 = 2 p ( 1 − p ) , p 3 = ( 1 − p ) 2 .
此处 r = 3 , n = 109 , n 1 = 10 , n 2 = 53 , n 3 = 46 。由于含有一个未知参数 p ,需要将之估计出来,用最大似然法估计 p 。其似然函数为
L = ( p 2 ) n 1 ⋅ [ 2 p ( 1 − p ) ] n 2 ⋅ [( 1 − p ) 2 ] n 3 = 2 n 2 p 2 n 1 + n 2 ( 1 − p ) n 2 + 2 n 3 ,
ln L = ( 2 n 1 + n 2 ) ln p + ( n 2 + 2 n 3 ) ln ( 1 − p ) + n 2 ln 2 ,
再微分法可得
p ^ = 2 n 2 n 1 + n 2 = 2 ( 10 + 53 + 46 ) 2 × 10 + 53 = 0.3349 ,
于是
p ^ 1 = 0.1121 , p ^ 2 = 0.4455 , p ^ 3 = 0.4424 ,
从而
χ 2 = 109 × 0.1121 ( 10 − 109 × 0.1121 ) 2 + 109 × 0.4455 ( 53 − 109 × 0.4455 ) 2 + 109 × 0.4424 ( 46 − 109 × 0.4424 ) 2 = 0.9114.
查表知
χ 0.95 2 ( 1 ) = 3.8415 ,
故拒绝域为
W = { χ 2 ≥ 3.8415 } ,
观察结果 χ 2 不落在拒绝域,因此不能拒绝 H 0 ,即可认为数据与模型是相符的。此处的 p 值为
p = P ( χ 2 ≥ 0.9114 ) = 0.3397.
设按有无特性 A 与 B 将 n 个样品分成四类,组成 2 × 2 列联表:
A A ˉ 合计 B a c a + c B ˉ b d b + d 合计 a + b c + d n
其中 n = a + b + c + d ,试证明此列联表独立性检验的 χ 2 统计量可以表示成
χ 2 = ( a + b ) ( c + d ) ( a + c ) ( b + d ) n ( a d − b c ) 2 .
解
检验的假设问题为 H 0 : A 与 B 是独立的。统计表示如下:
H 0 : p ij = p i ⋅ p ⋅ j , i = 1 , 2 , j = 1 , 2.
在原假设成立下,我们计算诸参数的最大似然估计,为
p ^ 1 ⋅ = n a + b , p ^ 2 ⋅ = n c + d , p ^ ⋅ 1 = n a + c , p ^ ⋅ 2 = n b + d .
进而得到
n p ^ 11 = n ( a + b ) ( a + c ) , n p ^ 12 = n ( a + b ) ( b + d ) ,
n p ^ 21 = n ( a + c ) ( c + d ) , n p ^ 22 = n ( c + d ) ( b + d ) .
因而检验统计量为
χ 2 = n ( a + b ) ( a + c ) ( a − n ( a + b ) ( a + c ) ) 2 + n ( a + b ) ( b + d ) ( b − n ( a + b ) ( b + d ) ) 2 + n ( a + c ) ( c + d ) ( c − n ( a + c ) ( c + d ) ) 2 + n ( c + d ) ( b + d ) ( d − n ( c + d ) ( b + d ) ) 2 = ( a + b ) ( a + c ) n [ na − ( a + b ) ( a + c ) ] 2 + ( a + b ) ( b + d ) n [ nb − ( a + b ) ( b + d ) ] 2 + ( a + c ) ( c + d ) n [ n c − ( a + c ) ( c + d ) ] 2 + ( c + d ) ( b + d ) n [ n d − ( c + d ) ( b + d ) ] 2 = ( a + b ) ( a + c ) ( c + d ) ( b + d ) n ( a d − b c ) 2 ( c + d ) ( b + d ) + ( a + b ) ( a + c ) ( c + d ) ( b + d ) n ( a d − b c ) 2 ( a + c ) ( c + d ) + ( a + b ) ( a + c ) ( c + d ) ( b + d ) n ( a d − b c ) 2 ( a + b ) ( b + d ) + ( a + b ) ( a + c ) ( c + d ) ( b + d ) n ( a d − b c ) 2 ( a + b ) ( a + c ) = ( a + b ) ( a + c ) ( c + d ) ( b + d ) n ( a d − b c ) 2 [ n ( a + b ) + n ( c + d ) ] = ( a + b ) ( a + c ) ( c + d ) ( b + d ) n ( a d − b c ) 2 .
证明完成。
在研究某种新措施对猪白痢的防治效果问题时,获得了如下数据:
对照 新措施 合计 存活数 114 132 246 死亡数 36 18 54 合计 150 150 300 死亡率 24% 12% 18%
试问新旧措施对防治该种疾病的疗效是否有显著差异(α = 0.05 )?
解
用 A 表示有无使用新措施,它有两个水平:A 1 表示对照组,A 2 表示新措施组,用 B 表示防治效果,它也有两个水平:B 1 表示存活,B 2 表示死亡。检验的假设为
H 0 : 新措施与防治该疾病无关系,即 A 与 B 是独立的。
统计表示如下:
H 0 : p ij = p i ⋅ p ⋅ j , i = 1 , 2 , j = 1 , 2.
由第 12 题可知,此列联表独立性检验的 χ 2 统计量可以表示成
χ 2 = ( 114 + 36 ) ( 132 + 18 ) ( 114 + 132 ) ( 36 + 18 ) 300 × ( 114 × 18 − 132 × 36 ) 2 = 150 × 150 × 246 × 54 300 × ( − 2700 ) 2 = 7.3171.
此处 r = c = 2 , ( r − 1 ) ( c − 1 ) = 1 ,
χ 0.95 2 ( 1 ) = 3.8415 < χ 2 = 7.3171 ,
故拒绝原假设,即认为新旧措施对防治该疾病的疗效有显著差异。此处的 p 值为
p = P ( χ 2 ≥ 7.3171 ) = 0.0068.
某单位调查了 520 名中年以上的脑力劳动者,其中 136 人有高血压史,另外 384 人则无。在有高血压史的 136 人中,经诊断冠心病及可疑者的有 48 人,在无高血压史的 384 人中,经诊断为冠心病及可疑者的有 36 人。从这个资料,对高血压与冠心病有无关系作检验,取 α = 0.01 。
解
该题完全类似于上题。用 A 表示有无高血压,它有两个水平:A 1 表示有高血压史,A 2 表示无高血压史;用 B 表示诊断结果,它也有两个水平:B 1 表示诊断为冠心病及可疑者,B 2 表示诊断结果正常。则由已知得下表:
A 1 A 2 合计 B 1 48 36 84 B 2 88 348 436 合计 136 384 520
检验的假设为
H 0 : 高血压与冠心病无关联,即 A 与 B 是独立的。
统计表示如下:
H 0 : p ij = p i ⋅ p ⋅ j , i = 1 , 2 , j = 1 , 2.
由 12 题可知,此列联表独立性检验的 χ 2 统计量可以表示成
χ 2 = ( 48 + 88 ) ( 36 + 348 ) ( 48 + 36 ) ( 88 + 348 ) 520 × ( 48 × 348 − 88 × 36 ) 2 = 136 × 384 × 84 × 436 520 × 1353 6 2 = 49.8136.
此处 r = c = 2 , ( r − 1 ) ( c − 1 ) = 1 ,
χ 0.99 2 ( 1 ) = 6.6349 ,
此处观测值远远超过临界值,故拒绝原假设,即认为高血压与冠心病有关系。此处的 p 值为
p = P ( χ 2 ≥ 49.8136 ) ≐ 0.
一项是否应提高小学生的计算机课程的比例的调查结果如下:
年龄 55 岁以上 36 ∼ 55 岁 15 ∼ 35 岁 同意 32 44 47 不同意 28 21 12 不知道 14 17 13
问年龄因素是否影响了对问题的回答(α = 0.05 )?
解
待检验的假设为
H 0 : 年龄因素对问题的回答无关联。
统计表示如下:
H 0 : p ij = p i ⋅ p ⋅ j , i = 1 , 2 , 3 , j = 1 , 2 , 3.
在原假设成立下,我们计算诸参数的最大似然估计,为
p ^ ⋅ 1 = 228 74 = 0.3246 , p ^ ⋅ 2 = 228 82 = 0.3596 , p ^ ⋅ 3 = 228 72 = 0.3158 ,
p ^ 1 ⋅ = 228 123 = 0.5395 , p ^ 2 ⋅ = 228 61 = 0.2675 , p ^ 3 ⋅ = 228 44 = 0.1930.
进而利用 p ^ ij = p ^ i ⋅ p ^ ⋅ j 得到
n p ^ 11 = 39.9277 , n p ^ 12 = 19.7974 , n p ^ 13 = 14.2837 ,
n p ^ 21 = 44.2330 , n p ^ 22 = 21.9320 , n p ^ 23 = 15.8238 ,
n p ^ 31 = 38.8453 , n p ^ 32 = 19.2606 , n p ^ 33 = 13.8965.
由以上结果可计算出检验的统计量
χ 2 = i = 1 ∑ 3 j = 1 ∑ 3 n p ^ ij ( n ij − n p ^ ij ) 2 = 9.6133.
此处 r = c = 3 , ( r − 1 ) ( c − 1 ) = 4 ,
χ 0.95 2 ( 4 ) = 9.4877 < χ 2 = 9.6133 ,
故拒绝原假设,即认为年龄因素与问题的回答有关联。此处的 p 值为
p = P ( χ 2 ≥ 9.6133 ) = 0.0475.
评论
支持 Markdown 和 LaTeX 数学公式。