§7.2 正态总体参数假设检验
依赖于
被以下题目直接调用
正文部分
§7.2 正态总体参数假设检验
单个正态总体均值的假设检验
当总体服从正态分布时,关于均值 μ 的常用检验方法如下。这里 x ˉ 和 s 分别为样本均值与样本标准差,u 0 , t 0 表示相应检验统计量的观测值;U ∼ N ( 0 , 1 ) ,T ∼ t ( n − 1 ) 。
\begingroup
\footnotesize
\setlength{\tabcolsep}{4pt}
\renewcommand{\arraystretch}{1.25}
检验法 H 0 H 1 检验统计量 拒绝域 p 值u 检验(σ 已知)μ ≤ μ 0 μ > μ 0 u = σ / n x ˉ − μ 0 u ≥ u 1 − α 1 − Φ ( u 0 ) u 检验(σ 已知)μ ≥ μ 0 μ < μ 0 u = σ / n x ˉ − μ 0 u ≤ u α Φ ( u 0 ) u 检验(σ 已知)μ = μ 0 μ = μ 0 u = σ / n x ˉ − μ 0 ∥ u ∥ ≥ u 1 − α /2 2 ( 1 − Φ ( ∥ u 0 ∥ ) ) t 检验(σ 未知)μ ≤ μ 0 μ > μ 0 t = s / n x ˉ − μ 0 t ≥ t 1 − α ( n − 1 ) P ( T ≥ t 0 ) t 检验(σ 未知)μ ≥ μ 0 μ < μ 0 t = s / n x ˉ − μ 0 t ≤ t α ( n − 1 ) P ( T ≤ t 0 ) t 检验(σ 未知)μ = μ 0 μ = μ 0 t = s / n x ˉ − μ 0 ∥ t ∥ ≥ t 1 − α /2 ( n − 1 ) P ( ∥ T ∥ ≥ ∥ t 0 ∥ )
\endgroup
检验问题 H 0 : μ = μ 0 vs H 1 : μ > μ 0 与 H 0 : μ ≤ μ 0 vs H 1 : μ > μ 0 的拒绝域相同,p 值也相同;另一对单侧检验同理。
假设检验与置信区间的关系
设显著性水平为 α ,置信水平为 1 − α ,则有如下对应关系:
双侧检验问题 H 0 : μ = μ 0 vs H 1 : μ = μ 0 的接受域可导出正态总体均值 μ 的 1 − α 置信区间。
单侧检验问题 H 0 : μ ≤ μ 0 vs H 1 : μ > μ 0 的接受域可导出正态总体均值 μ 的 1 − α 置信下限。
单侧检验问题 H 0 : μ ≥ μ 0 vs H 1 : μ < μ 0 的接受域可导出正态总体均值 μ 的 1 − α 置信上限。
两个正态总体均值差的假设检验
设 x ˉ , s 1 2 分别来自正态总体 N ( μ 1 , σ 1 2 ) 的样本 x 1 , … , x m ,y ˉ , s 2 2 分别来自正态总体 N ( μ 2 , σ 2 2 ) 的样本 y 1 , … , y n ,则常用检验方法如下:
\begingroup
\footnotesize
\setlength{\tabcolsep}{4pt}
\renewcommand{\arraystretch}{1.2}
检验法 条件 H 0 H 1 检验统计量 拒绝域 p 值u 检验σ 1 , σ 2 已知μ 1 ≤ μ 2 μ 1 > μ 2 u = σ 1 2 / m + σ 2 2 / n x ˉ − y ˉ u ≥ u 1 − α 1 − Φ ( u 0 ) u 检验σ 1 , σ 2 已知μ 1 ≥ μ 2 μ 1 < μ 2 u = σ 1 2 / m + σ 2 2 / n x ˉ − y ˉ u ≤ u α Φ ( u 0 ) u 检验σ 1 , σ 2 已知μ 1 = μ 2 μ 1 = μ 2 u = σ 1 2 / m + σ 2 2 / n x ˉ − y ˉ ∥ u ∥ ≥ u 1 − α /2 2 ( 1 − Φ ( ∥ u 0 ∥ ) ) t 检验σ 1 = σ 2 未知μ 1 ≤ μ 2 μ 1 > μ 2 t = s w 1/ m + 1/ n x ˉ − y ˉ t ≥ t 1 − α ( m + n − 2 ) P ( T ≥ t 0 ) t 检验σ 1 = σ 2 未知μ 1 ≥ μ 2 μ 1 < μ 2 t = s w 1/ m + 1/ n x ˉ − y ˉ t ≤ t α ( m + n − 2 ) P ( T ≤ t 0 ) t 检验σ 1 = σ 2 未知μ 1 = μ 2 μ 1 = μ 2 t = s w 1/ m + 1/ n x ˉ − y ˉ ∥ t ∥ ≥ t 1 − α /2 ( m + n − 2 ) P ( ∥ T ∥ ≥ ∥ t 0 ∥ ) 大样本 u 检验 m , n 充分大μ 1 ≤ μ 2 μ 1 > μ 2 u = s 1 2 / m + s 2 2 / n x ˉ − y ˉ u ≥ u 1 − α 1 − Φ ( u 0 ) 大样本 u 检验 m , n 充分大μ 1 ≥ μ 2 μ 1 < μ 2 u = s 1 2 / m + s 2 2 / n x ˉ − y ˉ u ≤ u α Φ ( u 0 ) 大样本 u 检验 m , n 充分大μ 1 = μ 2 μ 1 = μ 2 u = s 1 2 / m + s 2 2 / n x ˉ − y ˉ ∥ u ∥ ≥ u 1 − α /2 2 ( 1 − Φ ( ∥ u 0 ∥ ) ) 近似 t 检验 m , n 不很大μ 1 ≤ μ 2 μ 1 > μ 2 t = s 1 2 / m + s 2 2 / n x ˉ − y ˉ t ≥ t 1 − α ( l ) P ( T ≥ t 0 ) 近似 t 检验 m , n 不很大μ 1 ≥ μ 2 μ 1 < μ 2 t = s 1 2 / m + s 2 2 / n x ˉ − y ˉ t ≤ t α ( l ) P ( T ≤ t 0 ) 近似 t 检验 m , n 不很大μ 1 = μ 2 μ 1 = μ 2 t = s 1 2 / m + s 2 2 / n x ˉ − y ˉ ∥ t ∥ ≥ t 1 − α /2 ( l ) P ( ∥ T ∥ ≥ ∥ t 0 ∥ )
\endgroup
其中
s w 2 = m + n − 2 ( m − 1 ) s 1 2 + ( n − 1 ) s 2 2 , l = m 2 ( m − 1 ) s 1 4 + n 2 ( n − 1 ) s 2 4 ( m s 1 2 + n s 2 2 ) 2 .
在近似 t 检验中,统计量近似服从自由度为 l 的 t 分布。
单个和两个正态总体方差的假设检验
\begingroup
\footnotesize
\setlength{\tabcolsep}{4pt}
\renewcommand{\arraystretch}{1.2}
检验法 H 0 H 1 检验统计量 拒绝域 p 值χ 2 检验σ 2 ≤ σ 0 2 σ 2 > σ 0 2 χ 0 2 = σ 0 2 ( n − 1 ) s 2 χ 2 ≥ χ 1 − α 2 ( n − 1 ) P ( χ 2 ≥ χ 0 2 ) χ 2 检验σ 2 ≥ σ 0 2 σ 2 < σ 0 2 χ 0 2 = σ 0 2 ( n − 1 ) s 2 χ 2 ≤ χ α 2 ( n − 1 ) P ( χ 2 ≤ χ 0 2 ) χ 2 检验σ 2 = σ 0 2 σ 2 = σ 0 2 χ 0 2 = σ 0 2 ( n − 1 ) s 2 χ 2 ≤ χ α /2 2 ( n − 1 ) 或 χ 2 ≥ χ 1 − α /2 2 ( n − 1 ) 2 min { P ( χ 2 ≤ χ 0 2 ) , P ( χ 2 ≥ χ 0 2 )} F 检验σ 1 2 ≤ σ 2 2 σ 1 2 > σ 2 2 F 0 = s 2 2 s 1 2 F ≥ F 1 − α ( m − 1 , n − 1 ) P ( F ≥ F 0 ) F 检验σ 1 2 ≥ σ 2 2 σ 1 2 < σ 2 2 F 0 = s 2 2 s 1 2 F ≤ F α ( m − 1 , n − 1 ) P ( F ≤ F 0 ) F 检验σ 1 2 = σ 2 2 σ 1 2 = σ 2 2 F 0 = s 2 2 s 1 2 F ≤ F α /2 ( m − 1 , n − 1 ) 或 F ≥ F 1 − α /2 ( m − 1 , n − 1 ) 2 min { P ( F ≤ F 0 ) , P ( F ≥ F 0 )}
\endgroup
这里 s 2 为单个正态总体样本方差,s 1 2 , s 2 2 分别为两个正态总体样本方差。
成对数据检验
成对数据检验就是把两个总体均值的比较通过成对数据的差转变为对单个总体均值的检验,方法完全等同。
成对数据的获得事先要作周全的安排(即试验设计)。在获得成对数据时不要发生“错位”,从而准确获得“成对数据”的信息。
习题与解答 7.2
本节习题均采用拒绝域的形式完成,在可以计算检验的 p 值时要求计算出 p 值。
有一批枪弹,出厂时,其初速率 v ∼ N ( 950 , 100 ) (单位:m/s )。经过较长时间储存,取 9 发进行测试,得样本值(单位:m/s )如下:
914 920 910 934 953 945 912 924 940
据经验,枪弹经储存后其初速率仍服从正态分布,且标准差保持不变,问是否可以认为这批枪弹的初速率有显著降低(α = 0.05 )?
解
这是一个单侧假设检验问题,总体 v ∼ N ( 950 , 100 ) ,待检验的原假设 H 0 和备择假设 H 1 分别为
H 0 : μ = 950 vs H 1 : μ < 950.
在显著性水平 α 下,检验的拒绝域为 { u ≤ u α } 。若取 α = 0.05 ,查表知 u 0.05 = − 1.645 。经计算得,x ˉ = 928 ,
u = 10/3 928 − 950 = − 6.6 ,
此处 u 值落入拒绝域内,故拒绝原假设,可以判断这批枪弹的初速率有显著降低。
借助本题说明一点:本题中的一对假设
H 0 : μ = μ 0 vs H 1 : μ < μ 0
的检验与另一对假设
H 0 : μ ≥ μ 0 vs H 1 : μ < μ 0
的检验有完全相同的拒绝域,这是因为二者的拒绝域形式相同,都形如
W = { σ / n x ˉ − μ 0 ≤ c } ,
由于使用该拒绝域的检验的势函数为
g ( μ ) = P ( σ / n x ˉ − μ 0 ≤ c ) = Φ ( σ / n μ 0 − μ + c ) ,
是 μ 的减函数,因而要求
μ ≥ μ 0 max g ( μ ) = α
与要求 g ( μ 0 ) = α 等价,从而两个检验问题的拒绝域完全一致。这现象不是偶然的,具有普遍性,这从势函数的单调性得到保证。
已知某炼铁厂铁水含碳量服从正态分布 N ( 4.55 , 0.10 8 2 ) 。现在测定了 9 炉铁水,其平均含碳量为 4.484 ,如果铁水含碳量的方差没有变化,可否认为现在生产的铁水平均含碳量仍为 4.55 (α = 0.05 )?
解
这是关于正态总体均值的双侧假设检验问题,原假设 H 0 和备择假设 H 1 分别为
H 0 : μ = 4.55 vs H 1 : μ = 4.55.
由于总体方差已知,故采用 u 检验,检验的拒绝域为 { ∣ u ∣ ≥ u 1 − α /2 } 。当 α = 0.05 时,查表知 u 0.975 = 1.96 。由已知条件,x ˉ = 4.484 ,故
u = 0.108/3 4.484 − 4.55 = − 1.83.
这里 u 值没有落入拒绝域,故不能拒绝原假设,因而可以认为生产的铁水平均含碳量仍为 4.55 。
由经验知某零件质量 X ∼ N ( 15 , 0.0 5 2 ) (单位:g );技术革新后,抽出 6 个零件,测得质量为
14.7 15.1 14.8 15.0 15.2 14.6
已知方差不变,问平均质量是否仍为 15 g (取 α = 0.05 )?
解
本题归结为对方差已知时检验正态总体均值 μ = 15 的问题,而且这是一个双侧假设检验问题,检验的拒绝域为 { ∣ u ∣ ≥ u 1 − α /2 } 。由 α = 0.05 ,查表知 u 0.975 = 1.96 。使用样本数据可算得,
x ˉ = 14.9 , u = 6 0.05 14.9 − 15 = − 4.90.
由于 ∣ u ∣ = 4.90 > 1.96 ,故有充分理由拒绝原假设,因而不能认为产品的平均质量仍为 15 g 。
下面我们对该题的问题作些讨论。此类问题的回答与已知的 σ 0 有很大关系,本题中假设 σ 0 = 0.05 ,得出的结论是拒绝原假设;若假定 σ 0 = 0.15 ,则可算得 u = − 1.63 ,这样一来就应接受原假设,所以在实用中对标准差的假定要慎重,若无把握,可考虑设总体标准差未知,此时就应使用 t 检验。本题中,若假定总体标准差未知,则可由样本算得
s = 0.237 ,
于是
t = 6 0.237 14.9 − 15 = − 1.0335 ,
而拒绝域为
W = { ∣ t ∣ ≥ t 0.975 ( 5 )} = { ∣ t ∣ ≥ 2.5706 } ,
故应接受原假设。
化肥厂用自动包装机包装化肥,每包的质量服从正态分布,其平均质量为 100 kg ,标准差为 1.2 kg 。某日开工后,为了确定这天包装机工作是否正常,随机抽取 9 袋化肥,称得质量(单位:kg )如下:
99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5
设方差稳定不变,问这一天包装机的工作是否正常(取 α = 0.05 )?
解
这是一个双侧假设检验问题,总体 X ∼ N ( μ , 1. 2 2 ) ,待检验的问题为
H 0 : μ = 100 vs H 1 : μ = 100 ,
检验拒绝域为 { ∣ u ∣ ≥ u 1 − α /2 } 。若取 α = 0.05 ,查表知 u 0.975 = 1.96 。由样本数据算得
x ˉ = 99.98 , u = 3 ( 99.98 − 100 ) /1.2 = − 0.05.
此处 u 值未落入拒绝域内,因此不能拒绝原假设,不能认为这一天包装机的工作不正常。
设需要对某正态总体的均值进行假设检验
H 0 : μ = 15 vs H 1 : μ < 15.
已知 σ 2 = 2.5 ,取 α = 0.05 ,若要求当 H 1 中的 μ ≤ 13 时犯第二类错误的概率不超过 0.05 ,求所需的样本容量。
解
由于本题中正态总体的方差已知,对于单侧假设检验问题,拒绝域的形式为
{ u ≤ u α } , 其中 u = 2.5/ n x ˉ − 15 .
若取显著性水平 α = 0.05 ,查表得知 u 0.05 = − 1.645 ,即检验的拒绝域为 { u ≤ − 1.645 } 。于是,当 μ ≤ 13 时,检验犯第二类错误的概率应满足
β = P ( u > − 1.645 ∣ μ ≤ 13 ) ≤ 0.05 ,
即
β = P ( 2.5/ n x ˉ − 15 > − 1.645 ) = P ( 2.5/ n x ˉ − μ > − 1.645 + 2.5/ n 15 − μ ) = 1 − Φ ( − 1.645 + 2.5/ n 15 − μ ) ≤ 0.05.
由于 Φ 是 μ 的减函数,因此只需满足
− 1.645 + 2.5/ n 15 − 13 ≥ 1.645
即可,由此可解得
n ≥ 7.
从一批钢管抽取 10 根,测得其内径(单位:mm )为
100.36 100.85 100.31 99.42 99.99 99.91 100.11 99.35 100.64 100.10
设这批钢管内径服从正态分布 N ( μ , σ 2 ) ,试分别在下列条件下:
已知 σ = 0.5 ;
σ 未知;
检验假设(α = 0.05 )
H 0 : μ = 100 vs H 1 : μ > 100.
解
(1) 当 σ = 0.5 已知时,应采用 u 检验,此时检验的拒绝域为 { u ≥ u 1 − α } 。若取 α = 0.05 ,查表知 u 0.95 = 1.645 ,由样本数据计算
x ˉ = 100.104 , u = 0.5 10 ( 100.104 − 100 ) = 0.6578.
检验统计量未落入拒绝域中,应接受原假设,不能认为 μ > 100 。
(2) 当 σ 未知时,应采用 t 检验,拒绝域为 { t ≥ t 1 − α ( n − 1 )} ,其中检验统计量
t = s / n x ˉ − μ 0 .
取显著性水平 α = 0.05 ,查表得 t 0.95 ( 9 ) = 1.8331 ,由样本观测值计算
s = 0.4760 , t = 10 0.4760 100.104 − 100 = 0.6909 < 1.8331 ,
故接受原假设。
假定考生成绩服从正态分布,在某地一次数学统考中,随机抽取了 36 位考生的成绩,算得平均成绩为 66.5 分,标准差为 15 分,问在显著性水平 0.05 下,是否可以认为这次考试全体考生的平均成绩为 70 分?
解
本题是关于正态总体均值的假设检验问题,由于总体方差未知,故用 t 检验法,欲检验的一对假设为
H 0 : μ = 70 vs H 1 : μ = 70 ,
拒绝域为
{ ∣ t ∣ ≥ t 1 − α /2 ( n − 1 )} .
当显著性水平为 0.05 时,t 0.975 ( 35 ) = 2.0301 。由已知条件,x ˉ = 66.5 , s = 15 ,故检验统计量的值为
t = 15 6 ( 66.5 − 70 ) = − 1.4.
因为 ∣ t ∣ = 1.4 < 2.0301 ,故接受原假设,可以认为这次考试全体考生的平均成绩与 70 分无显著差异。
注:这里没给出容量为 36 的样本数据,只给出样本均值 x ˉ 与样本标准差 s 。由于 x ˉ 与 s 是正态分布 N ( μ , σ 2 ) 的充分统计量,而充分统计量不会失落样本中的有用信息,故给出 x ˉ 与 s 的值,等价于给出具体的样本数据。这一现象会在很多场合里出现。
一位中学校长在报纸上看到这样的报道:“这一城市的初中学生平均每周看 8 h 电视。”她认为她所在学校的学生看电视的时间明显小于该数字。为此她在该校随机调查了 100 个学生,得知平均每周看电视的时间 x ˉ = 6.5 h ,样本标准差为 s = 2 h ,问是否可以认为这位校长的看法是对的(取 α = 0.05 )?
解
由于本题中样本量较大,可以认为样本均值服从正态分布,依题意,需要建立的原假设和备择假设为
H 0 : μ = 8 vs H 1 : μ < 8.
若取 α = 0.05 ,则 u 0.05 = − 1.645 ,拒绝域为 { u ≤ − 1.645 } ,由样本观测值算得
u = 2 10 ( 6.5 − 8 ) = − 7.5 < − 1.645 ,
因而拒绝原假设,认为这位校长的看法是对的。
设在木材中抽出 100 根,测其小头直径,得到样本平均数为 x ˉ = 11.2 cm ,样本标准差 s = 2.6 cm ,问能否认为该批木材小头的平均直径不低于 12 cm (取 α = 0.05 )?
解
本题与第 8 题类似,只是这里的原假设和备择假设分别为
H 0 : μ ≥ 12 vs H 1 : μ < 12 ,
拒绝域为 { u ≤ u α } ,当 α = 0.05 时,u 0.05 = − 1.645 ,检验统计量
u = 2.6 10 ( 11.2 − 12 ) = − 3.0769 < − 1.645.
u 值落入拒绝域内,因此拒绝原假设,不能认为该批木材小头的平均直径不低于 12 cm 。
考察一鱼塘中鱼的含汞量,随机地取 10 条鱼测得各条鱼的含汞量(单位:mg )为
0.8 1.6 0.9 0.8 1.2 0.4 0.7 1.0 1.2 1.1
设鱼的含汞量服从正态分布 N ( μ , σ 2 ) ,试检验假设
H 0 : μ ≤ 1.2 vs H 1 : μ > 1.2
(取 α = 0.10 )。
解
这是在总体方差未知下关于正态分布均值的单侧检验问题,检验的拒绝域为 { t ≥ t 1 − α ( n − 1 )} 。当 α = 0.10 时,查表知 t 0.9 ( 9 ) = 1.3830 ,由样本观测值计算得到
x ˉ = 0.97 , s = 0.3302 ,
t = 10 0.3302 0.97 − 1.2 = − 2.2027 < 1.3830 ,
故在显著性水平 0.1 下接受原假设。
如果一个矩形的宽度 w 与长度 l 的比
l w = 2 1 ( 5 − 1 ) ≈ 0.618 ,
这样的矩形称为黄金矩形。下面列出某工艺品厂随机抽取的 20 个矩形宽度与长度的比值:
0.693 0.668 0.749 0.611 0.654 0.606 0.670 0.609 0.662 0.553 0.672 0.570 0.615 0.844 0.606 0.576 0.690 0.933 0.628 0.630
设这一工厂生产的矩形的宽度与长度的比值总体服从正态分布,其均值为 μ ,试检验假设(取 α = 0.05 )
H 0 : μ = 0.618 vs H 1 : μ = 0.618.
解
这是关于正态分布均值的双侧检验问题,此处总体方差未知,故拒绝域为 { ∣ t ∣ ≥ t 1 − α /2 ( n − 1 )} 。若取显著性水平 α = 0.05 ,查表知 t 0.975 ( 19 ) = 2.0930 。经计算
x ˉ = 0.6620 , s = 0.0918 ,
由此,检验统计量
t = 20 0.0918 0.6620 − 0.618 = 2.1435.
由于 t 值落入拒绝域内,因此在显著性水平 α = 0.05 下拒绝原假设。
下面给出两种型号的计算器充电以后所能使用的时间(单位:h )的观测值
型号 A 型号 B 5.5 3.8 5.6 4.3 6.3 4.2 4.6 4.0 5.3 4.9 5.0 4.5 6.2 5.2 5.8 4.8 5.1 4.5 5.2 3.9 5.9 3.7 4.6
设两样本独立且数据所属的两正态总体的密度函数至多差一个平移量。试问能否认为型号 A 的计算器平均使用时间明显比型号 B 来得长(取 α = 0.01 )?
解
这个问题可归结为关于两总体的均值是否相等的检验问题。两正态总体方差相等但仍未知,故应采用两样本 t 检验。设 X 表示型号 A 的计算器充电以后所能使用的时间,Y 表示型号 B 的计算器充电以后所能使用的时间,则依题意,
X ∼ N ( μ 1 , σ 2 ) , Y ∼ N ( μ 2 , σ 2 ) ,
待检验的假设为
H 0 : μ 1 = μ 2 vs H 1 : μ 1 > μ 2 .
经计算,
x ˉ = 5.5 , y ˉ = 4.3667 , i = 1 ∑ 11 ( x i − x ˉ ) 2 = 2.74 , i = 1 ∑ 12 ( y i − y ˉ ) 2 = 2.4067 ,
从而
s w = 11 + 12 − 2 1 ( 2.74 + 2.4067 ) = 0.4951 ,
t = 0.4951 1/11 + 1/12 5.5 − 4.3667 = 5.4837.
其拒绝域为
{ t ≥ t 1 − α ( m + n − 2 )} = { t ≥ t 0.99 ( 21 )} .
查表知 t 0.99 ( 21 ) = 2.5176 ,由于检验统计量的取值 t > 2.5176 ,故拒绝 H 0 ,可以认为型号 A 的计算器平均使用时间明显比型号 B 来得长。
从某锌矿的东、西两支矿脉中,各抽取样本容量分别为 9 与 8 的样本进行测试,得样本含锌平均数及样本方差如下:
东支: x ˉ 1 = 0.230 , s 1 2 = 0.1337 ,
西支: x ˉ 2 = 0.269 , s 2 2 = 0.1736.
若东、西两支矿脉的含锌量都服从正态分布且方差相同,问东、西两支矿脉含锌量的平均值是否可以看作一样(取 α = 0.05 )?
解
由已知条件,待检验的一对假设为
H 0 : μ 1 = μ 2 vs H 1 : μ 1 = μ 2 .
这是一个双侧检验问题,因而拒绝域为
{ ∣ t ∣ ≥ t 1 − α /2 ( m + n − 2 )} .
由样本数据,算得
s w = 9 + 8 − 2 1 ( 8 × 0.1337 + 7 × 0.1736 ) = 0.3903 ,
检验统计量
t = 0.3903 1/9 + 1/8 0.230 − 0.269 = − 0.2056.
当 α = 0.05 时,t 0.975 ( 15 ) = 2.1314 > 0.2056 ,因此接受 H 0 ,东、西两支矿脉含锌量的均值可以看作一样。
在针织品漂白工艺过程中,要考察温度对针织品断裂强力(主要质量指标)的影响。为了比较 7 0 ∘ C 与 8 0 ∘ C 的影响有无差别,在这两个温度下,分别重复做了 8 次试验,得数据(单位:N )如下:
7 0 ∘ C 时的强力: 8 0 ∘ C 时的强力: 20.5 17.7 18.8 20.3 19.8 20.0 20.9 18.8 21.5 19.0 19.5 20.1 21.0 20.0 21.2 19.1
根据经验,温度对针织品断裂强力的波动没有影响。问在 7 0 ∘ C 时的平均断裂强力与 8 0 ∘ C 时的平均断裂强力间是否有显著差别(假定断裂强力服从正态分布,α = 0.05 )?
解
本题为关于两正态总体均值相等的检验问题,温度对针织品断裂强力的波动没有影响说明二者的方差是相等的。设 X 为 7 0 ∘ C 时针织品的断裂强力,Y 为 8 0 ∘ C 时针织品的断裂强力,
X ∼ N ( μ 1 , σ 2 ) , Y ∼ N ( μ 2 , σ 2 ) ,
待检验的一对假设为
H 0 : μ 1 = μ 2 vs H 1 : μ 1 = μ 2 .
由样本数据可算得
x ˉ = 20.4 , y ˉ = 19.375 , i = 1 ∑ 8 ( x i − x ˉ ) 2 = 6.2 , i = 1 ∑ 8 ( y i − y ˉ ) 2 = 5.515 ,
于是
s w = 8 + 8 − 2 1 ( 6.2 + 5.515 ) = 0.9148 ,
t = 0.9148 1/8 + 1/8 20.4 − 19.375 = 2.2409.
在显著性水平 α = 0.05 时,
t 0.975 ( 14 ) = 2.1448 ,
因此拒绝域为 { ∣ t ∣ ≥ 2.1448 } 。由于 t 值落入拒绝域内,从而拒绝原假设,认为 7 0 ∘ C 时检验的平均断裂强力与 8 0 ∘ C 时的平均断裂强力间有显著差别。
一药厂生产一种新的止痛片,厂方希望验证服用新药片后至开始起作用的时间间隔较原有止痛片至少缩短一半,因此厂方提出需检验假设
H 0 : μ 1 = 2 μ 2 vs H 1 : μ 1 > 2 μ 2 .
此处 μ 1 , μ 2 分别是服用原有止痛片和服用新药片后至开始起作用的时间间隔的总体均值。设两总体均为正态分布且方差分别为已知 σ 1 2 , σ 2 2 ,现分别在两总体中取一样本 x 1 , x 2 , … , x n 和 y 1 , y 2 , … , y m ,设两个样本独立。试给出上述假设检验问题的检验统计量及拒绝域。
解
设 X 为服用原有止痛片后至开始起作用的时间间隔,x 1 , x 2 , … , x n 为样本,Y 为服用新止痛片后至开始起作用的时间间隔,y 1 , y 2 , … , y m 为样本,且两个样本独立,
X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) ,
待检验的一对假设为
H 0 : μ 1 = 2 μ 2 vs H 1 : μ 1 > 2 μ 2 .
为此,先构造 μ 1 − 2 μ 2 的点估计 x ˉ − 2 y ˉ 。由于
x ˉ − 2 y ˉ ∼ N ( μ 1 − 2 μ 2 , n σ 1 2 + m 4 σ 2 2 ) ,
且 σ 1 2 , σ 2 2 已知,故 x ˉ − 2 y ˉ 的分布完全确定。据此,可采用 u 检验方法,检验统计量为
u = σ 1 2 / n + 4 σ 2 2 / m x ˉ − 2 y ˉ .
当 H 0 成立时,u ∼ N ( 0 , 1 ) ,对于本题的检验问题,在给定的显著性水平 α 下,检验的拒绝域为
W = { u ≥ u 1 − α } .
对冷却到 − 0.7 2 ∘ C 的样品用 A , B 两种测量方法测量其熔化到 0 ∘ C 时的潜热,数据如下:
方法 A: 79.98 80.04 80.02 80.04 80.03 80.03 80.04 79.97 方法 A: 80.05 80.03 80.02 80.00 80.02 方法 B: 80.02 79.94 79.98 79.97 80.03 79.95 79.97 79.97
假设它们服从正态分布,方差相等,试检验:两种测量方法的平均性能是否相等(取 α = 0.05 )?
解
设两种方法测量的潜热分别记为 X 和 Y ,并设
X ∼ N ( μ 1 , σ 2 ) , Y ∼ N ( μ 2 , σ 2 ) .
要检验
H 0 : μ 1 = μ 2 vs H 1 : μ 1 = μ 2 ,
可用双样本 t 检验,则检验的拒绝域为
W = {( x , y ) : ∣ t ∣ ≥ t 1 − α /2 ( n + m − 2 )} .
本题中,n = 13 , m = 8 ,直接计算可得
x ˉ = 80.02 , y ˉ = 79.98 ,
s w = n + m − 2 ∑ i = 1 n ( x i − x ˉ ) 2 + ∑ j = 1 m ( y j − y ˉ ) 2 = 19 0.006892 + 0.006888 = 0.02693 ,
因此有
t = 0.02693 80.02 − 79.98 21 104 = 3.31.
而 t 0.975 ( 19 ) = 2.093 < 3.31 ,因此应拒绝原假设,即两种测量方法的平均性能有显著性差异。检验的 p 值为 0.0036 。
为了比较测定污水中氯气含量的两种方法,特在各种场合收集到 8 个污水水样,每个水样均用这两种方法测定氯气含量(单位:mg/l ),具体数据如下:
水样号 1 2 3 4 5 6 7 8 方法一 ( x ) 0.36 1.35 2.56 3.92 5.35 8.33 10.70 10.91 方法二 ( y ) 0.39 0.84 1.76 3.35 4.69 7.70 10.52 10.92 差 ( d = x − y ) − 0.03 0.51 0.80 0.57 0.66 0.63 0.18 − 0.01
设总体为正态分布,试比较两种测定方法是否有显著差异。请写出检验的 p 值和结论(取 α = 0.05 )。
解
一个水样用两种方法测定,测量数据是成对数据。其差 d i = x i − y i 列在上表数据的右侧,若 d i 的样本均值 d ˉ 与样本标准差 s d 分别可算得
d ˉ = 0.4138 , s d = 0.321.
现在要检验的假设为
H 0 : μ = 0 vs H 1 : μ = 0.
使用的检验统计量及其值为
t 1 = s d / 8 d ˉ = 0.321/ 8 0.4138 = 0.1135 0.4138 = 3.646.
对给定的显著性水平 α = 0.05 ,其拒绝域为 { ∣ t 1 ∣ ≥ t 0.975 ( 7 )} ,查表知 t 0.975 ( 7 ) = 2.3646 。由于 ∣ t 1 ∣ > 2.3646 ,故应拒绝原假设,即两种测定污水中氯气含量的方法间有显著差别。检验的 p 值为 0.0082 。
讨论:若对此问题用两样本 t 检验,所得结果完全不同,具体如下。设
X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) ,
X 与 Y 独立,则要检验的假设是
H 0 : μ 1 = μ 2 vs H 1 : μ 1 = μ 2 .
检验统计量是
t 2 = ( s x 2 + s y 2 ) /8 x ˉ − y ˉ .
由两个样本可计算得样本均值与样本方差,它们是
x ˉ = 5.435 , y ˉ = 5.0213 , s x 2 = 17.013 , s y 2 = 17.811.
代入 t 统计量可得
t 2 = ( 17.013 + 17.811 ) /8 5.435 − 5.0213 = 2.0864 0.4137 = 0.198.
对给定的显著性水平 α = 0.05 ,查表得 t 0.975 ( 14 ) = 2.1448 。由于 ∣ t 2 ∣ < 2.1448 ,故不应拒绝原假设,结论与前不一样。
在两个 t 检验统计量 t 1 与 t 2 中,分子是相同的,分母不同,而且相差很大,t 2 的分母为 2.0864 ,t 1 的分母仅为 0.1135 。这是因为 8 个水样的氯气含量之间有较大差别,t 2 的分母将这种差别看作误差归入到标准差中,而 t 1 的分母已不包含水样之间的差异,这就是为什么成对数据用 t 1 统计量更为合理的理由。
一工厂的两个化验室每天同时从工厂的冷却水中取样,测量水中的含气量(1 0 − 6 )一次,下面是 7 天的记录:
室甲: 室乙: 1.15 1.00 1.86 1.90 0.75 0.90 1.82 1.80 1.14 1.20 1.65 1.70 1.90 1.95
设每对数据的差 d i = x i − y i ( i = 1 , 2 , … , 7 ) 来自正态总体,问两化验室测定结果之间有无显著差异(α = 0.01 )?
解
这是成对数据的比较问题,7 个 d i 值为
0.15 , − 0.04 , − 0.15 , 0.02 , − 0.06 , − 0.05 , − 0.05.
不难算出 n = 7 , d ˉ = − 0.0257 , s d = 0.0922 ,于是
t = 0.0922/ 7 − 0.0257 = − 0.7375.
检验的 p 值为 0.4887 。不能认为两化验室测定结果之间有显著差异。
为比较正常成年男女所含红血球(单位:1 0 4 / mm 3 )的差异,对某地区 156 名成年男性进行测量,其红血球的样本均值为 465.13 ,样本方差为 54.8 0 2 ;对该地区 74 名成年女性进行测量,其红血球的样本均值为 422.16 ,样本方差为 49.2 0 2 。试检验:该地区正常成年男女所含红血球的平均值是否有差异(取 α = 0.05 )?
解
设该地区正常成年男女所含红血球数分别记为 X 和 Y ,并设
X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) .
首先要检验两正态总体方差是否相等。为此先检验
H 0 : σ 1 = σ 2 vs H 1 : σ 1 = σ 2 .
为此使用 F 检验,则检验的拒绝域为
W = {( x , y ) : F ≥ F 1 − α /2 ( n − 1 , m − 1 ) 或 F ≤ F α /2 ( n − 1 , m − 1 )} .
本题中,n = 156 , m = 74 ,并已知
s x 2 = 54. 8 2 , s y 2 = 49. 2 2 .
由此可知检验统计量 F 的取值为
F = s y 2 s x 2 = 1.24 ,
而
F 0.975 ( 155 , 73 ) ≈ 1.5 , F 0.025 ( 155 , 73 ) ≈ 0.68.
因此观察样本不在拒绝域,即不能否定 H 0 : σ 1 = σ 2 。
从而我们可在 σ 1 = σ 2 的条件下进一步检验
H 0 : μ 1 = μ 2 vs H 1 : μ 1 = μ 2 .
可用 t 检验,则检验的拒绝域为
W = { ∣ t ∣ ≥ t 1 − α /2 ( n + m − 2 )} .
直接计算得
t = 5.96 ,
而
t 0.975 ( 228 ) ≈ 1.96 < 5.96.
因此应拒绝原假设,即该地区正常成年男女所含红血球的均值有显著性差异。
由于此问题中样本量很大,故采用渐近正态分布作检验也是合适的,结果是一致的。
为比较不同季节出生的女婴体重的方差,从某年 12 月和 6 月出生的女婴中分别随机抽取 6 名及 10 名,测其体重(单位:g )如下:
12 月 3520 2960 2560 2960 3260 3960
6 月 3220 3220 3760 3000 2920 3740 3060 3080 2940 3060
假定新生女婴体重服从正态分布,问新生女婴体重的方差是否是冬季的比夏季的小(取 α = 0.05 )?
解
设冬、夏两季新生女婴的体重分别服从
N ( μ 1 , σ 1 2 ) , N ( μ 2 , σ 2 2 ) ,
考虑检验问题
H 0 : σ 1 2 = σ 2 2 vs H 1 : σ 1 2 < σ 2 2 .
因而,考虑检验统计量
F = s 2 2 s 1 2 ∼ F ( n 1 − 1 , n 2 − 1 ) ,
其中
n 1 = 6 , n 2 = 10 , α = 0.05 ,
s 1 2 = 241666.667 , s 2 2 = 93955.556.
又
F α ( n 1 − 1 , n 2 − 1 ) = F 0.05 ( 5 , 9 ) = F 0.95 ( 9 , 5 ) 1 = 4.77 1 = 0.2096 ,
而
F = 93955.556 241666.667 = 2.572 > 0.2096.
所以不拒绝原假设,不能认为女婴体重的方差是“冬季的比夏季小”。
已知维尼纶纤度在正常条件下服从正态分布,且标准差为 0.048 。从某天产品中抽取 5 根纤维,测得其纤度为
1.32 1.55 1.36 1.40 1.44
问这一天纤度的总体标准差是否正常(取 α = 0.05 )?
解
这是一个关于正态总体方差的双侧检验问题,待检验的原假设和备择假设分别为
H 0 : σ 2 = σ 0 2 = 0.04 8 2 vs H 1 : σ 2 = σ 0 2 = 0.04 8 2 .
此处 n = 5 ,若取显著性水平 α = 0.05 ,查表知
χ 0.025 2 ( 4 ) = 0.4844 , χ 0.975 2 ( 4 ) = 11.1433 ,
故拒绝域为
W = { χ 2 ≤ 0.4844 或 χ 2 ≥ 11.1433 } .
由样本数据可计算得到
χ 2 = σ 0 2 ( n − 1 ) s 2 = 0.04 8 2 0.03112 = 13.5069 > 11.1433 ,
因此拒绝 H 0 ,认为这一天纤度的总体标准差不正常。
讨论:在此种拒绝原假设的场合,人们还经常会问总体标准差 σ 究竟是大于 0.048 还是小于 0.048 呢?回答这个问题要进一步考察其拒绝域,事实上,此处拒绝域
W = W 1 ∪ W 2
由两部分组成:
W 1 = { χ 2 ≤ χ 0.025 2 ( 4 )} = { χ 2 ≤ 0.4844 } ,
它对应 σ < 0.048 ;
W 2 = { χ 2 ≥ χ 0.975 2 ( 4 )} = { χ 2 ≥ 11.1433 } ,
它对应 σ > 0.048 。
如今样本观测值落入 W 2 ,可以认为当天的总体标准差 σ > 0.048 。
在实际中,产品质量的标准差通常不大可能自然减小的,人们要预防的是标准差变大从而使得产品质量下降,因此,对本题的情况,一般也可建立如下的检验问题:
H 0 : σ 2 ≤ 0.04 8 2 vs H 1 : σ 2 > 0.04 8 2 .
若此,则检验统计量不变,而检验的拒绝域变为
W ′ = { χ 2 ≥ χ 1 − α 2 ( 4 )} .
若仍取显著性水平为 0.05 ,则查表知
χ 0.95 2 ( 4 ) = 9.4877 ,
由于观测值大于临界值,仍然拒绝原假设,认为 σ > 0.048 。
某电工器材厂生产一种保险丝,测量其熔化时间,依通常情况方差为 400 ,今从
某天产品中抽取容量为 25 的样本,测量其熔化时间并计算得
x ˉ = 62.24 , s 2 = 404.77 ,
问这天保险丝熔化时间的分散度与通常有无显著差异(取 α = 0.05 ,假定熔化时间服从正态分布)?
解
本题可归结为关于正态总体方差的双侧检验问题
H 0 : σ 2 = 400 vs H 1 : σ 2 = 400.
当 α = 0.05 时,查表知
χ 0.025 2 ( 24 ) = 12.4012 , χ 0.975 2 ( 24 ) = 39.3641 ,
因此拒绝域为
{ χ 2 ≤ 12.4012 或 χ 2 ≥ 39.3641 } .
此外,检验统计量为
χ 2 = 400 24 × 404.77 = 24.2862.
该值没有落入拒绝域内,从而在显著性水平 α = 0.05 下可以认为该天保险丝熔化时间的方差与通常无显著差异。
某种导线的质量标准要求其电阻的标准差不得超过 0.005 Ω 。今在一批导线中随机抽取样品 9 根,测得样本标准差为 s = 0.007 Ω ,设总体为正态分布。问在显著性水平 α = 0.05 下能否认为这批导线的标准差显著地偏大?
解
本题是单侧检验问题,待检验的原假设和备择假设分别为
H 0 : σ ≤ 0.005 vs H 1 : σ > 0.005.
若取 α = 0.05 ,查表知
χ 0.95 2 ( 8 ) = 15.5073 ,
拒绝域为
W = { χ 2 ≥ 15.5073 } ,
由所给条件可得出检验统计量为
χ 2 = 0.00 5 2 8 × 0.00 7 2 = 15.68 > 15.5073.
因此拒绝 H 0 ,在显著性水平 α = 0.05 下认为这批导线的标准差显著地偏大。
两台车床生产同一种滚珠,滚珠直径服从正态分布。从中分别抽取 8 个和 9 个产品,测得其直径为
甲车床: 15.0 , 14.5 , 15.2 , 15.5 , 14.8 , 15.1 , 15.2 , 14.8 ,
乙车床: 15.2 , 15.0 , 14.8 , 15.2 , 15.0 , 15.0 , 14.8 , 15.1 , 14.8.
比较两台车床生产的滚珠直径的方差是否有显著差异(取 α = 0.05 )。
解
这是一个关于两正态总体方差的一致性检验问题,设 X 为甲车床生产的滚珠直径,Y 为乙车床生产的滚珠直径,原假设为
σ 1 2 = σ 2 2 ,
备择假设为
σ 1 2 = σ 2 2 .
此处 m = 8 , n = 9 ,由样本数据计算得
s x 2 = 0.0955 , s y 2 = 0.0261 ,
于是
F = s y 2 s x 2 = 3.6590.
若取显著性水平 α = 0.05 ,查表有
F 0.025 ( 7 , 8 ) = F 0.975 ( 8 , 7 ) 1 = 4.90 1 = 0.2041 , F 0.975 ( 7 , 8 ) = 4.53 ,
从而拒绝域为
W = { F ≥ 4.53 或 F ≤ 0.2041 } .
由于检验统计量的值不在拒绝域内,因此认为两台车床生产的滚珠直径的方差没有显著差异。
有两台机器生产金属部件,分别在两台机器所生产的部件中各取一容量为 m = 14 和 n = 12 的样本,测得部件质量的样本方差分别为 s 1 2 = 15.46 , s 2 2 = 9.66 ,设两样本相互独立,试在显著性水平 α = 0.05 下检验假设
H 0 : σ 1 2 = σ 2 2 vs H 1 : σ 1 2 > σ 2 2 .
解
这是一个关于两正态总体方差的单侧检验问题,由所给条件算得
F = s 2 2 s 1 2 = 1.6004.
若取显著性水平 α = 0.05 ,可求得临界值为
F 0.95 ( 13 , 11 ) = 2.7614
(可用线性插值法或用统计软件求出此值,如在 Matlab 中输入 finv(0.95,13,11) 即可给出此值),拒绝域为
{ F ≥ 2.7614 } ,
此处,检验统计量未落入拒绝域中,因此接受原假设。
测得两批电子器件的样品的电阻(单位:Ω )为
A 批 ( x ) : 0.140 , 0.138 , 0.143 , 0.142 , 0.144 , 0.137 ,
B 批 ( y ) : 0.135 , 0.140 , 0.142 , 0.136 , 0.138 , 0.140.
设这两批器材的电阻值分别服从分布 N ( μ 1 , σ 1 2 ) , N ( μ 2 , σ 2 2 ) ,且两样本独立。
试检验两个总体的方差是否相等(取 α = 0.05 );
试检验两个总体的均值是否相等(取 α = 0.05 )。
解
(1) 对于检验两总体方差是否一致,应使用 F 检验,此处,由样本数据计算可得到
x ˉ = 0.1407 , y ˉ = 0.1385 , s x = 0.0028 , s y = 0.0027.
若取 α = 0.05 ,则
F 0.975 ( 5 , 5 ) = 7.15 , F 0.025 ( 5 , 5 ) = F 0.975 ( 5 , 5 ) 1 = 0.1399 ,
其拒绝域为
W = { F ≤ 0.1399 或 F ≥ 7.15 } ,
而
F = s y 2 s x 2 = 0.002 7 2 0.002 8 2 = 1.0754.
由于 F 值没有落入拒绝域内,可以认为两个总体的方差相等。
(2) 因为在(1)中已经接受了两总体方差一致,从而在检验均值情况时,可以用两样本 t 检验,当 α = 0.05 时,
t 0.975 ( 10 ) = 2.2281 ,
拒绝域为
{ ∣ t ∣ ≥ 2.2281 } .
这里有
s w = ( 6 + 6 − 2 5 × 0.002 8 2 + 5 × 0.002 7 2 ) 1/2 = 0.00275 ,
t = 0.00275 6 1 + 6 1 0.1407 − 0.1385 = 1.3856 < 2.2281 ,
故接受 H 0 ,可以认为两个总体的均值相等。
某厂使用两种不同的原料生产同一类型产品,随机选取使用原料 A 生产的样品 22 件,测得平均质量为 2.36 kg ,样本标准差为 0.57 kg 。取使用原料 B 生产的样品 24 件,测得平均质量为 2.55 kg ,样本标准差为 0.48 kg 。设产品质量服从正态分布,两个样本独立,问能否认为使用原料 B 生产的产品平均质量较使用原料 A 显著大(取 α = 0.05 )?
解
设 X 为使用原料 A 生产的产品质量,Y 为使用原料 B 生产的产品质量,则
X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) .
由问题的陈述,我们看到这是关于两总体均值的检验问题,并且为了能够显著地认为使用原料 B 生产的产品平均质量较使用原料 A 大,必须将该陈述作备择假设,只有当拒绝与之相对应的原假设时,才能说明使用原料 B 生产的产品平均质量较使用原料 A 显著大,因此,可建立如下假设检验问题
H 0 : μ 2 ≤ μ 1 vs H 1 : μ 2 > μ 1 .
为完成此假设检验,应先对两总体的方差是否相等进行检验。若接受 σ 1 2 = σ 2 2 ,可以使用两样本 t 检验;若 σ 1 2 = σ 2 2 不成立,则可以用近似 t 检验。
对于检验问题
H 00 : σ 1 2 = σ 2 2 vs H 01 : σ 1 2 = σ 2 2 ,
可计算如下检验统计量
F = s y 2 s x 2 = 0.4 8 2 0.5 7 2 = 1.4102.
若取 α = 0.05 ,则
F 0.975 ( 21 , 23 ) = 2.3404 , F 0.025 ( 21 , 23 ) = F 0.975 ( 23 , 21 ) 1 = 0.4201 ,
拒绝域为
W = { F ≤ 0.4201 或 F ≥ 2.3404 } ,
观测值未落入拒绝域内,因此可以认为两个总体的方差相等。
下面我们在方差相等的假定下检验上述关于均值的假设,此处可使用两样本 t 检验,若取 α = 0.05 ,则
t 0.95 ( 44 ) ≈ u 0.95 = 1.645 ,
故拒绝域为
W = { t ≥ 1.645 } ,
由所给条件,计算得
s w = 21 + 23 21 × 0.5 7 2 + 23 × 0.4 8 2 = 0.5249 ,
t = 0.5249 22 1 + 24 1 2.55 − 2.36 = 1.2264.
由于 1.2264 < 1.645 ,因此在显著性水平 α = 0.05 时,应接受原假设 H 0 : μ 2 ≤ μ 1 ,即使用原料 B 生产的产品平均质量没有显著地超过使用原料 A 生产的产品平均质量。
讨论:若改变检验问题的一对假设为
H 0 ′ : μ 2 ≥ μ 1 vs H 1 ′ : μ 2 < μ 1 ,
则其拒绝域为
W ′ = { t ≤ − 1.645 } ,
如今 t = 1.2264 > − 1.645 ,故应接受原假设 H 0 ′ : μ 2 ≥ μ 1 。
把两对假设联合起来考察可以看出,既接受原假设 H 0 : μ 2 ≤ μ 1 ,也接受原假设 H 0 ′ : μ 2 ≥ μ 1 ,造成这一现象的原因是两对假设检验问题的接受域有共同部分(见图 7.3),而统计量的值正好落在这个公共区域内。
\FigureSevenThree
这一现象并不是很少出现的,在其他检验问题中也可能会出现,只要检验统计量的取值落入 W ∩ W ′ ,这说明在假设检验中“不拒绝原假设”的含义是丰富的,处理要慎重。
在 20 世纪 70 年代后期人们发现,酿啤酒时,在麦芽干燥过程中会形成致癌物质亚硝基二甲胺(NDMA),20 世纪 80 年代初期开发了一种新的麦芽干燥过程,下面为老、新两种过程中形成的 NDMA 含量(以 10 亿份中的份数计):
老过程: 6 , 4 , 5 , 5 , 6 , 5 , 5 , 6 , 4 , 6 , 7 , 4 ,
新过程: 2 , 1 , 2 , 2 , 1 , 0 , 3 , 2 , 1 , 0 , 1 , 3.
设两样本分别来自不同的正态总体,并假定两总体方差相等,两样本独立,分别以 μ 1 , μ 2 表示老、新过程的总体均值,试检验(α = 0.05 ):
H 0 : μ 1 − μ 2 = 2 vs H 1 : μ 1 − μ 2 > 2.
解
以 x , y 分别表示老、新两种过程下的观测值,x ˉ , y ˉ 分别为其样本均值,s x 2 , s y 2 分别为其样本方差,则 μ 1 − μ 2 的无偏估计为 x ˉ − y ˉ ,在原假设
H 0 : μ 1 − μ 2 = 2
成立下有
x ˉ − y ˉ − 2 ∼ N ( 0 , 6 σ 2 ) ,
其中 σ 2 为两个总体的共同方差,又
σ 2 22 s w 2 = σ 2 11 s x 2 + σ 2 11 s y 2 ∼ χ 2 ( 22 ) ,
故在原假设成立下,
t = s w 6 ( x ˉ − y ˉ − 2 ) ∼ t ( 22 ) .
检验拒绝域为
W = { t ≥ t 1 − α ( 22 )} ,
现取 α = 0.05 ,查表知
t 0.95 ( 22 ) = 1.7171 ,
从而拒绝域为
W = { t ≥ 1.7171 } .
现由样本观测值可算得
x ˉ = 5.25 , y ˉ = 1.5 , i = 1 ∑ 12 ( x i − x ˉ ) 2 = 10.25 , i = 1 ∑ 12 ( y i − y ˉ ) 2 = 11 ,
s w = 22 10.25 + 11 = 0.9828.
从而检验统计量的值为
t = 0.9828 6 ( 5.25 − 1.5 − 2 ) = 4.3616.
由于观测值落入拒绝域,故拒绝原假设,即老、新方法在 NDMA 含量的差显著大于 2 。
设总体 X ∼ N ( μ 1 , σ 2 ) ,总体 Y ∼ N ( μ 2 , σ 2 ) ,从总体 X 抽取样本 x 1 , x 2 , … , x m ,从总体 Y 抽取样本 y 1 , y 2 , … , y n ,两样本独立,考虑如下假设检验问题
H 0 : c μ 1 + d μ 2 = δ vs H 1 : c μ 1 + d μ 2 = δ ,
其中 c = 0 , d = 0 , δ 都是已知常数,求检验统计量与拒绝域。
解
以 x ˉ , y ˉ 分别表示来自两个总体的样本均值,s x 2 , s y 2 分别为其样本方差,记
s w 2 = m + n − 2 ( m − 1 ) s x 2 + ( n − 1 ) s y 2 ,
由所给条件,有
x ˉ ∼ N ( μ 1 , m σ 2 ) , y ˉ ∼ N ( μ 2 , n σ 2 ) ,
由此
c x ˉ + d y ˉ ∼ N ( c μ 1 + d μ 2 , ( m c 2 + n d 2 ) σ 2 ) .
在原假设成立时,
u = σ m c 2 + n d 2 c x ˉ + d y ˉ − δ ∼ N ( 0 , 1 ) .
又
σ 2 ( m − 1 ) s x 2 ∼ χ 2 ( m − 1 ) , σ 2 ( n − 1 ) s y 2 ∼ χ 2 ( n − 1 ) ,
且二者独立,故
σ 2 ( m + n − 2 ) s w 2 ∼ χ 2 ( m + n − 2 ) .
由此,在原假设成立时,检验统计量
t = s w m c 2 + n d 2 c x ˉ + d y ˉ − δ = σ 2 ( m + n − 2 ) ( m + n − 2 ) s w 2 u ∼ t ( m + n − 2 ) ,
若取显著性水平为 α ,检验拒绝域为
W = { ∣ t ∣ ≥ t 1 − α /2 ( m + n − 2 )} .
设 X ∼ N ( μ 1 , σ 1 2 ) ,Y ∼ N ( μ 2 , σ 2 2 ) ,从总体 X 与总体 Y 各取容量分别为 7 和 5 的样本,具体如下:
X : 81 , 165 , 97 , 134 , 92 , 87 , 14 ,
Y : 102 , 86 , 98 , 109 , 92.
设两样本独立,取 α = 0.05 ,
检验假设
H 0 : σ 1 2 = 10 σ 2 2 vs H 1 : σ 1 2 = 10 σ 2 2 ;
利用(1)的结果,检验
H 0 : μ 1 − μ 2 = 10 vs H 1 : μ 1 − μ 2 = 10.
解
以 x ˉ , y ˉ 分别表示来自两个总体的样本均值,s x 2 , s y 2 分别为其样本方差。m , n 分别为两个样本量,此处 m = 7 , n = 5 。
(1) 由于
σ 1 2 ( m − 1 ) s x 2 ∼ χ 2 ( m − 1 ) , σ 2 2 ( n − 1 ) s y 2 ∼ χ 2 ( n − 1 ) ,
且二者独立,故对假设检验问题
H 0 : σ 1 2 = 10 σ 2 2 vs H 1 : σ 1 2 = 10 σ 2 2 ,
在原假设成立下,检验统计量
F = 10 s y 2 s x 2 = s y 2 / σ 2 2 s x 2 / σ 1 2 ∼ F ( m − 1 , n − 1 ) ,
拒绝域为
W = { F ≤ F α /2 ( m − 1 , n − 1 ) 或 F ≥ F 1 − α /2 ( m − 1 , n − 1 )} .
由于 m = 7 , n = 5 , α = 0.05 ,查表知
F 0.975 ( 6 , 4 ) = 9.20 , F 0.025 ( 6 , 4 ) = F 0.975 ( 4 , 6 ) 1 = 6.23 1 = 0.1605 ,
故检验拒绝域为
W = { F ≤ 0.1605 或 F ≥ 9.20 } .
此处由样本数据算得
s x 2 = 2208.57 , s y 2 = 78.80 ,
从而
F = 10 × 78.80 2208.57 = 2.8028.
由于检验统计量值未落入拒绝域,故接受原假设,认为
σ 1 2 = 10 σ 2 2 .
(2) 由(1)可假设
σ 1 2 = 10 σ 2 2 = 10 σ 2 .
在此条件下,
10 σ 2 ( m − 1 ) s x 2 + 10 ( n − 1 ) s y 2 = σ 1 2 ( m − 1 ) s x 2 + σ 2 2 ( n − 1 ) s y 2 ∼ χ 2 ( m + n − 2 ) .
又
x ˉ − y ˉ ∼ N ( μ 1 − μ 2 , m σ 1 2 + n σ 2 2 ) = N ( μ 1 − μ 2 , ( m 10 + n 1 ) σ 2 ) ,
故在 μ 1 − μ 2 = 10 时,检验统计量
t = m 10 + n 1 x ˉ − y ˉ − 10 ⋅ ( m − 1 ) s x 2 + 10 ( n − 1 ) s y 2 10 ( m + n − 2 ) ∼ t ( m + n − 2 ) .
此处 m = 7 , n = 5 ;若取 α = 0.05 ,查表知
t 0.975 ( 10 ) = 2.2281 ,
检验拒绝域为
W = { ∣ t ∣ ≥ 2.2281 } .
现由样本可计算得到
t = 7 10 + 5 1 95.7 − 97.4 − 10 ⋅ 6 × 2208.57 + 10 × 4 × 78.80 10 × 10 = − 0.7158.
现检验统计量值未落入拒绝域,故接受原假设。
评论
支持 Markdown 和 LaTeX 数学公式。