§7.1 假设检验的基本思想与概念

依赖于

  • 无显式依赖

被以下题目直接调用

正文部分

§7.1 假设检验的基本思想与概念

1. 假设

  1. 参数空间 的非空子集或有关参数 的命题,称为统计假设,简称假设;
  2. 原假设,根据需要而设立的假设,常记为
  3. 备择假设,在原假设被拒绝后而采用(接受)的假设,常记为

注:要求 ,即原假设 与备择假设 不含公共参数。若假设 (或 )只含一个点,则称该假设是简单假设,否则称为复杂假设。

2. 检验 对原假设 作出是否拒绝 的判断的法则称为检验法则,简称检验。检验有两个结果:

  1. “原假设不正确”,称为拒绝原假设,或称检验显著;
  2. “原假设正确”,称为接受(保留)原假设,或称检验不显著。

统计假设检验的着力点不在于说明原假设正确,而在于说明原假设不正确,因为用一个样本去说明原假设正确是根据不足的,而用一个样本去推翻原假设却是合理的,因此统计学在讨论假设检验时着力点在于建立检验的拒绝域。

3. 检验问题

  1. 由原假设 和备择假设 组成一个需要作判断的问题称为检验问题;
  2. 参数假设检验问题,两个假设都是有关参数的命题组成的检验问题;
  3. 非参数假设检验问题,两个假设都是有关分布的命题组成的检验问题。

常用的参数假设检验问题有如下三个,其中 是已知常数:

其中 (1) 与 (2) 又称单侧检验问题,因为一个假设位于另一个假设的一侧;(3) 称为双侧检验问题,因为备择假设位于原假设的两侧。

4. 两类错误及其发生概率

  1. 原假设 正确,但被拒绝,这种判断错误称为第一类错误,其发生概率称为犯第一类错误的概率,或称拒真概率,常记为
  2. 原假设 不真,但被接受,这种判断错误称为第二类错误,其发生概率称为犯第二类错误的概率,或称取伪概率,常记为

5. 假设检验的基本步骤

  1. 用于对原假设 作出判断的统计量称为检验统计量;
  2. 使原假设被拒绝的样本观测值所在区域称为拒绝域,常用 表示;
  3. 一个拒绝域 唯一确定一个检验法则。
  1. 当样本 ,则拒绝
  2. 当样本 ,则接受

6. 势函数 设检验问题

的拒绝域为 ,则样本观测值 落在拒绝域 内的概率称为该检验的势函数,记为

由势函数 容易得到犯两类错误的概率

7. 水平为 的检验 对检验问题

若一个检验犯第一类错误的概率 不超过事先给定的显著性水平 ,即

则称该检验为显著性水平为 的显著性检验。

在实际使用中 不宜选得过小, 过小会导致 过大,应在适当控制 中制约 。最常用的选择是 ,有时也选用

8. 检验的 在一个假设检验问题中,利用样本观察值能够做出拒绝原假设的最小显著性水平称为该检验的 值,引入检验的 值的好处是:

  1. 它比较客观,避免了事先确定显著性水平;
  2. 由检验的 值与人们心目中的显著性水平 进行比较:
  3. ,则在显著性水平 下拒绝
  4. ,则在显著性水平 下接受
  5. 检验的 值的计算是复杂的,会涉及各种抽样分布。如今统计软件都有计算 值的功能,因此这对使用者反而方便,它不需要各用各种抽样分布的分位数表,而只需要观察计算机输出的 值多少就可以做出判断。

习题与解答 7.1

习题 7.1-1

是来自 的样本,考虑假设检验问题

若检验由拒绝域

确定。

(1) 当 时求检验犯两类错误的概率;

(2) 如果要使得检验犯第二类错误的概率 最小应取多少?

(3) 证明:当 时,

(1) 由定义知,犯第一类错误的概率为

这是因为在 成立下,。而犯第二类错误的概率为

这是因为在 成立下,

(2) 若使犯第二类错误的概率满足

查表得 ,由此给出

因而 最小应取 ,才能使检验犯第二类错误的概率

(3) 在样本量为 时,检验犯第一类错误的概率为

时,,即

检验犯第二类错误的概率为

时,,即

注:从这个例子可以看出,要使得 都趋于 ,必须 才可实现,这一结论在一般场合仍成立,即要使得 同时很小,必须样本量 很大。由于样本量 很大在实际中常常是不可行的,故一般情况下人们不应要求 同时很小。

习题 7.1-2

是来自 - 总体 的样本,考虑检验问题

取拒绝域为

求该检验犯两类错误的概率。

,则 ,于是犯两类错误的概率分别为

讨论:这里 已经很小了,但 却很大。在样本量 固定下,若要使 更小则会导致 更大,为说明这一点,我们试着将拒绝域改变为

则这时检验犯两类错误的概率分别为

这一现象在一般场合也是对的,即在样本量 固定下,减小 必导致增大 ,减小 也必导致增大

习题 7.1-3

是来自正态总体 的样本,考虑检验问题

拒绝域取为

试求 使得检验的显著性水平为 ,并求该检验在 处犯第二类错误的概率。

为真的条件下,

因而由

也就是说

,所以当 时,检验的显著性水平为

该检验在 处犯第二类错误的概率为

习题 7.1-4

设总体为均匀分布 是样本,考虑检验问题

拒绝域取为

求检验犯第一类错误的最大值 ,若要使得该最大值 不超过 至少应取多大?

均匀分布 的最大次序统计量 的密度函数为

因而检验犯第一类错误的概率为

它是 的严格单调递减函数,故其最大值在 处达到,即

若要使得 ,则要求 ,这给出 ,即 至少为

习题 7.1-5

在假设检验问题中,若检验结果是接受原假设,则检验可能犯哪一类错误?若检验结果是拒绝原假设,则又有可能犯哪一类错误?

若检验结果是接受原假设,可能有两种情况:其一是原假设为真,此时检验是正确的,未犯错误;其二是原假设不真,此时检验结果就错了,这种错误是接受了不真的原假设,为第二类错误,故此时检验可能犯第二类错误。

若检验结果是拒绝原假设,也可能有两种情况:若原假设本身不真,检验是正确的;若原假设事实上是真的,则检验就犯了第一类错误,由此,在此种场合,检验可能会犯第一类错误。

习题 7.1-6

是来自 - 总体 的样本,考虑检验问题

取拒绝域为

  1. 时的势并由此画出势函数的图;
  2. 求在 时犯第二类错误的概率。

(1) 势函数的计算公式为

时的势计算如下表:

可用软件计算,如 MATLAB 语句为 1 - binocdf(6,20,p) + binocdf(1,20,p);势函数图如图 ,它在 处达到最小。

\FigureSevenOne

(2) 时,犯第二类错误的概率可采用如下 MATLAB 语句 binocdf(6,20,0.05) - binocdf(1,20,0.05) 计算给出 ,计算结果为

习题 7.1-7

设一个单一观测的样本 取自密度函数为 的总体,对 考虑统计假设

若其拒绝域的形式为 ,试确定一个 ,使得犯第一类、第二类错误的概率满足 为最小,并求其最小值。

,可得

因此,当 时, 为最小,并且此时的最小值为

习题 7.1-8

为取自泊松分布 的随机样本。

  1. 试给出单边假设检验问题

的显著性水平 的检验;

  1. 求此检验的势函数 时的值,并据此画出 的图像。

(1) 为检验统计量,其值愈大愈倾向于拒绝 ,所以,该检验问题的拒绝域形式为

注意到在 ,从而第一类错误概率为

时,

时,

因此,该检验问题的拒绝域为

(2) 势函数的计算公式为

时的势计算如下表:

势函数图如图

\FigureSevenTwo

习题 7.1-9

设正态总体的方差 已知,均值 只能取 )两值之一, 为总体的容量为 的样本均值,考虑检验问题

若检验拒绝域取为

则检验犯第二类错误的概率为

  1. 试验证:

从而在 给定时,有

  1. 固定,当 减小时 怎样变化?当 减小时 怎样变化?
  2. ,并且要求 时,样本容量 至少应为多少?

(1) 由于 ,故检验犯第二类错误的概率为

这给出

也即

从而在 给定时,有

(2) 固定,当 减小时, 就变大,由

为常量可知 就变小,从而导致 增大。

同理可知:当 减小时 增大。

这说明,在样本量给定时,犯两类错误的概率一个变小另一个就会变大,不可能找到一个使得犯两类错误的概率都变小的检验方案。

(3) 查表可得 ,于是

代入,有

至少应为

习题 7.1-10

假定 是连续随机变量, 的一次观测值。关于总体密度函数 有如下两个假设:

检验的判断规则是:若 则拒绝原假设 ,试求检验犯两类错误的概率。

由所给条件,犯第一类错误的概率为

犯第二类错误的概率为

这个检验犯两类错误的概率都不小,不是一个好的检验,主要原因是样本量太小。

习题 7.1-11

是来自 的一个样本,对如下的检验问题

已给出拒绝域

其中 为样本的最大次序统计量。

  1. 求此检验的势函数;
  2. 若要求检验犯第一类错误概率不超过 (即 ),如何确定
  3. 若在(2)的要求下进一步要求检验在 处犯第二类错误的概率不超过 (即 ), 至少要取多少?
  4. 如今 ,对此检验问题作出判断。

(1) 此检验的势函数为

可见,在 时,势函数 的严格增函数。

(2) 成立下,犯第一类错误的概率为 ,故由题意知,应有

由于 是增函数,故 处达到最大值,故只要使

即可实现,由此解出

譬如,在 时,;在 时,

(3) 在备择假设 成立下,犯第二类错误的概率为

现要求在 处有 ,即

若把(2)中的

代入,可得

可见,若取 即可使 处犯第二类错误的概率不超过

(4) 若样本量 ,则其拒绝域为

如今 ,故应接受原假设

习题 7.1-12

是来自泊松分布 的一个样本。

  1. 利用泊松分布的充分统计量对检验问题

在显著性水平 时给出其拒绝域;

  1. 证明(1)中的拒绝域也是检验问题

的显著性水平为 的显著性检验的拒绝域;

  1. 当样本量 较大时,由中心极限定理给出近似的拒绝域。

(1) 泊松分布 的充分统计量是 ,它是 的无偏估计。若原假设 成立,则 不应该很大,因此,当 较大时,就应该拒绝原假设 ,所以此检验的拒绝域应有形式

其中 应由给定的显著性水平 确定,即 由概率不等式

确定。由于原假设成立下 ,故

若令泊松分布 分位数为 ,则由 可得

所以在给定 时,该检验的拒绝域为

这里 的寻求还不是一件易事。

(2) 若将上述拒绝域作为此处检验问题的拒绝域,我们只需要证明确该检验的势函数是单调增的即可说明它也是(2)的显著性水平为 的显著性检验。此处该检验的势函数为

其中 为如下整数:

考察 的单调性,为此求其导数

所以势函数 的严格增函数。由此可知,在原假设 上, 处达到最大。

(3) 当样本量 较大时,由中心极限定理可得原假设成立时 的渐近分布

对给定的显著性水平 ,有

即拒绝域 中的临界值

譬如, 时,有

即当 时,若 ,则应拒绝原假设

习题 7.1-13

是来自瑞利(Rayleigh)分布 的一个样本,瑞利分布的密度函数为

  1. 求此分布的充分统计量;
  2. 利用充分统计量在给定显著性水平 下给出检验问题

的拒绝域;

  1. 在样本量较大时,利用中心极限定理给出近似拒绝域。

(1) 样本的联合密度函数为

由因子分解定理知, 的充分统计量是

(2) 注意到

由此可见

的无偏估计。当

较大时,拒绝原假设 是合理的。故

的拒绝域为

其中 由概率等式

确定。为了确定 ,需要充分统计量

的分布。

可以证明,当 时,

由此可得

或者

在原假设 成立下,有

利用 分布的分位数可确定临界值 。由等式

可得

分布的 分位数,可得

譬如,当 时,

所以

即当检验统计量

时,将拒绝原假设

(3)

可知

从而有

在原假设 成立下,有

这里

可看作 个相互独立同分布随机变量之和,故由中心极限定理知

从而有

故由等式

可得

为标准正态分布的 分位数,则有

,查表得 ,从而

这个结果与(2)定出的精确值较为接近。