§8.1 方差分析

依赖于

  • 无显式依赖

被以下题目直接调用

正文部分

§8.1 方差分析

  1. 单因子方差分析

(1) 问题与数据

设因子有 个水平,记为 ,在每一水平下各做 次独立重复试验,若记第 个水平下第 次重复的试验结果为 ,所有试验的结果可列表如下:

对这个试验要研究的问题是: 个水平 间有无显著差异。

(2) 基本假定

: 正态性:第 个水平下的数据 是来自正态总体 的一个样本,

: 等方差性: 个方差相同,即

: 独立性:诸数据 都相互独立。

在这三个基本假定下,要检验的假设是

方差分析就是在上述三个基本假定下,对若干个正态均值是否相等作检验。

(3) 平方和分解式

若记

上述诸平方和分别为

称为总偏差平方和,其自由度

称为组间偏差平方和或因子 的偏差平方和,其自由度

称为组内偏差平方和或误差偏差平方和,其自由度

注:数据 的平移

不会改变其平方和的值。用此性质可简化计算。

(4) 方差分析表

(5) 判断

成立下,

对给定的显著性水平 ,其拒绝域为

其中 可从附表 中查得。

则认为因子 显著,即诸正态均值间有显著差异;

则说明因子 不显著,即接受原假设

给出检验的 值是更常用的,若以 记服从 的随机变量, 为统计量, 的观测值为 ,则

可用软件计算,如在 MATLAB 中使用如下命令:

  1. 数据结构式及其参数估计

(1) 数据结构式

其中 为总均值, 为第 个水平的效应,且

为试验误差,所有 可作为来自 的一个样本,在上述数据结构式下,

要检验的假设可改写为

(2) 点估计

  1. 总均值 的估计
  1. 各水平均值 的估计
  1. 主效应 的估计
  1. 误差方差 的估计

(3) 置信区间(

  1. 置信区间为
  1. 单因子试验的统计分析可给出如下三个结果:
  2. 因子 是否显著;
  3. 试验误差方差 的估计;
  4. 诸水平均值 的点估计与区间估计(此项在因子 不显著时无需进行)。
  5. 重复数不等情形下的方差分析

(1) 数据略有不同

设因子 个水平 ,并且第 个水平 下重复进行 次试验,获得如下数据:

(2) 基本假定、平方和分解、方差分析及判断准则都和前面一样,只是因子 的平方和 的计算公式略有不同:记

(3) 数据结构式及其参数估计基本同前,但要注意以下两点:

  1. 总均值
  1. 主效应的约束条件为

习题与解答 8.1

习题 8.1-1

在一个单因子试验中,因子 有三个水平,每个水平下各重复 次,具体数据如下:

试计算误差平方和 、因子 的平方和 与总平方和 ,并指出它们各自的自由度。

此处因子水平数 ,每个水平下的重复次数 ,总试验次数为

首先,算出每个水平下的数据和以及总数据和:

误差平方和 由三个平方和组成:

于是

注:在所有的计算公式中可以用数据和也可以用数据均值,但在实际计算中应尽可能用和而不用均值,这样可避免不必要的误差(如四舍五入造成的误差等)。

习题 8.1-2

在一个单因子试验中,因子 个水平,每个水平下重复次数分别为 。那么误差平方和、 的平方和及总平方和的自由度各是多少?

此处因子水平数 ,总试验的次数

因而有

习题 8.1-3

在单因子试验中,因子 个水平,每个水平下各重复 次试验,现已求得每个水平下试验结果的样本标准差分别为 ,则其误差平方和为多少?误差的方差 的估计值是多少?

此处因子水平数 ,每个水平下的试验次数 ,误差平方和 由四个平方和组成,它们分别为

于是

其自由度为

误差方差 的估计值为

习题 8.1-4

在单因子方差分析中,因子 个水平,每个水平均各做 次重复试验。请完成下列方差分析表,并在显著性水平 下对因子 是否显著作出检验:

补充的方差分析表如下:

对于给定的显著性水平 ,查表得

故拒绝域为

由于

因而认为因子 是显著的。此外,

习题 8.1-5

种安眠药在兔子身上进行试验,挑选 只健康兔子,随机把它们均分为 组,每组各服一种安眠药,安眠时间(单位:)如下:

在显著性水平 下对其进行方差分析,可以得到什么结果?

这是一个单因子方差分析的问题。根据样本数据有

于是

方差分析表为

在显著性水平 下,查表得

由于 ,故认为因子 (安眠药)是显著的,即四种安眠药对兔子的安眠作用有明显差别。检验的 值为

习题 8.1-6

为研究单因子 中咖啡因剂量对人的影响,随机选择 名体质大致相同的健康男大学生进行手指叩击试验。咖啡因有三个水平:

每个水平下各安排 人,试验结果如下:

对于上述数据进行方差分析,从中可得到什么结论?

对数据同时减去 不改变方差分析结果。将计算结果列入下表:

于是

方差分析表为

时,。由于 ,故认为因子 (咖啡因剂量)是显著的,即三种不同剂量对人的作用有明显差别。检验的 值为

习题 8.1-7

某粮食加工厂试验三种不同的储藏方法对粮食含水率有无显著影响。现取一批粮食分成若干份,分别用三种不同的方法储藏,过一段时间后测得的含水率(单位:)如下:

  1. 假定各种方法储藏的粮食含水率服从正态分布,且方差相等,试在 下检验这三种方法对含水率的平均值有无显著影响;
  2. 对每种方法的平均含水率给出置信水平为 的置信区间。

(1) 这是一个单因子方差分析问题。由数据计算如下:

于是方差分析表为

在显著性水平 下,查表得 。由于 ,故认为因子 (储藏方法)显著,即三种不同储藏方法对粮食含水率有显著影响。检验的 值为

(2) 各水平均值估计分别为

误差方差的无偏估计为

若取 ,则

于是三种方法平均含水率的 置信区间分别为

习题 8.1-8

在人员推销中有五种方法,某大公司想比较这五种方法有无显著的效果差异。设计一项实验:从应聘的且无推销经验的人员中随机挑选一部分人,将他们随机分为五组,每组用一种推销方法进行培训。培训相同时间后观察他们在一个月内的推销额(单位:千元),数据如下:

  1. 假定数据满足进行方差分析的条件,对数据进行分析,在 下这五种方法在平均月推销额上有无显著差异;
  2. 哪种推销方法的效果最好?试对该种方法一个月的平均推销额求置信水平为 的置信区间。

(1) 由数据计算得

方差分析表为

在显著性水平 下,查表得 。由于 ,故认为五种不同推销方法在平均月推销额上有显著差异。检验的 值为

(2) 各种方法平均月推销额的估计值分别为

从点估计看,第 种方法最好。又有

查表得

于是第 种方法下均值的 置信区间为

习题 8.1-9

某组装产品内有部分噪声很大的次品,产生次品的原因怀疑是由于这种组装品某个部位的间隙过大引起的。为检验这一认识是否正确,特从正品 和次品 中各抽出 个,对其间隙进行测量,数据(单位:)如下:

在正态分布假设下,请对 中间隙的均值是否存在显著差异进行检验(取 )。

这是单因子二水平等重复试验,其均值比较可用两种方法。

解法一 方差分析法

先计算

再得

方差分析表为

时,。由于 ,故因子 显著,即正品与次品该部位的平均间隙有显著差异。

解法二 双样本 检验

在正态总体方差相等的条件下,检验统计量为

其中

由样本可算得

对给定显著性水平 ,拒绝域为

查表得

由于 ,故应拒绝两均值相等的假设,此结论与方差分析相同。这并非偶然,因为自由度为 变量的平方服从 分布,本题中

习题 8.1-10

某乳制品公司有四个车间生产同一种酸乳酪,为考察四个车间产品中脂肪含量是否一致,特在每个车间生产的产品中各抽取 个样品送往实验室测定,结果(单位:)如下:

试比较各车间生产的酸乳酪中脂肪含量均值有无显著差异(取 )。

为简化运算,令

于是

方差分析表为

查表得 。由于 ,故因子 显著,即四个车间生产的酸乳酪中脂肪含量均值有显著差异。

由逆变换

可知