§8.2 多重比较
依赖于
被以下题目直接调用
正文部分
§8.2 多重比较
- 问题 在单因子方差分析中,当因子 A 显著时,就要进一步比较多个水平均值中任意两个水平之间有无显著差异。这类同时比较多个均值的问题称为多重比较。
若因子 A 有 r 个水平,则同时检验
H0ij:μi=μj,1≤i<j≤r,
其拒绝域可写为
W=1≤i<j≤r⋃{∣yˉi−yˉj∣≥cij}.
给定显著性水平 α (0<α<1) 后,诸临界值 cij 由 P(W)=α 决定。
- 重复数相等场合的 T 法 当各水平试验次数相同时,诸临界值相同:
c=q1−α(r,fe)σ^/m,σ^=MSe,
其中 q1−α(r,fe) 是分布 q(r,fe) 的 1−α 分位数,可由附表 8 查得。
- 重复数不等场合的 S 法 当各水平试验次数不同时,临界值 cij 不同:
cij=(r−1)F1−α(r−1,fe)(mi1+mj1)σ^2,
其中 F1−α(r−1,fe) 为分布 F(r−1,fe) 的 1−α 分位数。
习题与解答 8.2
采用习题 8.1 第 7 题的数据,对三种储藏方法的平均含水率在 α=0.05 下作多重比较。
解
由于习题 8.1 第 7 题中已经指出储藏方法因子是显著的,因此可以作多重比较。各水平下试验次数相同,均为 5,可采用重复数相等场合的 T 法。若取 α=0.05,查表得
q1−0.05(3,12)=3.77,σ^=0.686=0.828,
所以
c=3.77×0.828/5=1.396.
比较各均值差得
∣yˉ1−yˉ2∣=∣7.98−6.4∣=1.58>1.396,
认为 μ1 与 μ2 有显著差别;
∣yˉ1−yˉ3∣=∣7.98−9.12∣=1.14<1.396,
认为 μ1 与 μ3 无显著差别;
∣yˉ2−yˉ3∣=∣6.4−9.12∣=2.72>1.396,
认为 μ2 与 μ3 有显著差别。
采用习题 8.1 第 8 题的数据,对五种推销方法在 α=0.05 下作多重比较。
解
这里各水平下试验次数相同,均为 7,在推销因子显著的前提下,采用重复数相等场合的 T 法。取 α=0.05,查表得
q1−0.05(5,30)=4.10,σ^=8.9912=2.9985,
所以
c=4.10×2.9985/7=4.6466.
于是
∣yˉ1−yˉ2∣=∣21.2857−24.5857∣=3.300<4.6466,
∣yˉ1−yˉ3∣=∣21.2857−20.5571∣=0.7286<4.6466,
∣yˉ1−yˉ4∣=∣21.2857−18.2286∣=3.0571<4.6466,
∣yˉ1−yˉ5∣=∣21.2857−27.9857∣=6.700>4.6466,
∣yˉ2−yˉ3∣=∣24.5857−20.5571∣=4.0286<4.6466,
∣yˉ2−yˉ4∣=∣24.5857−18.2286∣=6.3571>4.6466,
∣yˉ2−yˉ5∣=∣24.5857−27.9857∣=3.400<4.6466,
∣yˉ3−yˉ4∣=∣20.5571−18.2286∣=2.3285<4.6466,
∣yˉ3−yˉ5∣=∣20.5571−27.9857∣=7.4286>4.6466,
∣yˉ4−yˉ5∣=∣18.2286−27.9857∣=9.7571>4.6466.
因此,在显著性水平 0.05 下,第 1,3,4 种方法与第 5 种有显著差别,第 2 种与第 4 种也有显著差别,其余 6 组均无显著差别。
有七种人造纤维,每种抽 4 根测其强度,得每种纤维的平均强度及标准差如下:
iyˉisi16.30.8126.20.9236.71.2246.80.7456.50.8867.00.5877.11.05
假定各种纤维的强度服从等方差的正态分布。
- 试问七种纤维强度间有无显著差异(取 α=0.05);
- 若各种纤维强度间无显著差异,则给出平均强度的置信水平为 0.95 的置信区间;若有显著差异,请进一步在 α=0.05 下进行多重比较,并指出哪种纤维的平均强度最大,同时给出该种纤维平均强度的置信水平为 0.95 的置信区间。
解
(1) 这是一个方差分析问题。由题设可算得
yˉ=71(6.3+6.2+⋯+7.1)=6.6571.
于是
SA=4(6.32+6.22+⋯+7.12)−28×6.65712=2.8045,fA=6,
Se=3(0.812+0.922+⋯+1.052)=17.2554,fe=21.
从而
MSA=62.8045=0.4674,MSe=2117.2554=0.8217,
F=MSeMSA=0.82170.4674=0.5688.
检验的 p 值为
p=1−fcdf(0.5688,6,21)=0.7505.
故认为七种纤维强度间无显著差异。
(2) 由于方差分析结论不显著,应把全部数据看作来自同一个总体。这里
ST=SA+Se=2.8045+17.2554≈20.0608,
从而误差方差的无偏估计为
σ^2=28−1ST=2720.0608=0.743,σ^=0.743=0.862.
平均强度的估计为
μ^=yˉ=6.6571.
若取 α=0.05,则
t0.975(27)=2.0518,σ^t0.975(27)/28=0.3342,
于是平均强度的 0.95 置信区间为
[6.6571±0.3342]=[6.3229,6.9913].
一位经济学家对生产电子计算机设备的企业收集了在一年内生产力提高指数(用 0 到 100 内的数表示),并按过去三年间在科研和开发上的平均花费分为三类:
A1:花费少,A2:花费中等,A3:花费多.
生产力提高指数如下表所示:
水平A1A2A3生产力提高指数7.66.78.58.28.19.76.89.410.15.88.67.86.97.89.66.67.79.56.38.97.77.96.08.38.77.18.4
试列出方差分析表,并进行多重比较(取 α=0.05)。
解
由数据计算如下:
水平A1A2A3和mi9126n=27Ti61.997.655.2T=214.7Ti2/mi425.734793.813507.84i=1∑rmiTi2=1727.387∑j=1miyij2431.03800.12511.60i=1∑rj=1∑miyij2=1742.75
于是
ST=1742.75−27214.72=35.487,fT=26,
SA=1727.387−27214.72=20.124,fA=2,
Se=35.487−20.124=15.363,fe=24.
方差分析表为
来源因子 A误差 e总和 T平方和20.12415.36335.487自由度22426均方10.0620.64F 比15.72
若取 α=0.05,查表得 F0.95(2,24)=3.41。由于 F=15.72>3.41,故认为各水平间有显著差异。检验的 p 值为
p=1−fcdf(15.72,2,24)=4.3317×10−5.
由于各水平试验次数不等,可采用重复数不等场合的 S 法。此时
F0.95(2,24)=3.41,σ^2=0.64,
故
c12=2×3.41(91+121)×0.64=0.9213,
c13=2×3.41(91+61)×0.64=1.1011,
c23=2×3.41(121+61)×0.64=1.0446.
又因为
∣yˉ1−yˉ2∣=∣6.88−8.13∣=1.25>0.9213,
∣yˉ1−yˉ3∣=∣6.88−9.2∣=2.32>1.1011,
∣yˉ2−yˉ3∣=∣8.13−9.2∣=1.07>1.0446,
故在显著性水平 0.05 下,各个水平间均有显著差异,第 3 个水平(花费多)对生产力提高最有帮助。
某工厂为了研究本厂生产的垫片与国内外同类产品在耐磨性能上的差别,特选国外一家产品、国内两家产品与本厂产品进行磨损试验。试验数据用磨损率表示,它是愈小愈好,磨损率的计算公式为
γ=初始值初始值−300 小时后的值.
具体数据如下:
水平A1(国外产品)A2(国内甲厂产品)A3(国内乙厂产品)A4(本厂产品)T=513磨损率926242012192518142619191528221723271525241613182217Ti50147141175n=26mi46610
试在正态分布假设下对比四家同类产品的磨损率均值有无显著差异;若有显著差异,再作多重比较(取 α=0.05)。
解
先计算各平方和:
ST=i=1∑4j=1∑miyij2−nT2=10769−265132=647.12,
SA=i=1∑4miTi2−nT2=4502+61472+61412+101752−265132=480.62,
Se=ST−SA=166.50.
方差分析表为
来源因子 A误差 e总和 T平方和480.62166.50647.12自由度32225均方160.217.57F 比21.16
在显著性水平 α=0.05 下,F0.95(3,22)=3.05。由于 F>3.05,故因子 A 显著,即四个工厂的磨损率均值间存在显著差异。由于各水平重复数不同,选用 S 法进行多重比较:
cij=[(r−1)F1−α(r−1,fe)MSe(mi1+mj1)]1/2=8.32mi1+mj1.
进一步有
c12=c13=8.3241+61=5.37,
c14=8.3241+101=4.92,
c23=8.3261+61=4.80,
c24=c34=8.3261+101=4.30.
最后比较可得
∣yˉ1−yˉ2∣=12>5.37,∣yˉ1−yˉ3∣=11>5.37,∣yˉ1−yˉ4∣=5>4.92,
∣yˉ2−yˉ3∣=1<4.80,∣yˉ2−yˉ4∣=7>4.30,∣yˉ3−yˉ4∣=6>4.30.
可见,除 A2 与 A3 间无显著差异外,其他水平间都有显著差异,可分为三组:
{A1}, {A4}, {A2,A3}.
组内无显著差异,组间都有显著差异。磨损率愈小愈好,而四个水平的均值估计分别为
yˉ1=12.5,yˉ2=24.5,yˉ3=23.5,yˉ4=17.5,
因此 A1(国外产品)最好,其次是 A4(本厂产品),A2 与 A3 较差。
某厂有四条生产线生产同一种垫片,为了比较它们的断裂强度有无显著差异,特从每条生产线上随机抽取 5 个垫片,测其断裂强度,数据如下:
生产线A1A2A3A4断裂强度 yij86.593.488.694.392.087.993.293.385.290.688.892.087.985.592.789.286.088.490.992.5
试在正态分布假设下比较四条生产线上的产品断裂强度;若有显著差异,再作多重比较(取 α=0.05)。
解
为便于计算,把各数据 yij 均减去 85,记
zij=yij−85,
则有
生产线A1A2A3A4T=98.9zij1.58.43.69.37.02.98.28.30.25.63.87.02.90.57.74.21.03.45.97.5Ti12.620.829.236.3
利用这些数据可算得
ST=i=1∑4j=1∑5zij2−20T2=160.7895,
SA=i=1∑45Ti2−20T2=63.2855,
Se=ST−SA=97.5040.
于是方差分析表为
来源因子 A误差 e总和 T平方和63.285597.5040160.7895自由度31619均方21.09526.0940F 比3.46
对给定显著性水平 α=0.05,查表得 F0.95(3,16)=3.24。由于 F=3.46>3.24,故因子 A 显著,即四条生产线上垫片断裂强度均值间有显著差异。其均值估计为
yˉ1=87.52,yˉ2=89.16,yˉ3=90.84,yˉ4=92.26.
由于各水平重复数相等,可采用 T 法进行多重比较。对显著性水平 α=0.05,临界值为
c=q0.95(4,16)mMSe=4.05×56.094=4.47.
比较各均值差,仅有
∣yˉ1−yˉ4∣=4.74>4.47,
其余各差值均小于 4.47。因此只有第 1 条和第 4 条生产线上的产品均值存在显著差异。断裂强度愈大愈好,所以第 4 条生产线上的产品质量最好,第 1 条最差。
评论
支持 Markdown 和 LaTeX 数学公式。