§7.6 非参数检验
依赖于
被以下题目直接调用
正文部分
§7.6 非参数检验
- 游程检验 在怀疑数据可能不符合随机选取的原则时可对数据进行游程检验。
设 x1,x2,⋯,xn 为依时间顺序连续得到的一组样本观测值序列,要考察如下原假设是否成立:
H0:样本观察值序列符合随机抽取的原则。
为此记样本中位数为 me,把序列中小于 me 的那些 xi 换成 0;大于或等于 me 的那些 xi 换成 1。把以 0 为界的一连串的 1 称为 1 游程,以 1 为界的一连串的 0 称为 0 游程,统称为游程。设序列中 0 和 1 的个数分别为 n1 和 n2,设 R 表示样本序列的总游程数,则检验的拒绝域为
{R≤c1}∪{R≥c2},
其中临界值 c1 和 c2 根据 H0 为真时 R 的分布确定,可查表。
当 n1,n2 都不太大时,游程检验用 p 值进行更为方便,记 R 的观测值为 R0,则
p=2min{P(R≤R0),P(R≥R0)},
其概率可用下述两式进行计算
P(R=2k)=(n1n1+n2)2(k−1n1−1)(k−1n2−1),k=1,2,⋯,[2n],
P(R=2k+1)=(n1n1+n2)(k−1n1−1)(kn2−1)+(kn1−1)(k−1n2−1),k=1,2,⋯,[2n−1].
对比较大的 n1,n2,可以使用渐近分布。对给定的显著性水平 α,两个临界值可近似取为
c1=[n1+n22n1n2(1+n1+n2uα/2)],c2=[n1+n22n1n2(1+n1+n2u1−α/2)]+1.
研究表明,当 n1,n2 都大于 20 时,上式近似效果是足够好的。游程检验还可以用于检验两个总体是否有相同分布。
- 符号检验 符号检验主要用来对总体 p 的分位数 xp 进行检验。
设 x1,x2,⋯,xn 是来自总体 X 的样本,欲检验
H0:xp≤x0vsH1:xp>x0,
其中 x0 是某个给定常数,记
γi={1,0,xi>x0,xi≤x0,
符号检验统计量为
S+=i=1∑nγi,
拒绝域为
W={S+≥c},c=kinf{k:i=k∑n(in)p0i(1−p0)n−i≤α}.
对符号检验,使用检验的 p 值较为简便。记 S0+ 为符号统计量的观测值,则检验的 p 值为
p=P(S+≥S0+)=i=S0+∑nb(i;n,1−p),
其中
b(i;n,1−p)=(in)(1−p)ipn−i
表示二项分布的概率函数。
三种假设下的符号检验:
H0xp≤x0xp≥x0xp=x0H1xp>x0xp<x0xp=x0拒绝域形式WI={S+≥c}WII={S+≤c}WIII={S+≤c1 或 S+≥c2}检验的 p 值i=s0+∑nb(i;n,1−p)i=0∑s0+b(i;n,1−p)2min⎩⎨⎧i=0∑s0+b(i;n,1−p),i=s0+∑nb(i;n,1−p),0.5⎭⎬⎫
符号检验还可用于成对数据的比较。
- 符号秩和检验 秩检验主要用于对对称分布的分布中心进行检验。观测值在有序样本中的序称为它的秩。
设连续总体关于某个参数 θ 对称,其分布函数记为 F(x−θ),要检验的假设为:
H0:θ=0vsH1:θ=0.
设 x1,x2,⋯,xn 是样本,记 Ri 为 ∣xi∣ 在 (∣x1∣,∣x2∣,⋯,∣xn∣) 中的秩,符号秩和统计量
W+=i=1∑nRiI(xi>0),
拒绝域为
{W+≤Wα/2+(n)}∪{W+≥W1−α/2+(n)}.
附表 13 给出了 n≤50 时满足条件
P(W+≤Wα+(n))≤α
的 Wα+(n),至于满足条件
P(W+≥W1−α+(n))≤α
的 W1−α+(n),它等于
21n(n+1)−Wα+(n).
当 n>50 时可采用正态近似
24n(n+1)(2n+1)W+−4n(n+1)LN(0,1)
计算检验临界值。
- 秩和检验 秩和检验常用来对两个总体的位置进行比较。设有两个总体,分布函数分别为 F(x−θ1) 和 F(x−θ2),x1,x2,⋯,xm 和 y1,y2,⋯,yn 分别为其样本,对合样本 x1,x2,⋯,xm,y1,y2,⋯,yn 进行排序,对应的秩为
R=(Q1,Q2,⋯,Qm,R1,R2,⋯,Rn).
在比较 θ1,θ2 的大小时,采用如下威尔科克森秩和统计量
W=i=1∑nRi,
假设与拒绝域分别为
IH0:θ1≤θ2vsH1:θ1>θ2,WI={W≤Wα(m,n)};
IIH0:θ1≥θ2vsH1:θ1<θ2,WII={W≥W1−α(m,n)};
IIIH0:θ1=θ2vsH1:θ1=θ2,WIII={W≤Wα/2(m,n) 或 W≥W1−α/2(m,n)}.
在样本容量较大时,可以用大样本近似公式
W∗=12mn(m+n+1)W−2n(m+n+1)∼N(0,1)
作上述检验。在 m 与 n 都大于等于 20 时,此种近似效果很好。
习题与解答 7.6
说明:除非特别指出,以下检验的显著性水平均取为 α=0.05。
在某保险种类中,一次关于 2008 年的索赔数额(单位:元)的随机抽样为(按升序排列):
4632, 4728, 5052, 5064, 5484, 6972, 7596, 9480,
14760, 15012, 18720, 21240, 22836, 52788, 67200.
已知 2007 年的索赔数额的中位数为 5063 元。2008 年索赔的中位数比前一年是否有所变化?请用双侧符号检验方法检验,求检验的 p 值,并写出结论。
解
原假设
H0:x0.5=5063,
备择假设
H1:x0.5=5063,
作差 xi−5063,得到检验统计量值为
S0+=12,
检验的 p 值为
p=2min{i=0∑12(i15)0.515,i=12∑15(i15)0.515,0.5}=2min{0.9963,0.0176,0.5}=0.0352.
p 值小于 0.05,所以拒绝原假设。从而认为 2008 年的索赔中位数与前一年相比有变化。
1984 年一些国家每平方千米可开发水资源数据(单位:万吨/年)如下表所示:
国家苏联巴西美国加拿大扎伊尔墨西哥瑞典意大利奥地利南斯拉夫挪威每平方千米可开发水资源4.94.17.55.428.14.922.316.858.624.837.4国家印度哥伦比亚日本阿根廷印度尼西亚瑞士罗马尼亚联邦德国英国法国西班牙每平方千米可开发水资源8.526.334.96.97.978.010.18.81.711.513.4
而当年中国的该项指标为 20 万吨/年,请用符号检验方法检验:这 22 个国家每平方千米可开发的水资源的中位数不高于中国。求检验的 p 值,并写出结论。
解
原假设
H0:x0.5≤20,
备择假设
H1:x0.5>20,
作差 xi−20,发现正数的个数为
S0+=8,
从而检验的 p 值为
p=i=8∑22(i22)0.522=0.9331,
p 值很大,所以可以认为这 22 个国家可开发水资源的中位数不高于中国。
下面是亚洲十个国家 1996 年的每 1000 个新生儿中的死亡数(按从小到大的次序排列):
日本 4,以色列 6,韩国 9,斯里兰卡 15,中国 23,
叙利亚 31,伊朗 36,印度 65,孟加拉国 77,巴基斯坦 88.
以 M 表示 1996 年亚洲国家中 1000 个新生儿中的死亡数的中位数,试检验:
H0:M≥34vsH1:M<34.
求检验的 p 值,并写出结论。
解
作差 xi−34,发现正数的个数为
S0+=4,
从而检验的 p 值为
p=i=0∑4(i10)0.510=0.3770,
p 值大于 0.05,不拒绝原假设,即可以认为中位数不低于 34。
某烟厂称其生产的每支香烟的尼古丁含量在 12 mg 以下。实验室测定的该烟厂的 12 支香烟的尼古丁含量(单位:mg)分别为
16.7, 17.7, 14.1, 11.4, 13.4, 10.5,
13.6, 11.6, 12.0, 12.6, 11.7, 13.7.
该烟厂所说的尼古丁含量是否比实际要少?求检验的 p 值,并写出结论。
解
我们可用中位数来刻画此问题,于是一对假设为
H0:x0.5≤12vsH1:x0.5>12.
作差 xi−12 得正值个数为 7,检验的 p 值为
p=i=7∑12(i12)0.512=0.3872.
与 0.05 比较,我们不能确认该厂的说法不真实。
9 名学生到英语培训班学习,培训前后各进行了一次水平测试,成绩为
学生编号 i入学前成绩 xi入学后成绩 yizi=xi−yi17681−527185−1437070045752554952−366963676583−1882633−795962−3
- 假设测验成绩服从正态分布,问学生的培训效果是否显著?
- 不假定总体分布,采用符号检验方法检验学生的培训效果是否显著;
- 采用符号秩和检验方法检验学生的培训效果是否显著。三种检验方法结论相同吗?
解
(1) 这是成对数据的检验问题,在假定正态分布下,可通过对
zi=xi−yi
作单样本 t 检验。一对假设为
H0:μz≥0vsH1:μz<0.
由于
zˉ=−4.3333,sz=7.9373,
故可算出检验统计量值为
t=7.93739×(−4.3333)=−1.6378,
于是检验的 p 值为
p=P(t≤−1.6378)=0.0700,
p 值大于 0.05,在显著性水平 0.05 下不能认为学生的培训效果显著。
(2) 由于 z1,z2,⋯,z9 正数的个数为 2,从而检验的 p 值为
p=i=0∑2(i9)0.59=0.0898,
p 值大于 0.05,在显著性水平 0.05 下也不能认为学生的培训效果显著。
(3) 由于两个正的差值的秩分别为 4.5 和 6,故符号秩和检验统计量为
W+=10.5,
这是一个单侧假设检验,检验拒绝域为
{W+≤Wα+(n)},
在给定 n=9,α=0.05 下,查表 13 可知
W0.05+(9)=8,
观测值没有落入拒绝域,故也不能认为学生的培训效果显著,三者结果一致。
为了比较用来做鞋子后跟的两种材料的质量,选取了 15 个男子(他们的生活条件各不相同),每人穿着一双新鞋,其中一只是以材料 A 做后跟,另一只以材料 B 做后跟,其厚度均为 10 mm,过了一个月再测量厚度,得到数据如下:
序号材料 A材料 B16.67.427.05.438.38.848.28.055.26.869.39.177.96.388.57.597.87.0107.56.5116.14.4128.97.7136.14.2149.49.4159.19.1
问是否可以认定以材料 A 制成的后跟比材料 B 的耐穿?
- 设 di=xi−yi (i=1,2,⋯,15) 来自正态总体,结论是什么?
- 采用符号秩和检验方法检验,结论是什么?
解
(1) 这是成对数据的检验问题,在假定正态分布下,以 μ 记差值 d 的均值,则需检验的假设为
H0:μd≤0vsH1:μd>0.
此处 15 个差值为
−0.8, 1.6, −0.5, 0.2, −1.6, 0.2, 1.6, 1, 0.8, 1, 1.7, 1.2, 1.9, 0, 0.
由于
dˉ=0.5533,sd=1.0225,
故可算出检验统计量值为
t=1.022515×0.5533=2.0958,
于是检验的 p 值为
p=P(t≥2.0958)=0.0274.
p 值小于 0.05,在显著性水平 0.05 下可以认定以材料 A 制成的后跟比材料 B 的耐穿。
(2) 由于 3 个负的差值的秩分别为 5,6.5,12,故符号秩和检验统计量为
W−=23.5
(正号和负号在使用中是完全等价的),这是一个单边假设检验,检验拒绝域为
{W−≤Wα−(n)},
在给定 n=15,α=0.05 下,查表 13 可知
W0.05−(15)=30,
观测值落入拒绝域,拒绝原假设,可以认定以材料 A 制成的后跟比材料 B 的耐穿,二者结果一致。
某饮料商用两种不同配方推出了两种新的饮料,现抽取了 10 位消费者,让他们分别品尝两种饮料并加以评分,从不喜欢到喜欢,评分由 1—10,评分结果如下:
品尝者A 饮料B 饮料11062853624825746567148359991078
问两种饮料评分是否有显著差异?
- 采用符号检验方法作检验;
- 采用符号秩和检验方法作检验。
解
10 个差值为
4, 3, 4, 6, 3, −1, −3, −2, 0, −1.
(1) 由于差值中正数的个数为 5,从而检验的 p 值为
p=2min{i=0∑5(i10)0.510,i=5∑10(i10)0.510,0.5}=2min{0.6230,0.6230,0.5}=1,
p 值很大,故不能认为两种饮料评分有显著差异。
(2) 四个负的差值的秩分别为 2.5,2.5,4,6,故符号秩和检验统计量为
W−=15,
这是一个双侧假设检验,检验拒绝域为
{W−≤Wα/2−(n)}∪{W−≥W1−α/2−(n)},
在给定 n=10,α=0.05 下,查表 13 知
W0.025−(10)=8,
而
W0.975−(10)=210×11−W0.025−(10)=47,
观测值没有落入拒绝域,故不能认为两种饮料评分有显著差异,二者结果一致。
测试在有精神压力和没有精神压力时血压的差别,10 个志愿者进行了相应的试验,结果为(单位:mmHg):
无精神压力有精神压力107127108119122123119113116125118132121121111131114116108124
是否该数据表明有精神压力下的血压有所增加?
解
对此问题也可类似于本节第 5 题进行分析,首先明确要检验的一对假设为:
H0:有无精神压力下的血压不变vsH1:有精神压力下的血压有增加.
为此,先给出血压增加值 zi 的 10 个观测值,为
20, 11, 1, −6, 9, 14, 0, 20, 2, 16.
(1) 若假定增加值服从正态分布,可通过对增加值做单样本 t 检验。此一对假设为
H0:μz=0vsH1:μz>0.
由数据可计算得到
zˉ=8.7,sz=9.056,
故可算出检验统计量值
t=9.05610×8.7=3.0380,
于是检验的 p 值为
p=P(t≥3.0380)=0.0070,
p 值小于 0.05,可以认为有精神压力下的血压有所增加。
(2) 由于 z1,z2,⋯,z10 正数的个数为 8,从而检验的 p 值为
p=i=8∑10(i10)0.510=0.0547,
p 值大于 0.05,在显著性水平 0.05 得不到显著的结论,即不能认为有精神压力下的血压有所增加。
(3) 由于负的差值只有一个,其秩为 4,故符号秩和检验统计量为
W−=4,
这是一个单侧假设检验,检验拒绝域为
{W−≤Wα−(n)},
在给定 n=10,α=0.05 下,查表 13 可知
W0.05−(10)=10,
观测值 4 落入拒绝域,故拒绝原假设,可以认为有精神压力下的血压有所增加。
三者结果并不完全一致。
评论
支持 Markdown 和 LaTeX 数学公式。