§6.6 区间估计

依赖于

  • 无显式依赖

被以下题目直接调用

正文部分

§6.6 区间估计

1. 置信区间 是总体的一个参数,其参数空间为 是来自该总体的样本,对给定的一个 ,若有两个统计量

使得对任意的 ,有

则称随机区间 的置信水平为 的置信区间,或简称 置信区间; 分别称为 的(双侧)置信下限和置信上限。

这里置信水平 的含义是指在大量使用该置信区间时,大约有不少于 的区间包含

2. 同等置信区间 在上述记号下,若对给定的 ,对任意的 ,有

则称 同等置信区间。

同等置信区间是把给定的置信水平 用足了。常在总体为连续分布场合下可以实现。

3. 置信限 在上述记号下,若对给定的 和任意的 ,有

则称 的置信水平为 的(单侧)置信下限。假如等号对一切 成立,则称 同等置信下限。若对给定的 和任意的 ,有

则称 的置信水平为 的(单侧)置信上限。若等号对一切 成立,则称 同等置信上限。

4. 枢轴量法 寻找同等置信区间常采用枢轴量法,其步骤如下:

  1. 设法构造一个样本和 的函数 ,使得 的分布不依赖于未知参数。此种 被称为枢轴量;
  2. 适当地选择两个常数 ,使对给定的 ,有
  3. 若能将 进行不等式等价变形化为 ,则有

最后的 就是 同等置信区间。

关于置信区间的构造有两点说明:

  1. 满足置信水平要求的 通常不唯一。若有可能,应选平均长度 达到最短的 ,这在 的分布为对称分布场合通常容易实现。
  2. 实际中,选平均长度 尽可能短的 往往很难实现,此时,常这样选择 ,使得两个尾部概率各为 ,即 ,这样的置信区间称为等尾置信区间。这是在 的分布为偏态分布场合常采用的方法。

5. 常用的置信区间

(1) 设 是来自 的样本, 为样本均值, 为样本标准差, 为标准正态分布的 分位数, 为自由度是 分布 分位数, 为自由度是 分布 分位数,取置信水平 ,则

  1. 已知时 的置信区间为
  1. 未知时 的置信区间为
  1. 未知)的置信区间为
  1. 未知)的置信区间为

(2) 设 是来自 的样本, 为其样本均值, 为其样本标准差; 是来自 的样本, 为其样本均值, 为其样本标准差; 含义同上, 为自由度是 分布 分位数,取置信水平 ,则

  1. 均已知时, 的置信区间为
  1. 未知时, 的置信区间为

其中

  1. 已知时, 的置信区间为

其中

  1. 都很大时, 的近似置信区间为
  1. 一般场合下 的近似置信区间为

其中

  1. 方差比 的置信区间为

(3) 设 是来自 的样本, 为其样本均值,则 很大时比例 的置信水平为 的近似置信区间为

6. 样本量的确定 控制比率 置信区间长度不超过 的最小样本量为

习题与解答 6.6

习题 6.6-1

某厂生产的化纤强度服从正态分布,长期以来其标准差稳定在 ,现抽取了一个容量为 的样本,测定其强度,算得样本均值为 ,试求这批化纤平均强度的置信水平为 的置信区间。

这是方差已知时正态均值的区间估计问题。由题设条件 ,查表知 ,于是这批化纤平均强度的置信水平为 的置信区间为

即这批化纤平均强度的置信水平为 的置信区间为

习题 6.6-2

总体 已知,问样本容量 取多大时才能保证 置信水平为 的置信区间的长度不大于

已知条件下得 置信区间为

其区间长度为 ,若使 ,只需

由于 ,故

即样本容量 至少取 时,才能保证 的置信水平为 的置信区间的长度不大于

习题 6.6-3

是取自总体 的样本,已知 服从正态分布

(1) 求 的置信水平为 的置信区间;

(2) 求 的数学期望的置信水平为 的置信区间。

(1) 将数据进行对数变换,得到 的样本值为

它可看作是来自正态总体 的样本,其样本均值为 ,由于 已知,因此, 的置信水平为 的置信区间为

(2) 由于

的严格函数,利用 (1) 的结果,可算得 的数学期望的置信水平为 的置信区间为

习题 6.6-4

用一个仪表测量某一物理量 次,得样本均值 ,样本标准差

(1) 测量标准差 的大小反映了测量仪表的精度,试求 的置信水平为 的置信区间;

(2) 求该物理量真值的置信水平为 的置信区间。

(1) 此处 。查表知

置信区间为

从而 的置信水平为 的置信区间为

(2) 当 未知时, 置信区间为

查表得 ,因而 的置信水平为 的置信区间为

习题 6.6-5

已知某种材料的抗压强度 ,现随机地抽取 个试件进行抗压试验,测得数据如下:

(1) 求平均抗压强度 的置信水平为 的置信区间;

(2) 若已知 ,求平均抗压强度 的置信水平为 的置信区间;

(3) 求 的置信水平为 的置信区间。

(1) 经计算得,

未知时, 的置信水平为 的置信区间为

查表得 ,因而 的置信水平为 的置信区间为

(2) 在 已知时, 的置信水平为 的置信区间为

查表得 ,因而 的置信水平为 的置信区间为

(3) 此处 。取 ,查表得

因而 的置信水平为 的置信区间为

由此可以得到 的置信水平为 的置信区间为

习题 6.6-6

在一批货物中随机抽取 件,发现有 件不合格品,试求这批货物的不合格品率的置信水平为 的置信区间。

此处 较大,可用正态分布求其近似置信区间。不合格品率的 近似置信区间为

此处

因而不合格品率的置信水平为 的置信区间为

习题 6.6-7

是来自泊松分布 的样本,证明: 的近似 置信区间为

由中心极限定理知,当样本量 较大时,样本均值 近似服从

因而

近似服从 ,此 可作为枢轴量。对给定 ,利用标准正态分布的 分位数 可得

括号里的事件等价于

因而得

其左侧 的二次多项式二次项系数为正,故二次曲线开口向上,而其判别式

故此二次曲线与 轴有两个交点,记为 ),则有

其中 可表示为

这就证明了 的近似 置信区间为

事实上,上述近似区间是在 比较大时使用的,此时有

于是, 的近似 置信区间可进一步简化为

习题 6.6-8

某商店某种商品的月销售量服从泊松分布,为合理进货,必须了解销售情况。现记录了该商店过去的一些销售量,数据如下:

试求平均月销售量的置信水平为 的置信区间。

平均月销售量

此处 较大,利用上一题的结果,平均月销售量的近似 置信区间为

若用较为精确的近似公式,得置信区间为

二者相差不大。

习题 6.6-9

设从总体 和总体 中分别抽取容量为 的独立样本,可计算得

(1) 若已知 ,求 的置信水平为 的置信区间;

(2) 若已知 ,求 的置信水平为 的置信区间;

(3) 若对 一无所知,求 的置信水平为 的近似置信区间;

(4) 求 的置信水平为 的置信区间。

(1) 在 都已知时, 的置信水平为 的置信区间为

经计算 ,查表得 ,因而 的置信水平为 的置信区间为

(2) 当 时, 的置信水平为 的置信区间为

这里

,因而 的置信水平为 的置信区间为

(3) 当 未知时,由于两个样本量不是很大,故可采用一般场合下的近似置信区间,即 的置信水平为 的近似置信区间为

这里

又查表得 ,因而 的置信水平为 的近似置信区间为

(4) 的置信水平为 的置信区间为

查表得

因而 的置信水平为 的置信区间为

习题 6.6-10

假设人体身高服从正态分布,今抽测甲、乙两地区 岁至 岁女青年身高得数据如下:甲地区抽取 名,样本均值 ,样本标准差 ;乙地区抽取 名,样本均值 ,样本标准差 。求:

(1) 两正态总体方差比的置信水平为 的置信区间;

(2) 两正态总体均值差的置信水平为 的置信区间。

为甲地区抽取的女青年身高, 为乙地区抽取的女青年身高,由题设条件,

(1) 的置信水平为 的置信区间为

此处 ,查表得

由此, 的置信水平为 的置信区间为

(2) 由 (1), 的置信水平为 的置信区间包含 ,因此有一定理由假定两个正态总体的方差相等,此时

查表得 ,故两正态总体均值差的置信水平为 的置信区间为

还有另一种解法就是不对方差相等作假定,而采用近似方法求均值差的置信区间,由于

查表知 ,从而两正态总体均值差的置信水平为 的近似置信区间为

这两个置信区间相差不算太小,所以在应用中条件“方差相等”是否成立是要加以考证的。

习题 6.6-11

设总体 的密度函数为

其中 为未知参数, 为抽自此总体的简单随机样本,求 的置信水平为 的置信区间。

由指数分布和伽马分布的关系知

根据伽马分布的性质,

从而,

因此可得 的置信水平为 的置信区间为

习题 6.6-12

设某电子产品的寿命服从指数分布,其密度函数为

现从此批产品中抽取容量为 的样本,测得寿命(单位:千时)

求平均寿命 的置信水平为 的置信区间和置信上、下限。

这是上题的一个具体应用。计算得

查表可得,

根据上题结论可知, 的置信水平为 的置信区间为

单侧置信上限为 ,单侧置信下限为 。所以,平均寿命 的置信水平为 的置信区间为

单侧置信上限为 ,单侧置信下限为

习题 6.6-13

设总体 的密度函数为

为抽自此总体的简单随机样本,求位置参数 的置信水平近似为 的置信区间。

由于此柯西分布关于 对称,故 是总体中位数。其样本中位数

所以

从而可知位置参数 的置信水平近似为 的置信区间为

习题 6.6-14

为抽自正态总体 的简单随机样本,为使得 的置信水平为 的置信区间的长度不大于给定的 ,试问样本容量 至少要多少?

的置信水平为 的置信区间为

对应的区间长度为

因此,样本容量 至少为

习题 6.6-15

为抽自正态总体 的简单随机样本。试证

为枢轴量,其中 为已知常数。

因为

其中 是自由度为 的非中心 分布,其非中心参数 为已知常数。又

所以

的分布与 无关,即为枢轴量。

习题 6.6-16

是来自

的样本,求 的置信水平为 的置信区间(提示:证明 为枢轴量,并求出对应的密度函数)。

本题是下一题 (2) 的特殊情形,此处过程从略,答案为

习题 6.6-17

为抽自均匀分布 的简单随机样本,记

为其次序统计量。求:

(1) 的置信水平为 的置信区间;

(2) 的置信水平为 的置信区间。

(1) 令

独立同分布于 。由教材例 5.3.9 可知,

所以,

这里 表示 分位数。从而, 的置信水平为 的置信区间为

(2) 令

的联合密度函数为

所以, 的联合密度函数为

并且

由于

下面讨论在 给定后 的取值范围,显然有 ,故主要是确定 的上界。若 ,则上式给出

而若 ,则上式给出

从而 的密度函数为

注意到该密度函数是对称的,对任意给定的 ,有

因此, 的置信水平为 的置信区间为

习题 6.6-18

独立同分布于 独立同分布于 皆未知,且两样本独立,求 的一个置信水平为 的置信区间(提示:令 ,证明 的分布与 无关,并求出对应的密度函数)。

的分布完全已知,可作为枢轴量。下求 的分布。

利用商的公式,只是要注意 的积分范围。此处变量取值范围为

故当 时,,有

而当 时,

由此可写出其分布函数(更加简洁),为

对给定的充分小的 ,由上式不难给出两个分位数,如取

于是给出了 的一个置信水平为 的置信区间为

习题 6.6-19

设总体 的密度函数为

为抽自此总体的简单随机样本。

(1) 证明: 的分布与 无关,并求出此分布;

(2) 求 的置信水平为 的置信区间。

(1) 令

独立同分布于 的密度函数为

的分布与 无关,其密度函数为

(2) 取 使得

由于 上单调递减,为使得区间长度最短,故应取 ,从而求得

所以, 的置信水平为 的置信区间为

补充习题及解答

补充习题 20

随机选取 发炮弹,测得炮弹的炮口速度的样本标准差 ,若炮弹的炮口速度服从正态分布,求其标准差 置信上限。

在正态分布下,对样本方差

从而有

等价地,

故标准差 置信上限为

,查表知

故标准差 置信上限为

补充习题 21

有两位化验员 独立地对一批聚合物含氯量用同样方法各进行 次重复测定,其样本方差分别为 ,若 的测量值都服从正态分布,求其方差比

置信上限。

在正态分布下,两样本方差比服从 分布,具体是

从而有

置信上限为

,查表知

置信上限为

补充习题 22

为估计某台光谱仪测量材料中金属含量的测量误差,特置备了 个金属试块,其成分、金属含量、均匀性都有差别,设每个试块的测量值都服从正态分布,现对每个试块重复测量 次,计算得其样本标准差分别为

试求 置信区间。

从题意可知,这里 可以看作来自正态总体 的容量为 的样本标准差,,由此可知

由于各试块的测量可以为相互独立的,故有

从而

置信区间为

现算出

,查表知

代入可算得 置信区间为

补充习题 23

为研究某型号汽车轮胎的磨耗,随机选择 只轮胎,每只轮胎行驶到磨坏为止,记录所行驶路程(单位:km)如下:

假设这些数据来自正态总体 ,其中 未知,求 的置信水平为 的单侧置信下限。

先计算样本均值 与样本标准差

利用 未知场合的 的单侧置信下限

这里 ,代入可得

补充习题 24

有一位市场调查员,他感兴趣的是该地区成年人中将购买某种产品的比例 (即该商品的市场占有率)。现他要事先确定需要访问多少顾客(样本量 )才能使 的置信水平为 的置信区间,其中 是样本中购买此种商品的顾客的比例, 是事先给定的常数。假如事先知道 ,结果又是如何?

对第一个问题,教科书中例 6.6.8 对类似的问题进行了讨论,给出了一种解法,此处我们换一种思路对该问题进行讨论。

是来自二点分布 的一个样本, 就是样本中购买此种商品的顾客的比例,由中心极限定理知,当 较大时,

未知时,有

从而

这说明

的置信水平 的置信区间。要求该置信区间的长度不超过 ,即得

,当 时可分别算得

样本量随 的增加(精度减小)迅速降低。

对第二个问题,当已知 )(或已知 ),处理方法完全一样)时,由于

是增函数,所以

从而

这说明

的置信水平 的置信区间。类似地,要求该置信区间的长度不超过 ,即得

譬如,若已知 (即 ),则

于是关于样本量的要求化为

仍取 ,当 时分别算得

完全未知情况相比样本量约减少 。由此可见,若对 事先有若干信息可利用,得知市场占有率不会超过 ,那么就应利用这个信息,减少样本量,也即减少调查费用。