§5.1 总体与样本

依赖于

  • 无显式依赖

被以下题目直接调用

正文部分

§5.1 总体与样本

1. 总体 在一个统计问题中,研究对象的全体称为总体,构成总体的每个成员称为个体。

若关心的是总体中每个个体的一个数量指标,则该总体称为一维总体,总体就是一个一维分布。

若关心的是总体中的每个个体的两个数量指标,则该总体称为二维总体,二维总体就是一个二维分布。以此类推。

2. 有限总体与无限总体 若总体中的个体数是有限的,此总体称为有限总体。若总体中的个体数是无限的,此总体称为无限总体。

实际中总体中的个体数大多是有限的。当个体数充分大时,将有限总体看作无限总体是一种合理的抽象。

3. 样本 从总体中随机抽取的部分个体组成的集合称为样本,样本中的个体称为样品,样品个数称为样本容量或样本量。

样本常用 个指标值 表示。样本具有二重性:它可看作 个随机变量,又可看作其观察值,这可由上下文加以区别。

4. 分组样本 只知样本观测值所在区间,而不知具体值的样本称为分组样本。

缺点:与完全样本相比损失部分信息。

优点:在样本量较大时,用分组样本既简明扼要,又能帮助人们更好地认识总体。

5. 简单随机样本 若样本 个相互独立的、具有同一分布(总体分布)的随机变量,则称该样本为简单随机样本,仍简称样本。

若总体的分布函数为 ,则其样本的(联合)分布函数为

若总体的密度函数为 ,则其样本的(联合)密度函数为

若总体的分布列为 ,则其样本的(联合)分布列为

习题与解答 5.1

习题 5.1-1

某地电视台想了解某电视栏目(如:每晚九点至九点半的体育节目)在该地区的收视率情况,于是委托一家市场咨询公司进行一次电话访查。

  1. 该项研究的总体是什么?
  2. 该项研究的样本是什么?

  1. 该项研究的总体是该地区全体电视观众;
  2. 该项研究的样本是该地区被电话访查的电视观众。

习题 5.1-2

某市要调查成年男子的吸烟率,特聘请 名统计专业本科生作街头随机调查,要求每位学生调查 名成年男子,问该项调查的总体和样本分别是什么,总体用什么分布描述为宜?

  1. 总体是该市所有成年男子(的吸烟情况);
  2. 样本是被调查的 名成年男子(的吸烟情况);
  3. 总体分布为二点分布 ,其中 为该市成年男子的吸烟率。

习题 5.1-3

设某厂大量生产某种产品,其不合格品率 未知,每 件产品包装为一盒。为了检查产品的质量,任意抽取 盒,查其中的不合格品数,试说明什么是总体,什么是样本,并指出样本的分布。

总体为该厂生产的每盒产品中的不合格品数;样本是任意抽取的 盒中每盒产品的不合格品数。

样本中每盒产品中的不合格品数为 ,因

所以样本 的分布为

其中

习题 5.1-4

为估计鱼塘里有多少鱼,一位统计学家设计了一个方案如下:从鱼塘中打捞出一网鱼,计有 条,涂上不会被水冲刷掉的红漆后放回,一天后再从鱼塘里打捞一网,发现共有 条鱼,而涂有红漆的鱼则有 条,能估计出鱼塘里大概有多少条鱼么?该问题的总体和样本又分别是什么呢?

直观上我们可以给出鱼数的估计,按照成比例的设想,我们应能估算出鱼塘里大概有 条鱼,这就是我们将在第六章介绍的频率替换的思想。该问题中总体为鱼塘里所有的鱼,而样本为一天后从鱼塘里打捞出的鱼,主要观测其是否有记号。

思考:如果要提高估计精度,可作何设想?

习题 5.1-5

某厂生产的电容器的使用寿命服从指数分布,为了了解其平均寿命,从中抽出 件产品测其实际使用寿命,试说明什么是总体,什么是样本,并指出样本的分布。

总体是该厂生产的电容器的寿命全体,或者可以说总体是指数分布,其分布为

样本是该厂中抽出的 个电容器的寿命;

记第 个电容器的寿命为 ,则

样本 的分布为

其中

习题 5.1-6

美国某高校根据毕业生返校情况记录,宣布该校毕业生的年平均工资为 万美元,你对此有何评论?

毕业生返校记录是全体毕业生中的一个特殊群体(子总体)的一个样本,它只能反映该子总体的特征,不能反映全体毕业生的状况,故此说法有失偏颇。

补充习题及解答

补充习题 7

设有 个产品,其中有 个不合格品。进行放回抽样,定义 如下:

求样本 的联合分布。

总体的分布列为

也可以写成

因此样本 的联合分布列为

其中

补充习题 8

设离散总体的分布列为

现进行不放回抽样, 为样本,

为样本均值,求 (表示成 的函数)。

由于 有限,抽样是不放回的,所以样本 中诸 的分布列与总体的分布列相同,但诸 间不相互独立,即此样本不是简单随机样本。以下我们先求诸 的期望、方差与协方差:

其中

代回原协方差表达式,可得

其中

由此可得样本均值 的期望与方差