§5.2 样本数据的整理与显示

依赖于

  • 无显式依赖

被以下题目直接调用

正文部分

§5.2 样本数据的整理与显示

1. 经验分布函数 若将样本观测值 由小到大进行排列,得有序样本

用有序样本定义如下函数

则称 为该样本的经验分布函数。

格利文科定理 是取自总体分布函数为 的样本, 是该样本的经验分布函数,则当 时,有

此定理表明:当 相当大时,经验分布函数 是总体分布函数 的一个良好的近似。它是经典统计学的一块基石。

2. 频数频率表 由样本数据 制作频数频率表的操作步骤如下:

  1. 确定组数
  2. 确定每组组距,通常取每组组距相等为
  3. 确定每组组限;
  4. 统计样本数据落入每个区间的频数,并计算频率。

综合上述,列表表中,即得该样本的频数频率表。该表就是一个分组样本,它能简明扼要地把样本特点表达出来。不足之处是该表依赖于分组,不同的分组方式有不同的频数频率表。

3. 样本数据的图形表示

(1)直方图

  1. 利用频数频率分布表上的区间(横坐标)和频数(纵坐标)可作出频数直方图;
  2. 若把纵坐标改为频率就得频率直方图;
  3. 若把纵坐标改为频率组距,就得到单位频率直方图。这时长条矩形的面积之和为

此三种直方图的差别仅在纵坐标的设置上,直方图图形本身并无变化。

(2)茎叶图

把样本中的每个数据分为茎与叶,把茎放于一侧,叶放于另一侧,就得到一张该样本的茎叶图。比较两个样本时,可画出背靠背的茎叶图。

茎叶图保留数据中全部信息。当样本量较大,数据很分散,横跨二、三个数量级时,茎叶图并不适用。

习题与解答 5.2

习题 5.2-1

以下是某工厂通过抽样调查得到的 名工人一周内生产的产品数:

试由这批数据构造经验分布函数并作图。

此样本容量为 ,经排序可得有序样本:

其经验分布函数

\FigureFiveOne

习题 5.2-2

下表是经过整理后得到的分组样本:

试写出此分组样本的经验分布函数。

样本的经验分布函数为

习题 5.2-3

假若某地区 年某专业毕业生实习期满后的月薪数据如下:

  1. 构造该批数据的频数分布表(分 组);
  2. 画出直方图。

此处数据最大观察值为 ,最小观察值为 ,故组距近似为

,确定每组区间端点为 ,此处可取 ,于是分组区间为

其频数频率表如下:

\FigureFiveTwo

习题 5.2-4

某公司对其 名职工上班所需时间(单位:min)进行了调查,下面是不完整的频率分布表:

  1. 试将频率分布表补充完整;
  2. 该公司上班所需时间在半小时以内有多少人?

  1. 由于频率和为 ,故空缺的频率为
  1. 该公司上班所需时间在半小时以内的人所占频率为

该公司有职工 人,故该公司上班所需时间在半小时以内的人有

习题 5.2-5

种刊物的月发行量(单位:百册)如下:

  1. 建立该批数据的频数分布表,取组距为 (百册);
  2. 画出直方图。

此处数据最大观察值为 ,最小观察值为 ,由于组距为 ,故组数为

所以分 组。接下来确定每组区间端点,要求

此处可取 ,于是可列出其频数频率表:

\FigureFiveThree

习题 5.2-6

对下列数据构造茎叶图

取百位数与十位数组成茎,个位数为叶,这组数据的茎叶图如下:

习题 5.2-7

根据调查,某集团公司的中层管理人员的年薪(单位:万元)数据如下:

试画出茎叶图。

取整数部分为茎,小数部分为叶,这组数据的茎叶图如下:

补充习题及解答

补充习题 8

设总体 的分布函数为 ,经验分布函数为 ,试证

是取自总体分布函数为 的样本,则经验分布函数为

若令

是独立同分布的随机变量,且

于是

可写为

故有