§6.3 最大似然估计与 EM 算法

依赖于

  • 无显式依赖

被以下题目直接调用

正文部分

§6.3 最大似然估计与 EM 算法

  1. 最大似然估计 利用“最大似然原理”获得的估计,只能在总体概率函数形式已知的情况下使用。若总体的概率函数为 是来自该总体的样本,则似然函数为

使似然函数 达到最大的统计量 称为 的最大似然估计,简称 MLE,即

注意:使对数似然函数 达到最大的 也使似然函数 最大,寻找最大值时也常对 使用微分法。

  1. 最大似然估计的不变性 的最大似然估计,则对任一函数 的最大似然估计。
  2. EM 算法 当分布中有多余参数或数据为截尾或缺失时,其 MLE 的求取是比较困难的。Dempster 等人于 年提出了 EM 算法,其出发点是把求 MLE 的过程分两步走:第一步求期望(E 步),以便把多余的部分去掉;第二步求极大值(M 步)。重复使用这两步直至收敛可得 MLE 的近似解。这是一种非常有效的方法。
  3. MLE 的渐近正态性 在很一般条件下,总体分布 的 MLE 具有相合性与渐近正态性,即

其中

称为费希尔信息量。

习题与解答 6.3

习题 6.3-1

试求下列未知参数的最大似然估计:

(1) 似然函数

其对数似然函数为

求导并令其为 ,得

故最大似然估计为

再注意到

的最大似然估计。

(2) 似然函数

其对数似然函数为

求导并令其为 ,得

故最大似然估计为

又由于

的最大似然估计。

习题 6.3-2

试求下列未知参数的最大似然估计:

(1) 似然函数为

要使 达到最大,指示函数必须为 ,且在此条件下 的增函数,故应取满足约束条件的最大 ,即

(2) 似然函数为

其对数似然函数为

由于 为增函数,故应取满足约束条件的最大 ,即

再对 求导并令其为 ,得

所以

(3) 似然函数为

由于 的减函数,故要使 达到最大,应在满足

的条件下取最小的 ,因此

习题 6.3-3

试求下列未知参数的最大似然估计:

(1) 似然函数

其对数似然函数为

求导并令其为 ,得

为最大似然估计。

(2) 似然函数为

于是只要

似然函数就取值为 。故该模型的最大似然估计不唯一,上述区间内任一值均为最大似然估计。

(3) 似然函数为

为使 达到最大,应在使指示函数为 的条件下令区间长度 最小,故有

习题 6.3-4

某地质学家在某地区取了 个岩石样品,每个样品有 块石子。下面记录了每个样品中石灰石的块数,试求石灰石比例 的最大似然估计:

表示一个样品中石灰石的块数,则

为样本,则其似然函数为(忽略常数)

对数似然函数为

将对数似然函数关于 求导并令其为 ,得到似然方程

解之得

由于

由二阶导数的性质知, 的最大似然估计为

习题 6.3-5

在遗传学研究中经常要从截尾二项分布中抽样,其总体概率函数为

若已知 是样本,试求 的最大似然估计。

时,该截尾二项分布只能取 。不妨设 的样本中有 ,有 ,则其似然函数为(忽略常数)

对数似然函数为

将对数似然函数关于 求导并令其为 ,得到似然方程

解之得

又由于

代入上式即得

习题 6.3-6

已知在文学家萧伯纳的《The Intelligent Woman’s Guide To Socialism and Capitalism》一书中,一个句子的单词数 近似地服从对数正态分布,即

今从该书中随机地取 个句子,这些句子中的单词数分别为

求该书中一个句子单词数均值

的最大似然估计。

正态分布 的参数的最大似然估计分别为样本均值和方差,即

由于最大似然估计具有不变性,因而

的最大似然估计为

习题 6.3-7

总体 ,其中 是未知参数, 为取自该总体的样本, 为样本均值。

  1. 证明

是参数 的无偏估计和相合估计;

  1. 的最大似然估计,它是无偏估计吗?是相合估计吗?

(1) 总体 ,则

从而

于是

这说明 是参数 的无偏估计。进一步,

这就证明了 也是 的相合估计。

(2) 似然函数为

显然 的减函数,且 的取值范围为

因而 的最大似然估计为

下求 的均值与方差。由于 的密度函数为

从而

于是

这说明 不是 的无偏估计,而是 的渐近无偏估计。又

因而 的相合估计。

习题 6.3-8

是来自密度函数为

的总体的样本。

  1. 的最大似然估计 ,它是否是相合估计?是否是无偏估计?
  2. 的矩估计 ,它是否是相合估计?是否是无偏估计?

(1) 似然函数为

显然 在示性函数为 的条件下是 的严增函数,因此 的最大似然估计为

的密度函数为

因此 不是 的无偏估计,但是 的渐近无偏估计。由于

从而

这说明 的相合估计。

(2) 由于

这给出 ,所以 的矩估计为

所以

从而有

这说明 既是 的无偏估计,也是相合估计。

习题 6.3-9

为了估计湖中有多少条鱼,从中捞出 条,标上记号后放回湖中,然后再捞出 条鱼,发现其中有 条鱼有记号。问湖中有多少条鱼,才能使 条鱼中出现 条带记号的鱼的概率最大?

设第二次捞出的带有记号的鱼的数目为 ,则 服从超几何分布, 条鱼中出现 条带记号鱼的概率

其中 表示湖中的鱼的条数,是未知参数。似然函数为

考察相邻两项比值

当且仅当 时,;当且仅当 时,,因此只有在 时, 达到最大。这里的

即为湖中鱼数的最大似然估计。

习题 6.3-10

证明:对正态分布 ,若只有一个观测值,则 的最大似然估计不存在。

在只有一个观测值场合,对数似然函数为

当取 时,该函数趋于 。这说明该函数没有最大值,或者说极大值无法实现,从而 的最大似然估计不存在。

补充习题及解答

补充习题 11

若总体 服从如下柯西分布:

是它的一个样本,试求 的估计量。

由于柯西分布的数学期望不存在,因此不能用一阶矩法估计得到 的估计量。但注意到 是该总体分布的中位数,因此,若用替换原理,可以给出 的一个矩估计为

若用最小二乘法(见第八章),即使

最小,则得 ,很难说这是 的一个合适的估计量,因为这时无偏性、有效性都失去意义,而且 同分布(读者自行验证),说明 也没有起到汇集 的信息的作用,因而,这个估计量的相合性也就无从谈起。

我们转而讨论 的最大似然估计。其似然函数为

其对数似然函数为

求导并令其为 可得对数似然方程

这个方程只能求数值解,比如用牛顿迭代法。由于 是总体分布的中位数,因此可以用样本中位数 作为迭代的初值,求所得的这个数值解即为 的最大似然估计。从似然角度看,该方法得到的估计要比样本中位数估计更好些。

补充习题 12

一个罐子里装有黑球和白球,有放回地抽取一个容量为 的样本,其中有 个白球,求罐子里黑球数和白球数之比 的最大似然估计。

解法一 为罐子中白球的比例,令 表示第 次有放回抽样所得的白球数,则

的最大似然估计为

因为黑球数与白球数比值

根据最大似然估计的不变性,有

对具体的样本值,即 个中抽到 个白球来讲, 的最大似然估计为

解法二 设罐子里有白球 个,则有黑球 个,从而罐中共有 个球。从中有放回地抽一个球为白球的概率为

从罐中有放回地抽 个球,可视为从二点分布

中抽取一个样本容量为 的样本。当样本中有 个白球时,似然函数为

其对数似然函数为

将对数似然函数对 求导,并令其为 ,得似然方程

解之可得

由于其对数似然函数的二阶导数为

所以

的最大似然估计。

譬如,在 场合, 的最大似然估计

即罐中黑球数与白球数之比的最大似然估计为 ,即白球 个、黑球 个,或者白球 个、黑球 个等。

补充习题 13

分别为来自总体 的两个独立样本,试求

的最大似然估计。

合样本的似然函数为

对数似然函数为

将对数似然函数对 分别求导并令其为 (忽略常数),得

由此得到 的最大似然估计为

补充习题 14

某批产品含有 件,其中 件为不合格品,现从中随机抽取 件中有 件不合格品,则 服从超几何分布,即

假如 已知,寻求该批产品中不合格品数 的最大似然估计。

记未知参数 的似然函数为

考察似然比

要使似然比

必导致

化简此式可得

这表明:当 为整数和 时,似然函数 的增函数,即

类似地,要使似然比

必导致

这表明:当 为整数且 时,似然函数 的减函数,即

比较式 和式 可知,当 为整数时, 的最大似然估计为 ;而当 不为整数时, 的最大似然估计为

其中 为不超过 的最大整数。综合上述, 的最大似然估计为

譬如,在 场合,

由于 为整数,故 的最大似然估计为 。下面以实际计算加以佐证,几个

如下表所示:

可见 可使似然函数达到最大。

又如,在 场合,

(不为整数),这时 的最大似然估计

实际计算表明

可见 可使似然函数达到最大。