§6.5 贝叶斯估计

依赖于

  • 无显式依赖

被以下题目直接调用

正文部分

§6.5 贝叶斯估计

  1. 贝叶斯统计推断使用的三种信息
  2. 总体信息,总体分布或总体所属分布族提供的信息;
  3. 样本信息,从总体中抽取样本所得观测值提供的信息;
  4. 先验信息,在试验前人们对要做的问题在经验上和资料上所了解的信息。
  5. 贝叶斯统计的基本观点 任一未知量 都可看作随机变量,用一个概率分布来描述 是最好的办法,在获得样本以前这个分布称为先验分布;在获得样本以后,这个分布称为后验分布。
  6. 贝叶斯公式的密度函数形式
  7. 总体依赖于参数 的概率函数在贝叶斯统计中记为 ,它表示在随机变量 取某个给定值时总体的条件概率函数;
  8. 根据参数 的先验信息设法确定先验分布
  9. 从贝叶斯观点看,样本 的产生分两步进行。首先从先验分布 产生一个样本 ,然后从 中产生一组样本。这时样本的联合条件概率函数为

这个分布综合了总体信息和样本信息;

  1. 是不可知的,它是按先验分布 产生的。为把先验信息综合进去,不能只考虑 ,对 的其他值发生的可能性也要加以考虑,故要用 进行综合。这样一来,样本 和参数 的联合分布为

这个联合分布把总体信息、样本信息和先验信息三种可用信息都综合进去了;

  1. 分析的目的是要对未知参数 作统计推断。在没有样本信息时,人们只能依据先验分布对 作出推断;在有了样本观测值 之后,则应依据 作出推断。由于

其中

的边际概率函数,它与 无关,不含 的任何信息。因此能用来对 作出推断的仅是条件分布 ,它的计算公式是

这个条件分布称为 的后验分布,它集中了总体、样本和先验中有关 的一切信息。后验分布 的计算公式就是用密度函数表示的贝叶斯公式。它是用总体和样本对先验分布 作调整的结果,贝叶斯统计的一切推断都基于后验分布进行。

  1. 贝叶斯估计 基于后验分布 所作的贝叶斯估计有多种,常用有如下三种:
  2. 使用后验分布的密度函数最大值作为 的点估计,称为最大后验估计;
  3. 使用后验分布的中位数作为 的点估计,称为后验中位数估计;
  4. 使用后验分布的均值作为 的点估计,称为后验期望估计。这是使用最为频繁的贝叶斯估计。

在不注明的情况下,通常提到的贝叶斯估计指后验期望估计。

  1. 共轭先验分布 是总体分布中的参数, 是其先验分布,若对任意的样本观测值得到的后验分布 属于同一个分布族,则称该分布族是 的共轭先验分布(族)。
  2. 二项分布 中的成功概率 的共轭先验分布是贝塔分布
  3. 泊松分布 中的均值 的共轭先验分布是伽马分布
  4. 在方差已知时,正态均值 的共轭先验分布是正态分布
  5. 在均值已知时,正态方差 的共轭先验分布是倒伽马分布 (若 ,则 的分布称为倒伽马分布 )。
  6. 超参数 先验分布中的未知参数称为超参数。应尽力对各种先验信息进行加工,获得超参数的估计。

习题与解答 6.5

习题 6.5-1

设一箱产品中的不合格品个数服从泊松分布 有两个可能取值:,且先验分布为

现检查了一箱产品,发现有 个不合格品,试求 的后验分布。

因此

由以上结果我们可以得到 的后验分布

习题 6.5-2

设总体为均匀分布 的先验分布是均匀分布 。现有三个观测值:。求 的后验分布。

,即

时, 的联合分布为

其中 。此处观测值为

它位于区间 内,故后验密度函数为

的后验分布为

习题 6.5-3

是来自几何分布的样本,总体分布列为

的先验分布是均匀分布

  1. 的后验分布;
  2. 次观测值为 ,求 的贝叶斯估计。

**(1)**样本和 的联合密度函数为

于是

因此, 的后验分布为

**(2)**当有观测值为 时, 的后验分布为

采用后验期望估计,则有

习题 6.5-4

验证:泊松分布的均值 的共轭先验分布是伽马分布。

泊松分布的概率函数为

的先验分布为伽马分布 ,其密度函数为

对来自泊松分布 的样本 的后验分布为

的后验分布为

仍为伽马分布,这说明伽马分布是泊松分布的均值 的共轭先验分布。

习题 6.5-5

验证:正态总体方差(均值已知)的共轭先验分布是倒伽马分布(称 服从倒伽马分布,如果 服从伽马分布)。

设总体 ,其中 已知, 为其样本,取 的先验分布为倒伽马分布 ,其密度函数为

的后验分布为

这就证明了倒伽马分布是正态总体方差(均值已知)的共轭先验分布。

习题 6.5-6

是来自如下总体的一个样本

  1. 的先验分布为均匀分布 ,求 的后验分布;
  2. 的先验分布为 ,求 的后验分布。

的联合密度函数为

**(1)**对先验分布 ,当 时,后验分布为

**(2)**对该先验分布,当 时,后验分布为

习题 6.5-7

是来自如下总体的一个样本

若取 的先验分布为伽马分布,即 ,求 的后验期望估计。

的联合分布为

于是 的后验分布为

这是一个伽马分布

因而 的后验期望估计为

习题 6.5-8

是来自均匀分布 的样本, 的先验分布是帕雷托分布,其密度函数为

其中 是两个已知的常数。

  1. 验证:帕雷托分布是 的共轭先验分布;
  2. 的贝叶斯估计。

(1) 的联合分布为

要使 同时成立,必须 ,所以 的后验分布为

这是一个参数为 的帕雷托分布,因此帕雷托分布是 的共轭先验分布。

**(2)**若选用后验期望估计,则

习题 6.5-9

设指数分布 中未知参数 的先验分布为伽马分布 ,现从先验信息得知:先验均值为 ,先验标准差为 ,试确定先验分布。

由于伽马分布 的均值和方差分别为 ,由已知条件,可建立如下方程组

解之得

所以 的先验分布为伽马分布

习题 6.5-10

为来自如下幂级数分布的样本,总体分布密度为

证明:

  1. 已知,则 的共轭先验分布为帕雷托分布;
  2. 已知,则 的共轭先验分布为伽马分布。

**(1)**当 已知时,不妨取

其中 都已知,常记为 。则在给出样本 的后验分布密度函数为

其中

因此,

所以当 已知时帕雷托分布为 的共轭先验分布。

**(2)**当 已知时,不妨取

其中 都已知。则给出样本

的后验分布密度函数

这说明

证明完成。

习题 6.5-11

某人每天早上在汽车站等公共汽车的时间(单位:)服从均匀分布 ,其中 未知,假设 的先验分布为

假如此人在三个早上等车的时间分别为 ,求 的后验分布。

的联合分布为

此处 ,所以 的联合分布为

于是 的后验分布为

习题 6.5-12

从正态总体 中随机抽取容量为 的样本,又设 的先验分布为正态分布,证明:不管先验分布的标准差为多少,后验分布的标准差一定小于

的先验分布为 ,由其共轭先验可知, 的后验分布仍为正态分布

其中

由于 ,所以

故,不管先验分布的标准差为多少,后验分布的标准差一定小于

习题 6.5-13

设随机变量 服从负二项分布,其概率分布为

证明其成功概率 的共轭先验分布族为贝塔分布族。

取成功概率 的先验分布为 ,则 的联合分布为

所以,

即成功概率 的后验分布为

故成功概率 的共轭先验分布族为贝塔分布族。

习题 6.5-14

从一批产品中抽检 个,发现 个不合格,假定该产品不合格品率 的先验分布为贝塔分布 ,求 的后验分布。

根据不合格品率 的共轭先验可知, 的后验分布为

这里 ,所以, 的后验分布为

补充习题及解答

补充习题 15

服从多项分布 ,其概率函数为

其中 为参数,。若 的先验分布为狄利克雷(Dirichlet)分布,即

其中 ,记 ,并把这一分布记作 。证明: 的后验分布为狄利克雷分布

因为 的后验概率函数为

所以 的后验分布服从 Dirichlet 分布 ,其中

补充习题 16

是来自正态分布 的一个样本,令 ,又设 的联合先验分布如下给定:,在固定 时, 的条件分布为

其中 已知。

求:

(1) 的后验分布为

(2) 的后验边际分布;

(3) 给定条件下 的后验边际分布。

(1) 的先验分布为

的联合分布为

所以, 的后验分布为

(2) 对 关于 求积分,则

据此可知,

(3) 由

可得,

据此可知,

这说明该先验分布为 的共轭先验分布。