§6.5 贝叶斯估计

依赖于

无显式依赖

被以下题目直接调用

正文部分

§6.5 贝叶斯估计

贝叶斯统计推断使用的三种信息
总体信息，总体分布或总体所属分布族提供的信息；
样本信息，从总体中抽取样本所得观测值提供的信息；
先验信息，在试验前人们对要做的问题在经验上和资料上所了解的信息。
贝叶斯统计的基本观点 任一未知量 $θ$ 都可看作随机变量，用一个概率分布来描述 $θ$ 是最好的办法，在获得样本以前这个分布称为先验分布；在获得样本以后，这个分布称为后验分布。
贝叶斯公式的密度函数形式
总体依赖于参数 $θ$ 的概率函数在贝叶斯统计中记为 $p (x ∣ θ)$ ，它表示在随机变量 $θ$ 取某个给定值时总体的条件概率函数；
根据参数 $θ$ 的先验信息设法确定先验分布 $π (θ)$ ；
从贝叶斯观点看，样本 $x_{1}, x_{2}, \dots, x_{n}$ 的产生分两步进行。首先从先验分布 $π (θ)$ 产生一个样本 $θ_{0}$ ，然后从 $p (x_{1}, x_{2}, \dots, x_{n} ∣ θ_{0})$ 中产生一组样本。这时样本的联合条件概率函数为

p (x_{1}, x_{2}, \dots, x_{n} ∣ θ_{0}) = i = 1 \prod n p (x_{i} ∣ θ_{0}),

这个分布综合了总体信息和样本信息；

$θ_{0}$ 是不可知的，它是按先验分布 $π (θ)$ 产生的。为把先验信息综合进去，不能只考虑 $θ_{0}$ ，对 $θ$ 的其他值发生的可能性也要加以考虑，故要用 $π (θ)$ 进行综合。这样一来，样本 $x_{1}, x_{2}, \dots, x_{n}$ 和参数 $θ$ 的联合分布为

h (x_{1}, x_{2}, \dots, x_{n}, θ) = p (x_{1}, x_{2}, \dots, x_{n} ∣ θ) \cdot π (θ),

这个联合分布把总体信息、样本信息和先验信息三种可用信息都综合进去了；

分析的目的是要对未知参数 $θ$ 作统计推断。在没有样本信息时，人们只能依据先验分布对 $θ$ 作出推断；在有了样本观测值 $x_{1}, x_{2}, \dots, x_{n}$ 之后，则应依据 $h (x_{1}, x_{2}, \dots, x_{n}, θ)$ 对 $θ$ 作出推断。由于

h (x_{1}, x_{2}, \dots, x_{n}, θ) = π (θ ∣ x_{1}, x_{2}, \dots, x_{n}) m (x_{1}, x_{2}, \dots, x_{n}),

其中

m (x_{1}, x_{2}, \dots, x_{n}) = \int_{Θ} h (x_{1}, x_{2}, \dots, x_{n}, θ) d θ = \int_{Θ} p (x_{1}, x_{2}, \dots, x_{n} ∣ θ) π (θ) d θ

是 $x_{1}, x_{2}, \dots, x_{n}$ 的边际概率函数，它与 $θ$ 无关，不含 $θ$ 的任何信息。因此能用来对 $θ$ 作出推断的仅是条件分布 $π (θ ∣ x_{1}, x_{2}, \dots, x_{n})$ ，它的计算公式是

π (θ ∣ x_{1}, x_{2}, \dots, x_{n}) = \frac{h ( x _{1} , x _{2} , \dots , x _{n} , θ )}{m ( x _{1} , x _{2} , \dots , x _{n} )} = \frac{p ( x _{1} , x _{2} , \dots , x _{n} ∣ θ ) π ( θ )}{\int _{Θ} p ( x _{1} , x _{2} , \dots , x _{n} ∣ θ ) π ( θ ) d θ} .

这个条件分布称为 $θ$ 的后验分布，它集中了总体、样本和先验中有关 $θ$ 的一切信息。后验分布 $π (θ ∣ x_{1}, x_{2}, \dots, x_{n})$ 的计算公式就是用密度函数表示的贝叶斯公式。它是用总体和样本对先验分布 $π (θ)$ 作调整的结果，贝叶斯统计的一切推断都基于后验分布进行。

贝叶斯估计 基于后验分布 $π (θ ∣ x_{1}, x_{2}, \dots, x_{n})$ 对 $θ$ 所作的贝叶斯估计有多种，常用有如下三种：
使用后验分布的密度函数最大值作为 $θ$ 的点估计，称为最大后验估计；
使用后验分布的中位数作为 $θ$ 的点估计，称为后验中位数估计；
使用后验分布的均值作为 $θ$ 的点估计，称为后验期望估计。这是使用最为频繁的贝叶斯估计。

在不注明的情况下，通常提到的贝叶斯估计指后验期望估计。

共轭先验分布 设 $θ$ 是总体分布中的参数， $π (θ)$ 是其先验分布，若对任意的样本观测值得到的后验分布 $π (θ ∣ X)$ 与 $π (θ)$ 属于同一个分布族，则称该分布族是 $θ$ 的共轭先验分布（族）。
二项分布 $b (n, θ)$ 中的成功概率 $θ$ 的共轭先验分布是贝塔分布 $B e (a, b)$ ；
泊松分布 $P (θ)$ 中的均值 $θ$ 的共轭先验分布是伽马分布 $G a (α, λ)$ ；
在方差已知时，正态均值 $θ$ 的共轭先验分布是正态分布 $N (μ, τ^{2})$ ；
在均值已知时，正态方差 $σ^{2}$ 的共轭先验分布是倒伽马分布 $I G a (α, λ)$ （若 $X \sim G a (α, λ)$ ，则 $X^{- 1}$ 的分布称为倒伽马分布 $I G a (α, λ)$ ）。
超参数 先验分布中的未知参数称为超参数。应尽力对各种先验信息进行加工，获得超参数的估计。

习题与解答 6.5

习题 6.5-1

设一箱产品中的不合格品个数服从泊松分布 $P (λ)$ ， $λ$ 有两个可能取值： $1.5$ 和 $1.8$ ，且先验分布为
$P (λ = 1.5) = 0.45, P (λ = 1.8) = 0.55,$
现检查了一箱产品，发现有 $3$ 个不合格品，试求 $λ$ 的后验分布。

解

P (X = 3 ∣ λ = 1.5) = \frac{1. 5 ^{3}}{3 !} e^{- 1.5}, P (X = 3 ∣ λ = 1.8) = \frac{1. 8 ^{3}}{3 !} e^{- 1.8},

因此

P (X = 3) = P (X = 3 ∣ λ = 1.5) P (λ = 1.5) + P (X = 3 ∣ λ = 1.8) P (λ = 1.8)

= \frac{1.51875 e ^{- 1.5} + 3.2076 e ^{- 1.8}}{6} .

由以上结果我们可以得到 $λ$ 的后验分布

P (λ = 1.5 ∣ X = 3) = \frac{P ( X = 3 ∣ λ = 1.5 ) P ( λ = 1.5 )}{P ( X = 3 )} = \frac{1.51875 e ^{- 1.5}}{1.51875 e ^{- 1.5} + 3.2076 e ^{- 1.8}} = 0.3899,

P (λ = 1.8 ∣ X = 3) = 1 - 0.3899 = 0.6101.

习题 6.5-2

设总体为均匀分布 $U (θ, θ + 1)$ ， $θ$ 的先验分布是均匀分布 $U (10, 16)$ 。现有三个观测值： $11.7, 12.1, 12.0$ 。求 $θ$ 的后验分布。

解当 $θ < x_{i} < θ + 1$ ， $i = 1, 2, 3$ ， $10 < θ < 16$ ，即

10 < θ < x_{(1)} < x_{(3)} < θ + 1

时， $x_{1}, x_{2}, x_{3}, θ$ 的联合分布为

h (x_{1}, x_{2}, x_{3}, θ) = p (x_{1}, x_{2}, x_{3} ∣ θ) π (θ) = \frac{1}{6},

其中 $θ < x_{(1)} < x_{(3)} < θ + 1$ 或 $x_{(3)} - 1 < θ < x_{(1)}$ 。此处观测值为 $x_{(1)} = 11.7$ ， $x_{(3)} = 12.1$ ，

11.1 < θ < 11.7,

它位于区间 $(10, 16)$ 内，故后验密度函数为

π (θ ∣ x_{1}, x_{2}, x_{3}) = \frac{h ( x _{1} , x _{2} , x _{3} , θ )}{\int _{11.1}^{11.7} h ( x _{1} , x _{2} , x _{3} , θ ) d θ} = \frac{1/6}{\int _{11.1}^{11.7} ( 1/6 ) d θ} = \frac{1}{0.6},

即 $θ$ 的后验分布为

U (11.1, 11.7) .

习题 6.5-3

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自几何分布的样本，总体分布列为
$P (X = k ∣ θ) = θ (1 - θ)^{k}, k = 0, 1, 2, \dots,$
$θ$ 的先验分布是均匀分布 $U (0, 1)$ 。

求 $θ$ 的后验分布；

若 $4$ 次观测值为 $4, 3, 1, 6$ ，求 $θ$ 的贝叶斯估计。

解 **（1）**样本和 $θ$ 的联合密度函数为

h (x_{1}, x_{2}, \dots, x_{n}, θ) = θ^{n} (1 - θ)^{\sum_{i = 1}^{n} x_{i}},

于是

π (θ ∣ x_{1}, x_{2}, \dots, x_{n}) = \frac{h ( x _{1} , x _{2} , \dots , x _{n} , θ )}{\int _{0}^{1} h ( x _{1} , x _{2} , \dots , x _{n} , θ ) d θ} = \frac{θ ^{n} ( 1 - θ ) ^{\sum_{i = 1}^{n} x_{i}}}{\int _{0}^{1} θ ^{n} ( 1 - θ ) ^{\sum_{i = 1}^{n} x_{i}} d θ}

= \frac{Γ ( n + \sum _{i = 1}^{n} x _{i} + 2 )}{Γ ( n + 1 ) Γ ( \sum _{i = 1}^{n} x _{i} + 1 )} θ^{n} (1 - θ)^{\sum_{i = 1}^{n} x_{i}},

因此， $θ$ 的后验分布为

B e (n + 1, i = 1 \sum n x_{i} + 1) .

**（2）**当有观测值为 $4, 3, 1, 6$ 时， $θ$ 的后验分布为

B e (5, 15),

采用后验期望估计，则有

\hat{θ}_{B} = \frac{5}{5 + 15} = 0.25.

习题 6.5-4

验证：泊松分布的均值 $λ$ 的共轭先验分布是伽马分布。

解泊松分布的概率函数为

P (X = x ∣ λ) = \frac{λ ^{x}}{x !} e^{- λ},

若 $λ$ 的先验分布为伽马分布 $G a (α, β)$ ，其密度函数为

π (λ) = \frac{β ^{α}}{Γ ( α )} λ^{α - 1} e^{- β λ},

对来自泊松分布 $P (λ)$ 的样本 $x_{1}, x_{2}, \dots, x_{n}$ ， $λ$ 的后验分布为

π (λ ∣ x_{1}, x_{2}, \dots, x_{n}) = \frac{( \prod _{i = 1}^{n} \frac{λ ^{x_{i}}}{x _{i} !} e ^{- λ} ) \cdot \frac{β ^{α}}{Γ ( α )} λ ^{α - 1} e ^{- β λ}}{\int _{0}^{\infty} ( \prod _{i = 1}^{n} \frac{λ ^{x_{i}}}{x _{i} !} e ^{- λ} ) \cdot \frac{β ^{α}}{Γ ( α )} λ ^{α - 1} e ^{- β λ} d λ}

= \frac{λ ^{\sum_{i = 1}^{n} x_{i} + α - 1} e ^{- (β + n) λ}}{\int _{0}^{\infty} λ ^{\sum_{i = 1}^{n} x_{i} + α - 1} e ^{- (β + n) λ} d λ}

= \frac{( β + n ) ^{\sum_{i = 1}^{n} x_{i} + α}}{Γ ( \sum _{i = 1}^{n} x _{i} + α )} λ^{\sum_{i = 1}^{n} x_{i} + α - 1} e^{- (β + n) λ},

即 $λ$ 的后验分布为

G a (i = 1 \sum n x_{i} + α, β + n),

仍为伽马分布，这说明伽马分布是泊松分布的均值 $λ$ 的共轭先验分布。

习题 6.5-5

验证：正态总体方差（均值已知）的共轭先验分布是倒伽马分布（称 $X$ 服从倒伽马分布，如果 $1/ x$ 服从伽马分布）。

解设总体 $X ∣ σ^{2} \sim N (μ_{0}, σ^{2})$ ，其中 $μ_{0}$ 已知， $x_{1}, x_{2}, \dots, x_{n}$ 为其样本，取 $σ^{2}$ 的先验分布为倒伽马分布 $I G a (α, λ)$ ，其密度函数为

π (σ^{2}) = \frac{λ ^{α}}{Γ ( α )} (\frac{1}{σ ^{2}})^{α + 1} e^{- λ / σ^{2}}, σ^{2} > 0,

则 $σ^{2}$ 的后验分布为

π (σ^{2} ∣ x_{1}, x_{2}, \dots, x_{n}) = \frac{p ( x _{1} , x _{2} , \dots , x _{n} ∣ σ ^{2} ) \cdot π ( σ ^{2} )}{\int _{0}^{\infty} p ( x _{1} , x _{2} , \dots , x _{n} ∣ σ ^{2} ) \cdot π ( σ ^{2} ) d σ ^{2}}

= \frac{( 2 π σ ^{2} ) ^{- n /2} exp { - \frac{1}{2 σ ^{2}} \sum _{i = 1}^{n} ( x _{i} - μ _{0} ) ^{2} } \cdot \frac{λ ^{α}}{Γ ( α )} ( \frac{1}{σ ^{2}} ) ^{α + 1} e ^{- λ / σ^{2}}}{\int _{0}^{\infty} ( 2 π σ ^{2} ) ^{- n /2} exp { - \frac{1}{2 σ ^{2}} \sum _{i = 1}^{n} ( x _{i} - μ _{0} ) ^{2} } \cdot \frac{λ ^{α}}{Γ ( α )} ( \frac{1}{σ ^{2}} ) ^{α + 1} e ^{- λ / σ^{2}} d σ ^{2}}

= \frac{( \frac{1}{σ ^{2}} ) ^{α + \frac{n}{2} + 1} exp { - \frac{1}{σ ^{2}} [ λ + \frac{1}{2} \sum _{i = 1}^{n} ( x _{i} - μ _{0} ) ^{2} ] }}{\int _{0}^{\infty} ( \frac{1}{σ ^{2}} ) ^{α + \frac{n}{2} + 1} exp { - \frac{1}{σ ^{2}} [ λ + \frac{1}{2} \sum _{i = 1}^{n} ( x _{i} - μ _{0} ) ^{2} ] } d σ ^{2}}

= \frac{[ λ + \frac{1}{2} \sum _{i = 1}^{n} ( x _{i} - μ _{0} ) ^{2} ] ^{α + \frac{n}{2}}}{Γ ( α + \frac{n}{2} )} (\frac{1}{σ ^{2}})^{α + \frac{n}{2} + 1} exp {- \frac{1}{σ ^{2}} [λ + \frac{1}{2} i = 1 \sum n (x_{i} - μ_{0})^{2}]},

即

σ^{2} ∣ x_{1}, x_{2}, \dots, x_{n} \sim I G a (α + \frac{n}{2}, λ + \frac{1}{2} i = 1 \sum n (x_{i} - μ_{0})^{2}),

这就证明了倒伽马分布是正态总体方差（均值已知）的共轭先验分布。

习题 6.5-6

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自如下总体的一个样本
$p (x ∣ θ) = \frac{2 x}{θ ^{2}}, 0 < x < θ .$

若 $θ$ 的先验分布为均匀分布 $U (0, 1)$ ，求 $θ$ 的后验分布；

若 $θ$ 的先验分布为 $π (θ) = 3 θ^{2}$ ， $0 < θ < 1$ ，求 $θ$ 的后验分布。

解 $x_{1}, x_{2}, \dots, x_{n}$ 的联合密度函数为

p (x_{1}, x_{2}, \dots, x_{n} ∣ θ) = \frac{2 ^{n}}{θ ^{2 n}} i = 1 \prod n x_{i} I_{{x_{(n)} < θ}} .

**（1）**对先验分布 $U (0, 1)$ ，当 $x_{(n)} < θ < 1$ 时，后验分布为

π (θ ∣ x_{1}, x_{2}, \dots, x_{n}) = \frac{θ ^{- 2 n}}{\int _{x_{(n)}}^{1} θ ^{- 2 n} d θ} = \frac{2 n - 1}{θ ^{2 n} ( x _{(n)}^{- 2 n + 1} - 1 )} .

**（2）**对该先验分布，当 $x_{(n)} < θ < 1$ 时，后验分布为

π (θ ∣ x_{1}, x_{2}, \dots, x_{n}) = \frac{θ ^{- 2 n + 2}}{\int _{x_{(n)}}^{1} θ ^{- 2 n + 2} d θ} = \frac{2 n - 3}{θ ^{2 n - 2} ( x _{(n)}^{- 2 n + 3} - 1 )} .

习题 6.5-7

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自如下总体的一个样本
$p (x ∣ θ) = θ x^{θ - 1}, 0 < x < 1.$
若取 $θ$ 的先验分布为伽马分布，即 $θ \sim G a (α, λ)$ ，求 $θ$ 的后验期望估计。

解 $x_{1}, x_{2}, \dots, x_{n}$ 与 $θ$ 的联合分布为

h (x_{1}, x_{2}, \dots, x_{n}, θ) = θ^{n} i = 1 \prod n x_{i}^{θ - 1} \cdot \frac{λ ^{α}}{Γ ( α )} θ^{α - 1} e^{- λ θ} = \frac{λ ^{α}}{Γ ( α )} θ^{n + α - 1} exp {- θ (λ - i = 1 \sum n ln x_{i})} i = 1 \prod n x_{i}^{- 1} .

于是 $θ$ 的后验分布为

π (θ ∣ x_{1}, x_{2}, \dots, x_{n}) = \frac{h ( x _{1} , x _{2} , \dots , x _{n} , θ )}{\int h ( x _{1} , x _{2} , \dots , x _{n} , θ ) d θ}

= \frac{( λ - \sum _{i = 1}^{n} ln x _{i} ) ^{n + α}}{Γ ( n + α )} θ^{n + α - 1} exp {- θ (λ - i = 1 \sum n ln x_{i})},

这是一个伽马分布

G a (n + α, λ - i = 1 \sum n ln x_{i}),

因而 $θ$ 的后验期望估计为

\hat{θ}_{B} = \frac{n + α}{λ - \sum _{i = 1}^{n} ln x _{i}} .

习题 6.5-8

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自均匀分布 $U (0, θ)$ 的样本， $θ$ 的先验分布是帕雷托分布，其密度函数为
$π (θ) = \frac{β θ _{0}^{β}}{θ ^{β + 1}}, θ > θ_{0},$
其中 $β, θ_{0}$ 是两个已知的常数。

验证：帕雷托分布是 $θ$ 的共轭先验分布；

求 $θ$ 的贝叶斯估计。

解 （1） $x_{1}, x_{2}, \dots, x_{n}$ 与 $θ$ 的联合分布为

h (x_{1}, x_{2}, \dots, x_{n}, θ) = \frac{1}{θ ^{n}} \cdot \frac{β θ _{0}^{β}}{θ ^{β + 1}}, θ > θ_{0}, x_{(n)} < θ .

要使 $θ > θ_{0}$ 与 $θ > x_{(n)}$ 同时成立，必须 $θ > max {x_{(n)}, θ_{0}}$ ，所以 $θ$ 的后验分布为

π (θ ∣ x_{1}, x_{2}, \dots, x_{n}) = \frac{\frac{1}{θ ^{n}} \cdot \frac{β θ _{0}^{β}}{θ ^{β + 1}}}{\int _{m a x {x_{(n)}, θ_{0}}}^{\infty} \frac{1}{θ ^{n}} \cdot \frac{β θ _{0}^{β}}{θ ^{β + 1}} d θ} = \frac{\frac{1}{θ ^{n + β + 1}}}{\int _{m a x {x_{(n)}, θ_{0}}}^{\infty} \frac{1}{θ ^{n + β + 1}} d θ}

= \frac{( n + β ) [ max { x _{(n)} , θ _{0} } ] ^{n + β}}{θ ^{n + β + 1}}, θ > max {x_{(n)}, θ_{0}} .

这是一个参数为 $n + β + 1$ 与 $max {x_{(n)}, θ_{0}}$ 的帕雷托分布，因此帕雷托分布是 $θ$ 的共轭先验分布。

**（2）**若选用后验期望估计，则

\hat{θ}_{B} = \int θ \cdot π (θ ∣ x_{1}, x_{2}, \dots, x_{n}) d θ = \int_{m a x {x_{(n)}, θ_{0}}}^{\infty} \frac{( n + β ) [ max { x _{(n)} , θ _{0} } ] ^{n + β}}{θ ^{n + β}} d θ

= \frac{( n + β ) max { x _{(n)} , θ _{0} }}{n + β - 1} .

习题 6.5-9

设指数分布 $E x p (θ)$ 中未知参数 $θ$ 的先验分布为伽马分布 $G a (α, λ)$ ，现从先验信息得知：先验均值为 $0.0002$ ，先验标准差为 $0.01$ ，试确定先验分布。

解由于伽马分布 $G a (α, λ)$ 的均值和方差分别为 $α / λ, α / λ^{2}$ ，由已知条件，可建立如下方程组

⎩ ⎨ ⎧ \frac{α}{λ} = 0.0002, \frac{α}{λ ^{2}} = 0.01,

解之得

{α = 0.0004, λ = 2,

所以 $θ$ 的先验分布为伽马分布 $G a (0.0004, 2)$ 。

习题 6.5-10

设 $x_{1}, x_{2}, \dots, x_{n}$ 为来自如下幂级数分布的样本，总体分布密度为
$p (x; c, θ) = c x^{c - 1} θ^{- c} I_{{0 \leq x \leq θ}} (c > 0, θ > 0),$
证明：

若 $c$ 已知，则 $θ$ 的共轭先验分布为帕雷托分布；

若 $θ$ 已知，则 $c$ 的共轭先验分布为伽马分布。

解 **（1）**当 $c$ 已知时，不妨取

π (θ) = α μ^{α} θ^{- (α + 1)} I_{{θ \geq μ}},

其中 $α \geq 1$ 和 $μ > 0$ 都已知，常记为 $P A (α, μ)$ 。则在给出样本 $x = (x_{1}, x_{2}, \dots, x_{n})$ 后 $θ$ 的后验分布密度函数为

π (θ ∣ x) = \frac{p ( x ∣ θ ) π ( θ )}{\int _{0}^{\infty} p ( x ∣ θ ) π ( θ ) d θ}

= \frac{c ^{n} ( \prod _{i = 1}^{n} x _{i} ) ^{c - 1} θ ^{- n c} I _{{θ \geq x_{(n)}}} \cdot α μ ^{α} θ ^{- (1 + α)} I _{{θ \geq μ}}}{\int _{0}^{\infty} c ^{n} ( \prod _{i = 1}^{n} x _{i} ) ^{c - 1} θ ^{- n c} I _{{θ \geq x_{(n)}}} \cdot α μ ^{α} θ ^{- (1 + α)} I _{{θ \geq μ}} d θ}

= \frac{θ ^{- n c} \cdot θ ^{- (1 + α)} I _{{θ \geq θ_{0}}}}{\int _{0}^{\infty} θ ^{- n c} \cdot θ ^{- (1 + α)} d θ} = (n c + α) θ_{0}^{n c + α} θ^{- (n c + α + 1)} I_{{θ \geq θ_{0}}},

其中

θ_{0} = max {x_{(n)}, μ} .

因此，

π (θ ∣ x) \sim P A (n c + α, θ_{0}),

所以当 $c$ 已知时帕雷托分布为 $θ$ 的共轭先验分布。

**（2）**当 $θ$ 已知时，不妨取

π (c) = \frac{λ ^{α}}{Γ ( α )} e^{- λ c} c^{α - 1} I_{{c > 0}},

其中 $α > 0, λ > 0$ 都已知。则给出样本

x = (x_{1}, x_{2}, \dots, x_{n})

后 $c$ 的后验分布密度函数

π (c ∣ x) = \frac{p ( x ∣ c ) π ( c )}{\int _{0}^{\infty} p ( x ∣ c ) π ( c ) d c}

= \frac{c ^{n} ( \prod _{i = 1}^{n} x _{i} ) ^{c - 1} θ ^{- n c} \cdot e ^{- λ c} c ^{α - 1}}{\int _{0}^{\infty} c ^{n} ( \prod _{i = 1}^{n} x _{i} ) ^{c - 1} θ ^{- n c} \cdot e ^{- λ c} c ^{α - 1} d c}

= \frac{( λ - \sum _{i = 1}^{n} ( ln x _{i} - ln θ ) ) ^{n + α}}{Γ ( n + α )} c^{n + α - 1} exp {- c [λ - i = 1 \sum n (ln x_{i} - ln θ)]} .

这说明

c ∣ x \sim G a (n + α, λ - i = 1 \sum n (ln x_{i} - ln θ)),

证明完成。

习题 6.5-11

某人每天早上在汽车站等公共汽车的时间（单位： $min$ ）服从均匀分布 $U (0, θ)$ ，其中 $θ$ 未知，假设 $θ$ 的先验分布为
$π (θ) = {192/ θ^{4}, 0, θ \geq 4, θ < 4,$
假如此人在三个早上等车的时间分别为 $5 min, 3 min, 8 min$ ，求 $θ$ 的后验分布。

解 $x_{1}, x_{2}, \dots, x_{n}$ 与 $θ$ 的联合分布为

h (x_{1}, x_{2}, \dots, x_{n}, θ) = θ^{- n} \frac{192}{θ ^{4}}, 0 < x_{(1)} < x_{(n)} < θ, θ \geq 4,

此处 $x_{(1)} = 3, x_{(3)} = 8$ ，所以 $x_{1}, x_{2}, x_{3}$ 与 $θ$ 的联合分布为

h (x_{1}, x_{2}, x_{3}, θ) = 192 θ^{- 3 - 4}, θ > 8,

于是 $θ$ 的后验分布为

π (θ ∣ x_{1}, x_{2}, x_{3}) = \frac{192 θ ^{- 3 - 4}}{\int _{8}^{\infty} 192 θ ^{- 3 - 4} d θ} = 6 \times 8^{6} θ^{- 7} = 1572864 θ^{- 7}, θ > 8.

习题 6.5-12

从正态总体 $N (θ, 2^{2})$ 中随机抽取容量为 $100$ 的样本，又设 $θ$ 的先验分布为正态分布，证明：不管先验分布的标准差为多少，后验分布的标准差一定小于 $1/5$ 。

解设 $θ$ 的先验分布为 $N (μ, τ^{2})$ ，由其共轭先验可知， $θ$ 的后验分布仍为正态分布

N (a, σ^{2}),

其中

a = \frac{n x ˉ /4 + μ τ ^{- 2}}{n /4 + τ ^{- 2}}, σ^{2} = \frac{1}{n /4 + τ ^{- 2}} .

由于 $n = 100$ ，所以

σ^{2} = \frac{1}{25 + τ ^{- 2}} < \frac{1}{25},

故，不管先验分布的标准差为多少，后验分布的标准差一定小于 $1/5$ 。

习题 6.5-13

设随机变量 $X$ 服从负二项分布，其概率分布为
$f (x ∣ p) = (k - 1 x - 1) p^{k} (1 - p)^{x - k}, x = k, k + 1, \dots .$
证明其成功概率 $p$ 的共轭先验分布族为贝塔分布族。

解取成功概率 $p$ 的先验分布为 $B e (a, b)$ ， $a > 0, b > 0$ ，则 $x_{1}, x_{2}, \dots, x_{n}$ 与 $p$ 的联合分布为

h (x_{1}, x_{2}, \dots, x_{n}; p) = i = 1 \prod n (k - 1 x _{i} - 1) p^{nk} (1 - p)^{\sum_{i = 1}^{n} x_{i} - nk} \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} p^{a - 1} (1 - p)^{b - 1},

所以，

m (x_{1}, x_{2}, \dots, x_{n}) = \int_{0}^{1} h (x_{1}, x_{2}, \dots, x_{n}; p) d p

= i = 1 \prod n (k - 1 x _{i} - 1) \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} \frac{Γ ( nk + a ) Γ ( \sum _{i = 1}^{n} x _{i} - nk + b )}{Γ ( \sum _{i = 1}^{n} x _{i} + a + b )},

π (p ∣ x_{1}, x_{2}, \dots, x_{n}) = \frac{h ( x _{1} , x _{2} , \dots , x _{n} ; p )}{m ( x _{1} , x _{2} , \dots , x _{n} )}

= \frac{Γ ( \sum _{i = 1}^{n} x _{i} + a + b )}{Γ ( nk + a ) Γ ( \sum _{i = 1}^{n} x _{i} - nk + b )} p^{nk + a - 1} (1 - p)^{\sum_{i = 1}^{n} x_{i} - nk + b - 1} .

即成功概率 $p$ 的后验分布为

B e (nk + a, i = 1 \sum n x_{i} - nk + b),

故成功概率 $p$ 的共轭先验分布族为贝塔分布族。

习题 6.5-14

从一批产品中抽检 $100$ 个，发现 $3$ 个不合格，假定该产品不合格品率 $θ$ 的先验分布为贝塔分布 $B e (2, 200)$ ，求 $θ$ 的后验分布。

解根据不合格品率 $θ$ 的共轭先验可知， $θ$ 的后验分布为

B e (x + 2, n - x + 200) .

这里 $n = 100$ ， $x = 3$ ，所以， $θ$ 的后验分布为 $Be (5, 297)$ 。

补充习题及解答

补充习题 15

设 $x = (x_{1}, x_{2}, \dots, x_{k})$ 服从多项分布 $M (n, θ)$ ，其概率函数为
$p (x; θ) = \frac{n !}{x _{1} ! x _{2} ! \dots x _{k} !} θ_{1}^{x_{1}} θ_{2}^{x_{2}} \dots θ_{k}^{x_{k}},$
其中 $θ = (θ_{1}, θ_{2}, \dots, θ_{k})$ 为参数， $\sum_{i = 1}^{k} θ_{i} = 1$ ， $\sum_{i = 1}^{k} x_{i} = n$ 。若 $θ = (θ_{1}, θ_{2}, \dots, θ_{k})$ 的先验分布为狄利克雷（Dirichlet）分布，即
$π (θ) = \frac{Γ ( α _{0} )}{\prod _{i = 1}^{k} Γ ( α _{i} )} i = 1 \prod k θ_{i}^{α_{i} - 1}, (0 \leq θ_{i} \leq 1, 1 \leq i \leq k),$
其中 $α_{i} > 0$ ， $i = 1, 2, \dots, k$ ； $\sum_{i = 1}^{k} α_{i} = α_{0}$ ，记 $α = (α_{1}, α_{2}, \dots, α_{k})$ ，并把这一分布记作 $D (α)$ 。证明： $θ$ 的后验分布为狄利克雷分布 $D (α + x)$ 。

解因为 $θ$ 的后验概率函数为

π (θ ∣ x) = c (x) \cdot \frac{n !}{x _{1} ! x _{2} ! \dots x _{k} !} i = 1 \prod k θ_{i}^{x_{i}} \cdot \frac{Γ ( α _{0} )}{\prod _{i = 1}^{k} Γ ( α _{i} )} i = 1 \prod k θ_{i}^{α_{i} - 1} = c^{*} (x) i = 1 \prod k θ_{i}^{α_{i} + x_{i} - 1},

所以 $θ$ 的后验分布服从 Dirichlet 分布 $D (α + x)$ ，其中

α + x = (α_{1} + x_{1}, α_{2} + x_{2}, \dots, α_{k} + x_{k}) .

补充习题 16

设 $x_{1}, x_{2}, \dots, x_{n}$ 是来自正态分布 $N (θ_{1}, σ^{2})$ 的一个样本，令 $θ_{2} = \frac{1}{2 σ ^{2}}$ ，又设 $(θ_{1}, θ_{2})$ 的联合先验分布如下给定： $θ_{2} \sim G a (α, λ)$ ，在固定 $θ_{2}$ 时， $θ_{1}$ 的条件分布为
$N (0, \frac{1}{2 θ _{2}}),$
其中 $α, λ$ 已知。

求：

(1) $(θ_{1}, θ_{2})$ 的后验分布为 $π (θ_{1}, θ_{2} ∣ x_{1}, x_{2}, \dots, x_{n})$ ；

(2) $θ_{2}$ 的后验边际分布；

(3) $θ_{2}$ 给定条件下 $θ_{1}$ 的后验边际分布。

解 (1) $(θ_{1}, θ_{2})$ 的先验分布为

π (θ_{1}, θ_{2}) = π (θ_{1} ∣ θ_{2}) π (θ_{2}) = \frac{2 θ _{2}}{2 π} exp {- θ_{2} θ_{1}^{2}} \cdot \frac{λ ^{α}}{Γ ( α )} θ_{2}^{α - 1} exp {- λ θ_{2}} = \frac{1}{π} \frac{λ ^{α}}{Γ ( α )} θ_{2}^{α + \frac{1}{2} - 1} exp {- (λ + θ_{1}^{2}) θ_{2}} .

$x_{1}, x_{2}, \dots, x_{n}$ 与 $(θ_{1}, θ_{2})$ 的联合分布为

h (x_{1}, x_{2}, \dots, x_{n}; θ_{1}, θ_{2}) = p (x_{1}, x_{2}, \dots, x_{n} ∣ θ_{1}, θ_{2}) π (θ_{1}, θ_{2}) = (\frac{θ _{2}}{π})^{n} exp {- θ_{2} i = 1 \sum n (x_{i} - θ_{1})^{2}} \cdot \frac{1}{π} \frac{λ ^{α}}{Γ ( α )} θ_{2}^{α + \frac{1}{2} - 1} exp {- (λ + θ_{1}^{2}) θ_{2}} = (\frac{1}{π})^{n + 1} \frac{λ ^{α}}{Γ ( α )} θ_{2}^{α + \frac{1 + n}{2} - 1} exp {- [(n + 1) θ_{1}^{2} - 2 θ_{1} i = 1 \sum n x_{i} + λ + i = 1 \sum n x_{i}^{2}] θ_{2}} .

所以， $(θ_{1}, θ_{2})$ 的后验分布为

π (θ_{1}, θ_{2} ∣ x_{1}, x_{2}, \dots, x_{n}) = c (x_{1}, x_{2}, \dots, x_{n}) θ_{2}^{α + \frac{1 + n}{2} - 1} exp {- [(n + 1) θ_{1}^{2} - 2 θ_{1} i = 1 \sum n x_{i} + λ + i = 1 \sum n x_{i}^{2}] θ_{2}} .

(2) 对 $π (θ_{1}, θ_{2} ∣ x_{1}, x_{2}, \dots, x_{n})$ 关于 $θ_{1}$ 求积分，则

π (θ_{2} ∣ x_{1}, x_{2}, \dots, x_{n}) = c (x_{1}, x_{2}, \dots, x_{n}) θ_{2}^{α + \frac{1 + n}{2} - 1} exp {- (λ + i = 1 \sum n x_{i}^{2}) θ_{2}} \times \int_{- \infty}^{\infty} exp {- [(n + 1) θ_{1}^{2} - 2 θ_{1} i = 1 \sum n x_{i}] θ_{2}} d θ_{1} = c_{1} (x_{1}, x_{2}, \dots, x_{n}) θ_{2}^{α + \frac{n}{2} - 1} exp {- (λ + i = 1 \sum n x_{i}^{2} - \frac{( n x ˉ ) ^{2}}{n + 1}) θ_{2}} .

据此可知，

θ_{2} ∣ x_{1}, x_{2}, \dots, x_{n} \sim G a (α + \frac{n}{2}, λ + i = 1 \sum n x_{i}^{2} - \frac{( n x ˉ ) ^{2}}{n + 1}) .

(3) 由

π (θ_{1} ∣ θ_{2}, x_{1}, x_{2}, \dots, x_{n}) = \frac{π ( θ _{1} , θ _{2} ∣ x _{1} , x _{2} , \dots , x _{n} )}{π ( θ _{2} ∣ x _{1} , x _{2} , \dots , x _{n} )}

可得，

π (θ_{1} ∣ θ_{2}, x_{1}, x_{2}, \dots, x_{n}) = c_{2} (x_{1}, x_{2}, \dots, x_{n}) exp {- θ_{2} (n + 1) (θ_{1} - \frac{n x ˉ}{n + 1})^{2}} .

据此可知，

θ_{1} ∣ θ_{2}, x_{1}, x_{2}, \dots, x_{n} \sim N (\frac{n x ˉ}{n + 1}, \frac{1}{2 θ _{2} ( n + 1 )}) .

这说明该先验分布为 $(θ_{1}, θ_{2})$ 的共轭先验分布。

群知识库

AI 找笔记

Explorer

6.5 贝叶斯估计

§6.5 贝叶斯估计

依赖于

被以下题目直接调用

正文部分

§6.5 贝叶斯估计

习题与解答 6.5

补充习题及解答

评论

Graph View

目录

反向链接