§6.5 贝叶斯估计
依赖于
被以下题目直接调用
正文部分
§6.5 贝叶斯估计
- 贝叶斯统计推断使用的三种信息
- 总体信息,总体分布或总体所属分布族提供的信息;
- 样本信息,从总体中抽取样本所得观测值提供的信息;
- 先验信息,在试验前人们对要做的问题在经验上和资料上所了解的信息。
- 贝叶斯统计的基本观点 任一未知量 θ 都可看作随机变量,用一个概率分布来描述 θ 是最好的办法,在获得样本以前这个分布称为先验分布;在获得样本以后,这个分布称为后验分布。
- 贝叶斯公式的密度函数形式
- 总体依赖于参数 θ 的概率函数在贝叶斯统计中记为 p(x∣θ),它表示在随机变量 θ 取某个给定值时总体的条件概率函数;
- 根据参数 θ 的先验信息设法确定先验分布 π(θ);
- 从贝叶斯观点看,样本 x1,x2,⋯,xn 的产生分两步进行。首先从先验分布 π(θ) 产生一个样本 θ0,然后从 p(x1,x2,⋯,xn∣θ0) 中产生一组样本。这时样本的联合条件概率函数为
p(x1,x2,⋯,xn∣θ0)=i=1∏np(xi∣θ0),
这个分布综合了总体信息和样本信息;
- θ0 是不可知的,它是按先验分布 π(θ) 产生的。为把先验信息综合进去,不能只考虑 θ0,对 θ 的其他值发生的可能性也要加以考虑,故要用 π(θ) 进行综合。这样一来,样本 x1,x2,⋯,xn 和参数 θ 的联合分布为
h(x1,x2,⋯,xn,θ)=p(x1,x2,⋯,xn∣θ)⋅π(θ),
这个联合分布把总体信息、样本信息和先验信息三种可用信息都综合进去了;
- 分析的目的是要对未知参数 θ 作统计推断。在没有样本信息时,人们只能依据先验分布对 θ 作出推断;在有了样本观测值 x1,x2,⋯,xn 之后,则应依据 h(x1,x2,⋯,xn,θ) 对 θ 作出推断。由于
h(x1,x2,⋯,xn,θ)=π(θ∣x1,x2,⋯,xn)m(x1,x2,⋯,xn),
其中
m(x1,x2,⋯,xn)=∫Θh(x1,x2,⋯,xn,θ)dθ=∫Θp(x1,x2,⋯,xn∣θ)π(θ)dθ
是 x1,x2,⋯,xn 的边际概率函数,它与 θ 无关,不含 θ 的任何信息。因此能用来对 θ 作出推断的仅是条件分布 π(θ∣x1,x2,⋯,xn),它的计算公式是
π(θ∣x1,x2,⋯,xn)=m(x1,x2,⋯,xn)h(x1,x2,⋯,xn,θ)=∫Θp(x1,x2,⋯,xn∣θ)π(θ)dθp(x1,x2,⋯,xn∣θ)π(θ).
这个条件分布称为 θ 的后验分布,它集中了总体、样本和先验中有关 θ 的一切信息。后验分布 π(θ∣x1,x2,⋯,xn) 的计算公式就是用密度函数表示的贝叶斯公式。它是用总体和样本对先验分布 π(θ) 作调整的结果,贝叶斯统计的一切推断都基于后验分布进行。
- 贝叶斯估计 基于后验分布 π(θ∣x1,x2,⋯,xn) 对 θ 所作的贝叶斯估计有多种,常用有如下三种:
- 使用后验分布的密度函数最大值作为 θ 的点估计,称为最大后验估计;
- 使用后验分布的中位数作为 θ 的点估计,称为后验中位数估计;
- 使用后验分布的均值作为 θ 的点估计,称为后验期望估计。这是使用最为频繁的贝叶斯估计。
在不注明的情况下,通常提到的贝叶斯估计指后验期望估计。
- 共轭先验分布 设 θ 是总体分布中的参数,π(θ) 是其先验分布,若对任意的样本观测值得到的后验分布 π(θ∣X) 与 π(θ) 属于同一个分布族,则称该分布族是 θ 的共轭先验分布(族)。
- 二项分布 b(n,θ) 中的成功概率 θ 的共轭先验分布是贝塔分布 Be(a,b);
- 泊松分布 P(θ) 中的均值 θ 的共轭先验分布是伽马分布 Ga(α,λ);
- 在方差已知时,正态均值 θ 的共轭先验分布是正态分布 N(μ,τ2);
- 在均值已知时,正态方差 σ2 的共轭先验分布是倒伽马分布 IGa(α,λ)(若 X∼Ga(α,λ),则 X−1 的分布称为倒伽马分布 IGa(α,λ))。
- 超参数 先验分布中的未知参数称为超参数。应尽力对各种先验信息进行加工,获得超参数的估计。
习题与解答 6.5
设一箱产品中的不合格品个数服从泊松分布 P(λ),λ 有两个可能取值:1.5 和 1.8,且先验分布为
P(λ=1.5)=0.45,P(λ=1.8)=0.55,
现检查了一箱产品,发现有 3 个不合格品,试求 λ 的后验分布。
解
P(X=3∣λ=1.5)=3!1.53e−1.5,P(X=3∣λ=1.8)=3!1.83e−1.8,
因此
P(X=3)=P(X=3∣λ=1.5)P(λ=1.5)+P(X=3∣λ=1.8)P(λ=1.8)
=61.51875e−1.5+3.2076e−1.8.
由以上结果我们可以得到 λ 的后验分布
P(λ=1.5∣X=3)=P(X=3)P(X=3∣λ=1.5)P(λ=1.5)=1.51875e−1.5+3.2076e−1.81.51875e−1.5=0.3899,
P(λ=1.8∣X=3)=1−0.3899=0.6101.
设总体为均匀分布 U(θ,θ+1),θ 的先验分布是均匀分布 U(10,16)。现有三个观测值:11.7,12.1,12.0。求 θ 的后验分布。
解
当 θ<xi<θ+1,i=1,2,3,10<θ<16,即
10<θ<x(1)<x(3)<θ+1
时,x1,x2,x3,θ 的联合分布为
h(x1,x2,x3,θ)=p(x1,x2,x3∣θ)π(θ)=61,
其中 θ<x(1)<x(3)<θ+1 或 x(3)−1<θ<x(1)。此处观测值为 x(1)=11.7,x(3)=12.1,
11.1<θ<11.7,
它位于区间 (10,16) 内,故后验密度函数为
π(θ∣x1,x2,x3)=∫11.111.7h(x1,x2,x3,θ)dθh(x1,x2,x3,θ)=∫11.111.7(1/6)dθ1/6=0.61,
即 θ 的后验分布为
U(11.1,11.7).
设 x1,x2,⋯,xn 是来自几何分布的样本,总体分布列为
P(X=k∣θ)=θ(1−θ)k,k=0,1,2,⋯,
θ 的先验分布是均匀分布 U(0,1)。
- 求 θ 的后验分布;
- 若 4 次观测值为 4,3,1,6,求 θ 的贝叶斯估计。
解
**(1)**样本和 θ 的联合密度函数为
h(x1,x2,⋯,xn,θ)=θn(1−θ)∑i=1nxi,
于是
π(θ∣x1,x2,⋯,xn)=∫01h(x1,x2,⋯,xn,θ)dθh(x1,x2,⋯,xn,θ)=∫01θn(1−θ)∑i=1nxidθθn(1−θ)∑i=1nxi
=Γ(n+1)Γ(∑i=1nxi+1)Γ(n+∑i=1nxi+2)θn(1−θ)∑i=1nxi,
因此,θ 的后验分布为
Be(n+1,i=1∑nxi+1).
**(2)**当有观测值为 4,3,1,6 时,θ 的后验分布为
Be(5,15),
采用后验期望估计,则有
θ^B=5+155=0.25.
验证:泊松分布的均值 λ 的共轭先验分布是伽马分布。
解
泊松分布的概率函数为
P(X=x∣λ)=x!λxe−λ,
若 λ 的先验分布为伽马分布 Ga(α,β),其密度函数为
π(λ)=Γ(α)βαλα−1e−βλ,
对来自泊松分布 P(λ) 的样本 x1,x2,⋯,xn,λ 的后验分布为
π(λ∣x1,x2,⋯,xn)=∫0∞(∏i=1nxi!λxie−λ)⋅Γ(α)βαλα−1e−βλdλ(∏i=1nxi!λxie−λ)⋅Γ(α)βαλα−1e−βλ
=∫0∞λ∑i=1nxi+α−1e−(β+n)λdλλ∑i=1nxi+α−1e−(β+n)λ
=Γ(∑i=1nxi+α)(β+n)∑i=1nxi+αλ∑i=1nxi+α−1e−(β+n)λ,
即 λ 的后验分布为
Ga(i=1∑nxi+α,β+n),
仍为伽马分布,这说明伽马分布是泊松分布的均值 λ 的共轭先验分布。
验证:正态总体方差(均值已知)的共轭先验分布是倒伽马分布(称 X 服从倒伽马分布,如果 1/x 服从伽马分布)。
解
设总体 X∣σ2∼N(μ0,σ2),其中 μ0 已知,x1,x2,⋯,xn 为其样本,取 σ2 的先验分布为倒伽马分布 IGa(α,λ),其密度函数为
π(σ2)=Γ(α)λα(σ21)α+1e−λ/σ2,σ2>0,
则 σ2 的后验分布为
π(σ2∣x1,x2,⋯,xn)=∫0∞p(x1,x2,⋯,xn∣σ2)⋅π(σ2)dσ2p(x1,x2,⋯,xn∣σ2)⋅π(σ2)
=∫0∞(2πσ2)−n/2exp{−2σ21∑i=1n(xi−μ0)2}⋅Γ(α)λα(σ21)α+1e−λ/σ2dσ2(2πσ2)−n/2exp{−2σ21∑i=1n(xi−μ0)2}⋅Γ(α)λα(σ21)α+1e−λ/σ2
=∫0∞(σ21)α+2n+1exp{−σ21[λ+21∑i=1n(xi−μ0)2]}dσ2(σ21)α+2n+1exp{−σ21[λ+21∑i=1n(xi−μ0)2]}
=Γ(α+2n)[λ+21∑i=1n(xi−μ0)2]α+2n(σ21)α+2n+1exp{−σ21[λ+21i=1∑n(xi−μ0)2]},
即
σ2∣x1,x2,⋯,xn∼IGa(α+2n,λ+21i=1∑n(xi−μ0)2),
这就证明了倒伽马分布是正态总体方差(均值已知)的共轭先验分布。
设 x1,x2,⋯,xn 是来自如下总体的一个样本
p(x∣θ)=θ22x,0<x<θ.
- 若 θ 的先验分布为均匀分布 U(0,1),求 θ 的后验分布;
- 若 θ 的先验分布为 π(θ)=3θ2,0<θ<1,求 θ 的后验分布。
解
x1,x2,⋯,xn 的联合密度函数为
p(x1,x2,⋯,xn∣θ)=θ2n2ni=1∏nxiI{x(n)<θ}.
**(1)**对先验分布 U(0,1),当 x(n)<θ<1 时,后验分布为
π(θ∣x1,x2,⋯,xn)=∫x(n)1θ−2ndθθ−2n=θ2n(x(n)−2n+1−1)2n−1.
**(2)**对该先验分布,当 x(n)<θ<1 时,后验分布为
π(θ∣x1,x2,⋯,xn)=∫x(n)1θ−2n+2dθθ−2n+2=θ2n−2(x(n)−2n+3−1)2n−3.
设 x1,x2,⋯,xn 是来自如下总体的一个样本
p(x∣θ)=θxθ−1,0<x<1.
若取 θ 的先验分布为伽马分布,即 θ∼Ga(α,λ),求 θ 的后验期望估计。
解
x1,x2,⋯,xn 与 θ 的联合分布为
h(x1,x2,⋯,xn,θ)=θni=1∏nxiθ−1⋅Γ(α)λαθα−1e−λθ=Γ(α)λαθn+α−1exp{−θ(λ−i=1∑nlnxi)}i=1∏nxi−1.
于是 θ 的后验分布为
π(θ∣x1,x2,⋯,xn)=∫h(x1,x2,⋯,xn,θ)dθh(x1,x2,⋯,xn,θ)
=Γ(n+α)(λ−∑i=1nlnxi)n+αθn+α−1exp{−θ(λ−i=1∑nlnxi)},
这是一个伽马分布
Ga(n+α,λ−i=1∑nlnxi),
因而 θ 的后验期望估计为
θ^B=λ−∑i=1nlnxin+α.
设 x1,x2,⋯,xn 是来自均匀分布 U(0,θ) 的样本,θ 的先验分布是帕雷托分布,其密度函数为
π(θ)=θβ+1βθ0β,θ>θ0,
其中 β,θ0 是两个已知的常数。
- 验证:帕雷托分布是 θ 的共轭先验分布;
- 求 θ 的贝叶斯估计。
解
(1)x1,x2,⋯,xn 与 θ 的联合分布为
h(x1,x2,⋯,xn,θ)=θn1⋅θβ+1βθ0β,θ>θ0, x(n)<θ.
要使 θ>θ0 与 θ>x(n) 同时成立,必须 θ>max{x(n),θ0},所以 θ 的后验分布为
π(θ∣x1,x2,⋯,xn)=∫max{x(n),θ0}∞θn1⋅θβ+1βθ0βdθθn1⋅θβ+1βθ0β=∫max{x(n),θ0}∞θn+β+11dθθn+β+11
=θn+β+1(n+β)[max{x(n),θ0}]n+β,θ>max{x(n),θ0}.
这是一个参数为 n+β+1 与 max{x(n),θ0} 的帕雷托分布,因此帕雷托分布是 θ 的共轭先验分布。
**(2)**若选用后验期望估计,则
θ^B=∫θ⋅π(θ∣x1,x2,⋯,xn)dθ=∫max{x(n),θ0}∞θn+β(n+β)[max{x(n),θ0}]n+βdθ
=n+β−1(n+β)max{x(n),θ0}.
设指数分布 Exp(θ) 中未知参数 θ 的先验分布为伽马分布 Ga(α,λ),现从先验信息得知:先验均值为 0.0002,先验标准差为 0.01,试确定先验分布。
解
由于伽马分布 Ga(α,λ) 的均值和方差分别为 α/λ,α/λ2,由已知条件,可建立如下方程组
⎩⎨⎧λα=0.0002,λ2α=0.01,
解之得
{α=0.0004,λ=2,
所以 θ 的先验分布为伽马分布 Ga(0.0004,2)。
设 x1,x2,⋯,xn 为来自如下幂级数分布的样本,总体分布密度为
p(x;c,θ)=cxc−1θ−cI{0≤x≤θ}(c>0,θ>0),
证明:
- 若 c 已知,则 θ 的共轭先验分布为帕雷托分布;
- 若 θ 已知,则 c 的共轭先验分布为伽马分布。
解
**(1)**当 c 已知时,不妨取
π(θ)=αμαθ−(α+1)I{θ≥μ},
其中 α≥1 和 μ>0 都已知,常记为 PA(α,μ)。则在给出样本 x=(x1,x2,⋯,xn) 后 θ 的后验分布密度函数为
π(θ∣x)=∫0∞p(x∣θ)π(θ)dθp(x∣θ)π(θ)
=∫0∞cn(∏i=1nxi)c−1θ−ncI{θ≥x(n)}⋅αμαθ−(1+α)I{θ≥μ}dθcn(∏i=1nxi)c−1θ−ncI{θ≥x(n)}⋅αμαθ−(1+α)I{θ≥μ}
=∫0∞θ−nc⋅θ−(1+α)dθθ−nc⋅θ−(1+α)I{θ≥θ0}=(nc+α)θ0nc+αθ−(nc+α+1)I{θ≥θ0},
其中
θ0=max{x(n),μ}.
因此,
π(θ∣x)∼PA(nc+α,θ0),
所以当 c 已知时帕雷托分布为 θ 的共轭先验分布。
**(2)**当 θ 已知时,不妨取
π(c)=Γ(α)λαe−λccα−1I{c>0},
其中 α>0,λ>0 都已知。则给出样本
x=(x1,x2,⋯,xn)
后 c 的后验分布密度函数
π(c∣x)=∫0∞p(x∣c)π(c)dcp(x∣c)π(c)
=∫0∞cn(∏i=1nxi)c−1θ−nc⋅e−λccα−1dccn(∏i=1nxi)c−1θ−nc⋅e−λccα−1
=Γ(n+α)(λ−∑i=1n(lnxi−lnθ))n+αcn+α−1exp{−c[λ−i=1∑n(lnxi−lnθ)]}.
这说明
c∣x∼Ga(n+α,λ−i=1∑n(lnxi−lnθ)),
证明完成。
某人每天早上在汽车站等公共汽车的时间(单位:min)服从均匀分布 U(0,θ),其中 θ 未知,假设 θ 的先验分布为
π(θ)={192/θ4,0,θ≥4,θ<4,
假如此人在三个早上等车的时间分别为 5 min,3 min,8 min,求 θ 的后验分布。
解
x1,x2,⋯,xn 与 θ 的联合分布为
h(x1,x2,⋯,xn,θ)=θ−nθ4192,0<x(1)<x(n)<θ, θ≥4,
此处 x(1)=3,x(3)=8,所以 x1,x2,x3 与 θ 的联合分布为
h(x1,x2,x3,θ)=192θ−3−4,θ>8,
于是 θ 的后验分布为
π(θ∣x1,x2,x3)=∫8∞192θ−3−4dθ192θ−3−4=6×86θ−7=1572864θ−7,θ>8.
从正态总体 N(θ,22) 中随机抽取容量为 100 的样本,又设 θ 的先验分布为正态分布,证明:不管先验分布的标准差为多少,后验分布的标准差一定小于 1/5。
解
设 θ 的先验分布为 N(μ,τ2),由其共轭先验可知,θ 的后验分布仍为正态分布
N(a,σ2),
其中
a=n/4+τ−2nxˉ/4+μτ−2,σ2=n/4+τ−21.
由于 n=100,所以
σ2=25+τ−21<251,
故,不管先验分布的标准差为多少,后验分布的标准差一定小于 1/5。
设随机变量 X 服从负二项分布,其概率分布为
f(x∣p)=(k−1x−1)pk(1−p)x−k,x=k,k+1,⋯.
证明其成功概率 p 的共轭先验分布族为贝塔分布族。
解
取成功概率 p 的先验分布为 Be(a,b),a>0,b>0,则 x1,x2,⋯,xn 与 p 的联合分布为
h(x1,x2,⋯,xn;p)=i=1∏n(k−1xi−1)pnk(1−p)∑i=1nxi−nkΓ(a)Γ(b)Γ(a+b)pa−1(1−p)b−1,
所以,
m(x1,x2,⋯,xn)=∫01h(x1,x2,⋯,xn;p)dp
=i=1∏n(k−1xi−1)Γ(a)Γ(b)Γ(a+b)Γ(∑i=1nxi+a+b)Γ(nk+a)Γ(∑i=1nxi−nk+b),
π(p∣x1,x2,⋯,xn)=m(x1,x2,⋯,xn)h(x1,x2,⋯,xn;p)
=Γ(nk+a)Γ(∑i=1nxi−nk+b)Γ(∑i=1nxi+a+b)pnk+a−1(1−p)∑i=1nxi−nk+b−1.
即成功概率 p 的后验分布为
Be(nk+a,i=1∑nxi−nk+b),
故成功概率 p 的共轭先验分布族为贝塔分布族。
从一批产品中抽检 100 个,发现 3 个不合格,假定该产品不合格品率 θ 的先验分布为贝塔分布 Be(2,200),求 θ 的后验分布。
解
根据不合格品率 θ 的共轭先验可知,θ 的后验分布为
Be(x+2,n−x+200).
这里 n=100,x=3,所以,θ 的后验分布为 Be(5,297)。
补充习题及解答
设 x=(x1,x2,…,xk) 服从多项分布 M(n,θ),其概率函数为
p(x;θ)=x1!x2!⋯xk!n!θ1x1θ2x2⋯θkxk,
其中 θ=(θ1,θ2,…,θk) 为参数,∑i=1kθi=1,∑i=1kxi=n。若 θ=(θ1,θ2,…,θk) 的先验分布为狄利克雷(Dirichlet)分布,即
π(θ)=∏i=1kΓ(αi)Γ(α0)i=1∏kθiαi−1,(0≤θi≤1, 1≤i≤k),
其中 αi>0,i=1,2,…,k;∑i=1kαi=α0,记 α=(α1,α2,…,αk),并把这一分布记作 D(α)。证明:θ 的后验分布为狄利克雷分布 D(α+x)。
解
因为 θ 的后验概率函数为
π(θ∣x)=c(x)⋅x1!x2!⋯xk!n!i=1∏kθixi⋅∏i=1kΓ(αi)Γ(α0)i=1∏kθiαi−1=c∗(x)i=1∏kθiαi+xi−1,
所以 θ 的后验分布服从 Dirichlet 分布 D(α+x),其中
α+x=(α1+x1,α2+x2,…,αk+xk).
设 x1,x2,…,xn 是来自正态分布 N(θ1,σ2) 的一个样本,令 θ2=2σ21,又设 (θ1,θ2) 的联合先验分布如下给定:θ2∼Ga(α,λ),在固定 θ2 时,θ1 的条件分布为
N(0,2θ21),
其中 α,λ 已知。
求:
(1) (θ1,θ2) 的后验分布为 π(θ1,θ2∣x1,x2,…,xn);
(2) θ2 的后验边际分布;
(3) θ2 给定条件下 θ1 的后验边际分布。
解
(1) (θ1,θ2) 的先验分布为
π(θ1,θ2)=π(θ1∣θ2)π(θ2)=2π2θ2exp{−θ2θ12}⋅Γ(α)λαθ2α−1exp{−λθ2}=π1Γ(α)λαθ2α+21−1exp{−(λ+θ12)θ2}.
x1,x2,…,xn 与 (θ1,θ2) 的联合分布为
h(x1,x2,…,xn;θ1,θ2)=p(x1,x2,…,xn∣θ1,θ2)π(θ1,θ2)=(πθ2)nexp{−θ2i=1∑n(xi−θ1)2}⋅π1Γ(α)λαθ2α+21−1exp{−(λ+θ12)θ2}=(π1)n+1Γ(α)λαθ2α+21+n−1exp{−[(n+1)θ12−2θ1i=1∑nxi+λ+i=1∑nxi2]θ2}.
所以,(θ1,θ2) 的后验分布为
π(θ1,θ2∣x1,x2,…,xn)=c(x1,x2,…,xn)θ2α+21+n−1exp{−[(n+1)θ12−2θ1i=1∑nxi+λ+i=1∑nxi2]θ2}.
(2) 对 π(θ1,θ2∣x1,x2,…,xn) 关于 θ1 求积分,则
π(θ2∣x1,x2,…,xn)=c(x1,x2,…,xn)θ2α+21+n−1exp{−(λ+i=1∑nxi2)θ2}×∫−∞∞exp{−[(n+1)θ12−2θ1i=1∑nxi]θ2}dθ1=c1(x1,x2,…,xn)θ2α+2n−1exp{−(λ+i=1∑nxi2−n+1(nxˉ)2)θ2}.
据此可知,
θ2∣x1,x2,…,xn∼Ga(α+2n,λ+i=1∑nxi2−n+1(nxˉ)2).
(3) 由
π(θ1∣θ2,x1,x2,…,xn)=π(θ2∣x1,x2,…,xn)π(θ1,θ2∣x1,x2,…,xn)
可得,
π(θ1∣θ2,x1,x2,…,xn)=c2(x1,x2,…,xn)exp{−θ2(n+1)(θ1−n+1nxˉ)2}.
据此可知,
θ1∣θ2,x1,x2,…,xn∼N(n+1nxˉ,2θ2(n+1)1).
这说明该先验分布为 (θ1,θ2) 的共轭先验分布。
评论
支持 Markdown 和 LaTeX 数学公式。