§4.4 中心极限定理
依赖于
被以下题目直接调用
正文部分
§4.4 中心极限定理
1. 中心极限定理 研究独立随机变量和的极限分布在什么条件下为正态分布的问题。
2. 林德伯格-莱维中心极限定理 设 {Xn} 是独立同分布的随机变量序列,且 E(Xi)=μ, \Var(Xi)=σ2>0。记
Yn∗=σnX1+X2+⋯+Xn−nμ,
则对任意实数 y,有
n→∞limP(Yn∗≤y)=Φ(y)=2π1∫−∞ye−t2/2dt.
3. 二项分布的正态近似
**(1)**棣莫弗-拉普拉斯中心极限定理 设 n 重伯努利试验中,事件 A 在每次试验中出现的概率为 p (0<p<1),记 Sn 为 n 次试验中事件 A 出现的次数,且记
Yn∗=np(1−p)Sn−np.
则对任意实数 y,有
n→∞limP(Yn∗≤y)=Φ(y)=2π1∫−∞ye−t2/2dt.
**(2)**近似中的修正 因为二项分布是离散分布,而正态分布是连续分布,所以用正态分布作为二项分布的近似计算中,作些修正可以提高精度。若 k1<k2 均为整数,一般先作如下修正后再用正态近似
P(k1≤Sn≤k2)=P(k1−0.5<Sn<k2+0.5)
=Φ(np(1−p)k2+0.5−np)−Φ(np(1−p)k1−0.5−np).
4. 三类近似计算问题 若记 β=Φ(y),则由棣莫弗-拉普拉斯中心极限定理给出的近似式
P(Yn∗≤y)≈Φ(y)=β
可用来解决三类计算问题:
- 已知 n,y 求 β(求概率);
- 已知 n,β 求 y(求分位数);
- 已知 y,β 求 n(求样本量)。
5. 独立不同分布下的中心极限定理 设 {Xn} 为独立随机变量序列,且 E(Xi)=μi, \Var(Xi)=σi2, i=1,2,⋯,记
Yn=i=1∑nXi,Bn=\Var(Yn)=σ12+σ22+⋯+σn2.
**(1)**林德伯格条件 若诸 Xi 为连续随机变量,其密度函数为 pi(x),对任意的 τ>0,称
n→∞limτ2Bn21i=1∑n∫∣x−μi∣>τBn(x−μi)2pi(x)dx=0
为林德伯格条件。
**(2)**林德伯格中心极限定理 设独立随机变量序列 {Xn} 满足林德伯格条件,则对任意的 x,有
n→∞limP(Bn1i=1∑n(Xi−μi)≤x)=2π1∫−∞xe−t2/2dt.
**(3)**假如独立随机变量序列 {Xn} 具有同分布和方差有限的条件,则必定满足林德伯格条件,即林德伯格-莱维中心极限定理是林德伯格中心极限定理的特例。
**(4)**李雅普诺夫中心极限定理 设 {Xn} 为独立随机变量序列,若存在 δ>0,满足
n→∞limBn2+δ1i=1∑nE(∣Xi−μi∣2+δ)=0,
则对任意的 x,有
n→∞limP[Bn1i=1∑n(Xi−μi)≤x]=2π1∫−∞xe−t2/2dt.
习题与解答 4.4
某保险公司多年的统计资料表明,在索赔户中被盗索赔户占 20%,以 X 表示在随意抽查的 100 个索赔户中因被盗向保险公司索赔的户数。
- 写出 X 的分布列;
- 求被盗索赔户不少于 14 户且不多于 30 户的概率的近似值。
解
(1)X 服从 n=100,p=0.2 的二项分布 b(100,0.2),即
P(X=k)=(k100)0.2k0.8100−k,k=0,1,2,⋯,100.
**(2)**利用棣莫弗-拉普拉斯中心极限定理,有
P(14≤X≤30)=P(13.5<X<30.5)≈Φ(100×0.2×0.830.5−100×0.2)−Φ(100×0.2×0.813.5−100×0.2)=Φ(2.625)−Φ(−1.625)=Φ(2.625)−1+Φ(1.625)=0.99565−1+0.948=0.9437.
这表明:被盗索赔户在 14 与 30 户之间的概率近似为 0.9437。
某电子计算机主机有 100 个终端,每个终端有 80% 的时间被使用。若各个终端是否被使用是相互独立的,试求至少有 15 个终端空闲的概率。
解
记 X 为 100 个终端中被使用的终端个数,则
X∼b(100,0.8).
利用棣莫弗-拉普拉斯中心极限定理,所求概率为
P(X≤85)=P(X<85.5)≈Φ(100×0.8×0.285.5−100×0.8)=Φ(1.375)=0.9155.
这表明至少有 15 个终端空闲的概率近似为 0.9155。
有一批建筑房屋用的木柱,其中 80% 的长度不小于 3 m,现从这批木柱中随机地取出 100 根,问其中至少有 30 根短于 3 m 的概率是多少?
解
记 X 为 100 根木柱中长度不小于 3 m 的根数,则
X∼b(100,0.8).
利用棣莫弗-拉普拉斯中心极限定理,所求概率为
P(X≤70)=P(X<70.5)≈Φ(100×0.8×0.270.5−100×0.8)=1−Φ(2.375)=0.0088.
掷一颗骰子 100 次,记第 i 次掷出的点数为 Xi, i=1,2,⋯,100,点数之平均为
X=1001i=1∑100Xi,
试求概率 P(3≤X≤4)。
解
由题意可得
E(Xi)=3.5,\Var(Xi)=1235,E(X)=3.5,\Var(X)=2407.
利用林德伯格-莱维中心极限定理,可得
P(3≤X≤4)≈Φ(7/2404−3.5)−Φ(7/2403−3.5)=2Φ(2.9277)−1=0.9966.
这表明:掷 100 次骰子点数之平均在 3 到 4 之间的概率近似为 0.9966,很接近于 1。
连续地掷一颗骰子 80 次,求点数之和超过 300 的概率。
解
记 Xi 为第 i 次投掷时出现的点数,i=1,2,⋯,80,则 P(Xi=k)=1/6, k=1,2,3,4,5,6,且
E(Xi)=27,\Var(Xi)=1235.
由林德伯格-莱维中心极限定理,所求概率为
P(i=1∑80Xi>300)≈1−Φ(80×35/12300−80×7/2)=1−Φ(1.309)=0.096.
有 10 个灯泡,设每个灯泡的寿命服从指数分布,其平均寿命为 60 天。每次用一个灯泡,当使用的灯泡坏了以后立即换上一个新的,求这些灯泡总共可使用 450 天以上的概率。
解
记 Xi 为第 i 个灯泡的寿命(单位:天),i=1,2,⋯,10,则 Xi∼Exp(1/60),且
E(Xi)=60,\Var(Xi)=602.
由林德伯格-莱维中心极限定理,所求概率为
P(i=1∑10Xi>450)≈1−Φ(10×602450−60×10)=Φ(0.79)=0.7852.
设 X1,X2,⋯,X48 为独立同分布的随机变量,共同分布为 U(0,5)。其算术平均为
X=481i=1∑48Xi,
试求概率 P(2≤X≤3)。
解
由均匀分布 U(0,5) 可算得
E(Xi)=2.5,\Var(Xi)=1225,E(X)=2.5,\Var(X)=12×4825.
利用林德伯格-莱维中心极限定理,可得
P(2≤X≤3)≈Φ(5/243−2.5)−Φ(5/242−2.5)=2Φ(2.4)−1=0.9836.
这表明:来自均匀分布 U(0,5) 的 48 个随机数的平均在 2 到 3 之间的概率近似为 0.9836,较接近于 1。
某汽车销售点每天出售的汽车数服从参数为 λ=2 的泊松分布。若一年 365 天都经营汽车销售,且每天出售的汽车数是相互独立的,求一年中售出 700 辆以上汽车的概率。
解
记 Xi 为第 i 天出售的汽车辆数,则
Y=X1+X2+⋯+X365
为一年的总销量。由
E(Xi)=\Var(Xi)=2,
知
E(Y)=\Var(Y)=365×2=730.
利用林德伯格-莱维中心极限定理,可得
P(Y>700)=1−P(Y≤700)≈1−Φ(730700−730)=1−Φ(−1.11)=0.8665.
这表明:该销售点一年售出 700 辆以上汽车的概率近似为 0.8665。
某餐厅每天接待 400 名顾客,设每位顾客的消费额(单位:元)服从 (20,100) 上的均匀分布,且顾客的消费额是相互独立的。试求:
- 该餐厅每天的平均营业额;
- 该餐厅每天的营业额在平均营业额 ±760 元内的概率。
解
记 Xi 为第 i 位顾客的消费额,则
Xi∼U(20,100),
所以
E(Xi)=60,\Var(Xi)=31600.
而该餐厅每天的营业额为
Y=i=1∑400Xi.
**(1)**该餐厅每天的平均营业额为
E(Y)=i=1∑400E(Xi)=400×60=24000(元).
**(2)**利用林德伯格-莱维中心极限定理,可得
P(−760<Y−24000<760)≈2Φ(400×1600/3760)−1
=2Φ(1.645)−1=0.90.
这表明:该餐厅每天营业额在 23240 到 24760 元之间的概率近似为 0.90。
一仪器同时收到 50 个信号,其中第 i 个信号的长度为 Ui, i=1,2,⋯,50。设 Ui 是相互独立的,且都服从 (0,10) 内的均匀分布,试求
P(i=1∑50Ui>300).
解
因为
E(Ui)=5,\Var(Ui)=325.
所以
E(i=1∑50Ui)=250,\Var(i=1∑50Ui)=31250.
利用林德伯格-莱维中心极限定理,可得
P(i=1∑50Ui>300)≈1−Φ(1250/3300−250)=1−Φ(2.45)
=1−0.9929=0.0071.
这表明:50 个信号长度之和超过 300 的概率近似为 0.0071。
计算机在进行加法运算时对每个加数取整数(取最为接近它的整数)。设所有的取整误差是相互独立的,且它们都服从 (−0.5,0.5) 上的均匀分布。
- 若将 1500 个数相加,求误差总和的绝对值超过 15 的概率;
- 最多几个数加在一起可使得误差总和的绝对值小于 10 的概率不小于 90%。
解
记 Xi 为第 i 个加数的取整误差,则
Xi∼U(−0.5,0.5),E(Xi)=0,\Var(Xi)=121.
**(1)**由
E(i=1∑1500Xi)=0,\Var(i=1∑1500Xi)=121500=125,
得所求概率为
P(i=1∑1500Xi>15)≈2−2Φ(12515)=2−2Φ(1.34)=0.1802.
**(2)**由题意可列出概率不等式
P(i=1∑nXi<10)≥0.90,
利用林德伯格-莱维中心极限定理,可改写为
2Φ(n/1210)−1≥0.90,或Φ(n203)≥0.95.
查表得
n203≥1.645,或n≤1.645203.
由此得 n≤443.45。这表明:至多 443 个数相加,才能使它们的误差总和的绝对值小于 10 的概率不小于 90%。
设各零件的质量都是随机变量,它们相互独立,且服从相同的分布,其数学期望为 0.5 kg,标准差为 0.1 kg,问 5000 只零件的总质量超过 2510 kg 的概率是多少?
解
记 Xi 为第 i 只零件的质量,由
E(Xi)=0.5,σ(Xi)=0.1,
得
E(i=1∑5000Xi)=2500,\Var(i=1∑5000Xi)=50.
利用林德伯格-莱维中心极限定理,所求概率为
P(i=1∑5000Xi>2510)≈1−Φ(502510−2500)=1−Φ(1.414)=0.0787.
这表明:5000 只零件的总质量超过 2510 kg 的概率近似为 0.0787。
某种产品由 20 个相同部件连接而成,每个部件的长度是均值为 2 mm、标准差为 0.02 mm 的随机变量。假如这 20 个部件的长度相互独立同分布,且规定产品总长为 (40±0.2) mm 时为合格品,求该产品的不合格品率。
解
记 Xi 为第 i 个部件的长度,则
Y=X1+X2+⋯+X20
为总长度,且
E(Xi)=2,σ(Xi)=0.02.
可用林德伯格-莱维中心极限定理近似得合格品率
P(39.8≤Y≤40.2)≈Φ(0.0080.2)−Φ(−0.0080.2)
=2Φ(2.236)−1=0.9746.
所以不合格品率为 0.0254。
一个保险公司有 10000 个汽车投保人,每个投保人平均索赔 280 元,标准差为 800 元。求总索赔额超过 2700000 元的概率。
解
记 Xi 为第 i 个投保人的索赔额,i=1,2,⋯,10000,则
E(Xi)=280,\Var(Xi)=8002.
由林德伯格-莱维中心极限定理,所求概率为
P(i=1∑10000Xi>2700000)≈1−Φ(10000×80022700000−10000×280)
=1−Φ(−1.25)=Φ(1.25)=0.8944.
有两个班级同时上一门课,甲班有 25 人,乙班有 64 人。该门课程期末考试平均成绩为 78 分,标准差为 14 分。试问:甲班的平均成绩超过 80 分的概率大,还是乙班的平均成绩超过 80 分的概率大?
解
记 Xi 为甲班第 i 个学生的成绩,i=1,2,⋯,25;Yj 为乙班第 j 个学生的成绩,j=1,2,⋯,64。因
E(Xi)=E(Yj)=78,\Var(Xi)=\Var(Yj)=142,
所以由林德伯格-莱维中心极限定理,甲班平均成绩超过 80 分的概率为
P(251i=1∑25Xi>80)≈1−Φ(25×14225×80−25×78)
=1−Φ(75)=0.2374.
同理可计算乙班平均成绩超过 80 分的概率为
P(641j=1∑64Yj>80)≈1−Φ(64×14264×80−64×78)
=1−Φ(78)=0.1261.
所以甲班的平均成绩超过 80 分的概率大。
进行独立重复试验,每次试验中事件 A 发生的概率为 0.25。试问能以 95% 的把握保证 1000 次试验中事件 A 发生的频率与概率差多少?此时 A 发生的次数在什么范围内?
解
记 Yn 为 1000 次试验中事件 A 发生的次数,则
Yn∼b(1000,0.25),
且
E(Yn)=250,\Var(Yn)=187.5.
设事件 A 发生的频率 Yn/1000 与概率 0.25 的差为 k,根据题意,可得不等式
P(1000Yn−0.25≤k)≥0.95,
或
P(∣Yn−250∣≤1000k)≥0.95.
利用棣莫弗-拉普拉斯中心极限定理和修正项可得
P(187.5Yn−250≤187.51000k+0.5)≥0.95,
即
2Φ(187.51000k+0.5)−1≥0.95.
由此得
Φ(187.51000k+0.5)≥0.975.
查表得
187.51000k+0.5≥1.96.
从中解得 k≥0.027,这表明能以 95% 的把握保证在 1000 次试验中事件 A 发生的频率与概率相差不大于 0.027。或者说,在 1000 次试验中事件 A 发生的次数在 (250±27) 次间,即在 223 次到 277 次间。
设某生产线上组装每件产品的时间服从指数分布,平均需要 10 min,且各件产品的组装时间是相互独立的。
- 试求组装 100 件产品需要 15 h 至 20 h 的概率;
- 保证有 95% 的可能性,问 16 h 内最多可以组装多少件产品?
解
记 Xi 为组装第 i 件产品的时间(单位:min),则
Xi∼Exp(λ),E(Xi)=1/λ=10,\Var(Xi)=1/λ2=100.
**(1)**根据题意所求概率如下,再用林德伯格-莱维中心极限定理可得
P(15×60≤i=1∑100Xi≤20×60)≈Φ(100×1001200−100×10)−Φ(100×100900−100×10)
=Φ(2)−Φ(−1)=Φ(2)+Φ(1)−1=0.8185.
**(2)**设 16 h 内最多可以组装 k 件产品。则根据题意可列出概率不等式
P(i=1∑kXi≤16×60)≥0.95,
再用林德伯格-莱维中心极限定理可得
Φ(100k960−10k)≥0.95.
由此查表得
10k960−10k≥1.645,
从中解得 k=81。
某种彩票的奖金额 X 由摇奖决定,其分布列为
X/万元P50.2100.2200.2300.1400.1500.11000.1
若一年中要开出 300 个奖,问需要多少奖金总额,才有 95% 的把握能够发放奖金。
解
记 Xi 为第 i 次摇奖的奖金额,则可得
E(Xi)=29,\Var(Xi)=764.
设奖金总额为 k(万元),根据题意可列出不等式
P(i=1∑300Xi≤k)≥0.95,
再用林德伯格-莱维中心极限定理可得
Φ(300×764k−300×29)≥0.95.
由此查表得
229200k−8700≥1.645,
从中解得
k≥9487.54.
取 k=9488(万元)即可。这表明:该种彩票一年开出 300 个奖需要准备 9488 万元,才有 95% 的把握够发放奖金。
一家有 500 间客房的大旅馆的每间客房装有一台 2 kW(千瓦)的空调机。若开房率为 80%,需多少千瓦的电力才有 99% 的可能性保证有足够的电力供使用空调机?
解
记
Xi={1,0,第 i 间客房开房,第 i 间客房未开房,
则 Xi∼b(1,0.8),由此得
Y=X1+X2+⋯+X500∼b(500,0.8).
设共有 k kW 的电力可供使用,根据题意可列不等式
P(2Y≤k)=P(Y≤k/2)≥0.99,
再用棣莫弗-拉普拉斯中心极限定理和修正项可得
Φ(500×0.8×0.2k/2+0.5−500×0.8)≥0.99,
或
Φ(85k−799)≥0.99,
由此查表得
85k−799≥2.33,
从中解得 k≥840.68,取 k=841 kW 即可。这表明:该旅馆每天需要 841 kW 电力,才能以 99% 的把握保证空调机用电。
设某元件是某电气设备的一个关键部件,当该元件失效后立即换上一个新的元件。假定该元件的平均寿命为 100 小时,标准差为 30 小时,试问:应该有多少备件,才能有 0.95 以上的概率,保证这个系统能连续运行 2000 小时以上?
解
记 Xi 为第 i 个元件的寿命,i=1,2,…,n,则
E(Xi)=100,Var(Xi)=302.
根据题意可列不等式
P(i=1∑nXi>2000)≥0.95,
再由林德伯格-莱维中心极限定理可得
Φ(n×302100n−2000)≥0.95.
由此查表得
n×302100n−2000≥1.645,
从中解得 n≥22.33,所以取 n=23,即应有 23 个此种元件,可有 0.95 以上的概率保证这个系统能连续运行 2000 小时以上。
独立重复地对某物体的长度 a 进行 n 次测量,设各次测量结果 Xi 服从正态分布 N(a,0.22)。记 X 为 n 次测量结果的算术平均值,为保证有 95% 的把握使平均值与实际值 a 的差异小于 0.1,问至少需要测量多少次?
解
因为
E(X)=a,Var(X)=n0.04,
所以根据题意可列不等式
P(∣X−a∣<0.1)≥0.95,
再用林德伯格-莱维中心极限定理可得
2Φ(0.04/n0.1)−1≥0.95,
或
Φ(2n)≥0.975.
由此查表得 n/2≥1.96,从中解得 n≥15.3664,取 n=16 即可以 95% 的把握使平均值与实际值 a 的差异小于 0.1。
某工厂每月生产 10000 台液晶投影机,但它的液晶片车间生产液晶片合格品率为 90%,为了以 99.7% 的可能性保证出厂的液晶投影机都能装上合格的液晶片,试问该液晶片车间每月至少应该生产多少片液晶片?
解
设每月至少应该生产 n 片液晶片,其中合格品数记为 X,则有
X∼b(n,0.90).
下求 n,使概率不等式
P(X≥10000)≥0.997,或P(X<10000)≤0.003
成立。利用二项分布的正态近似,可得
Φ(0.9×0.1×n10000+0.5−0.9n)≤0.003,
查表可得
0.3n10000.5−0.9n≤−2.75,
由此解得 n≥11209,即每月至少应该生产 11209 片液晶片。
某产品的合格品率为 99%,问包装箱中应该装多少个此种产品,才能有 95% 的可能性使每箱中至少有 100 个合格产品。
解
设包装箱中装有 n 个产品,其中合格品数记为 X,则有
X∼b(n,0.99).
下求 n,使
P(X≥100)≥0.95,或P(X<100)≤0.05
成立。利用二项分布的正态近似,可得
Φ(0.99×0.01×n100+0.5−0.99n)≤0.05,
查表可得
0.0995n100.5−0.99n≤−1.645,
由此解得 n>103.19,即每箱装有 104 个产品,能有 95% 的可能性使每箱中至少有 100 个合格产品。
为确定某城市成年男子中吸烟者的比例 p,任意调查 n 个成年男子,记其中的吸烟人数为 m,问 n 至少为多大才能保证 m/n 与 p 的差异小于 0.01 的概率大于 95%。
解
因为
m∼b(n,p),
所以
E(m/n)=p,Var(m/n)=np(1−p).
根据题意有
0.95<P(nm−p<0.01)≈2Φ(p(1−p)0.01n)−1,
由此得
0.975<Φ(p(1−p)0.01n).
查表得
p(1−p)0.01n≥1.96,或n≥1962×p(1−p).
因为 p(1−p)≤1/4,所以当
n≥41962=9604
时,必可满足要求,因此至少抽 9604 个成年男子,可使其吸烟频率 m/n 与实际成年人中吸烟率 p 的误差 ∣m/n−p∣ 小于 0.01 的概率大于 95%。
设 X∼Ga(n,1),试问 n 应该多大,才能满足
P(nX−1>0.1)<0.01.
解
因为
E(X)=n,Var(X)=n,
所以由中心极限定理得
P(nX−1≤0.1)≐2Φ(0.1n)−1≥0.99,
即
Φ(0.1n)≥0.995.
查标准正态分布函数值表得
0.1n≥2.575,
所以得 n≥663.06,取 n=664 即可满足要求。
设 {Xn} 为一独立同分布的随机变量序列,已知 E(Xik)=αk, k=1,2,3,4。试证明:当 n 充分大时,
Yn=n1i=1∑nXi2
近似服从正态分布,并指出此正态分布的参数。
解
因为 {Xn} 为独立同分布的随机变量序列,所以 {Xn2} 也是独立同分布的随机变量序列。根据林德伯格-莱维中心极限定理,
Yn=n1i=1∑nXi2
近似服从正态分布,其参数为
E(Yn)=n1i=1∑nE(Xi2)=α2,
Var(Yn)=n21i=1∑nVar(Xi2)=nα4−α22.
用概率论的方法证明:
n→∞lim(1+n+2!n2+⋯+n!nn)e−n=21.
解
设 {Xn} 为独立同分布的随机变量序列,其共同分布为参数 λ=1 的泊松分布 P(λ)。故
E(Xn)=Var(Xn)=1.
又由泊松分布的可加性知,
Yn=i=1∑nXi
服从参数 λ=n 的泊松分布。由林德伯格-莱维中心极限定理知
P(nYn−n≤0)=P(Yn≤n)=e−nk=0∑nk!nk→2π1∫−∞0e−x2/2dx=21.
评论
支持 Markdown 和 LaTeX 数学公式。