《中心极限定理.docx》由会员分享,可在线阅读,更多相关《中心极限定理.docx(3页珍藏版)》请在第一文库网上搜索。
1、中心极限定理中心极限定理叙述了统计中的一个重要结论:多个相互独立随机变量的平均值(仍然是一个随机变量)服从或近似服从正态分布。为介绍这个定理先要作一项准备。(一)随机变量的独立性两个随机变量XI与X2相互独立是指其中一个的取值不影响另一个的取值,或者说是指两个随机变量独立地取值。比如,抛两颗骰子出现的点数记为XI与X2,则XI与X2是相互独立的随机变量。随机变量的相互独立性可以推广到三个或更多个随机变量上去。以下要用到一个假定:X1, X2,Xn几是n个相互独立且服从相同分布的随机变量”。这个假定有两个含义:(1) Xi,M,,X龙是n个相互独立的随机变量,如在生产线上随机取n个产品,它们的质
2、量特性用工1,丫2,表示,那么可认为丫1,占,是n个相互独立的随机变量。(2)丫1,与,,X龙有相同的分布,且分布中所含的参数也都相同,比如,都为正态分布,且都有相同均值和相同方差。又如,若都为指数分布,那么其中的参数4也都相同。今后,把n个相互独立且服从相同分布的随机变量丫1,匕,;的均值称为样本均值,并记为了,即:区+玛+W纪匕(二)正态样本均值的分布定理1设1,占,,X*是n个相互独立同分布的随机变量,假如其共同分布为正态分布(,),则样本均值斤仍为正态分布,其均值不变仍为,方差2 O2(J- = Orr2这个定理表明:在定理1的条件下,正态样本均值X服从正态分布砍衣,力。n例1. 2-
3、18设1,丫2,,工9是相互独立同分布的随机变量,共同分布为正态分布N(1O, 52),则其样本均值:9Sc服从曾(10,(今2)。这表明:的均值仍为10,万方差为25/g=2.78,万的标准差为:cr7 = 725/9 =5/3 = 1.67o X、+ X + , + X9X =(三)非正态样本均值的分布处2(中心极限定理)设,占,X乂为n个相互独立同分布的随机变量,其共同分布不为正态或未知,但其均值和方差都存在,则在n相当大时,样本均值X近似服从正态分布阳凡)。XI这个定理表明:无论共同的分布是什么(离散分布或誓分布,正态分布或非正态分布),只要独立同分布随机变量的个数n相当大时,刀的分布
4、总近似于正态分布,这一结论是深刻的,也是重要的,这说明平均值运算常可从非正态分布获得正态分布.例1. 2-19图1. 2-28中我们选了三个不同的共同分布:I均匀分布(无峰)II双单分布III指数分布(高度偏斜)_假如,n=2,那么在I的场合,2个均匀分布的变量之均值了的分布呈三角形,在n的场合,刀的分布出现中间高,在ni的场合万的分布的峰开始偏离原点。在四t,三种场合都呈现单峰状,并且前两个还有很好的时称性。在30时,三种场合下刀的分布几乎完全相同,只在位置上有些差别,这个差别是由原始共同分布的均值不同而引起的,另外,这时正态分布的峰都很高,那是因为平均后的标准差为:_。 CT 。仃一 =u
5、,诟病5.48图1.2-28有很强的直观性和说服力,这就是中心极限定理的魅力。m 1.2-28祥本均值的分布H的场合,刀的分布出现中间高,在HI的场合了的分布的峰开始偏离原点。在三种场合都呈现单峰状,并且前两个还有很好的对称性。在30时,三种场合下了的分布几乎完全相同,只在位置上有些差别,这个差别是由原始共同分布的均值不同而引起的,另外,这时正态分布的峰都很高,那是因为平均后的标准差为:ODDJ- =8,赤闻5.481. 2-28有很强的直观性和说服力,这就是中心极限定理的魅力。mi.28样本均*的分布例1.2-20J我们常常对一个零件的质量特性只测一次读数,并用这个读数去估计过程输出的质量特性,一个很容易减少测量系统误差的方法是:对同一个零件的质量特性作两次或更多次重复测量,并用其均值去估计过程输出的质量特性,这就可以减少标准差,从而测量系统的精度就自动增加。当然这不是同避使用更精密量具的理由,而是提高现有量具精度的简易方法,多次测量的平均值要比单次测量值更具有稳定性。