表格模板-北邮考研概率论与数理统计62数据表示直方图等 精品.ppt
《表格模板-北邮考研概率论与数理统计62数据表示直方图等 精品.ppt》由会员分享,可在线阅读,更多相关《表格模板-北邮考研概率论与数理统计62数据表示直方图等 精品.ppt(50页珍藏版)》请在第一文库网上搜索。
1、 一、经验分布函数一、经验分布函数 二、频数频率分布表二、频数频率分布表 三、样本数据的图形显示三、样本数据的图形显示6.2 样本数据的整理与显示6.2.1 经验分布函数设 x1, x2, , xn 是取自总体分布函数为F(x)的样本,若将样本观测值由小到大进行排列,为 x(1), x(2), , x(n),则称 x(1), x(2), , x(n) 为有序样本.用有序样本定义如下函数 (1)( )(1)( )0, ( )/ ,1,2,.,11,kknnxxFxk nxx xknxx 则Fn(x)是一非减右连续函数,且满足Fn() = 0 和 Fn() = 1可见,Fn(x)是一个分布函数,称
2、Fn(x)为经验分布函数。经验分布函数。(1)(2)( )nxxx)(1)(或xsnxFn.的随机变量的个数中不大于,表示)(21xxxxxsn Fn(x)的图形是累积频率曲线。的图形是累积频率曲线。它是跳跃上它是跳跃上升的一条阶梯曲线。若观测值不重复,跃度为升的一条阶梯曲线。若观测值不重复,跃度为1/n,若重复,按若重复,按1/n1/n的倍数跳跃上升的倍数跳跃上升。Fn(x)x当当 时,时, 依概率收敛于总体的分布函数依概率收敛于总体的分布函数n)(xFn)(xF例1 某食品厂生产听装饮料,现从生产线上 随机抽取5听饮料,称得其净重(单位:克) 351 347 355 344 351x(1)
3、= 344, x(2)= 347, x(3)= 351, x(4)= 351, x(5)= 355这是一个容量为5的样本,经排序可得有序样本:其经验分布函数为 0 , x 344 0.2, 344 x 347Fn(x) = 0.4, 347 x 351 0.8, 351 x 355 1, x 355由伯努里大数定律:只要 n 相当大,Fn(x)依概率收敛于F(x) 。更深刻的结果也是存在的,这就是格里纹科定理。定理1(格里纹科定理)格里纹科(1933)定理表明:当n 相当大时,经验分布函数是总体分布函数F(x)的一个良好的近似。经典的统计学中一切统计推断都以样本为依据,其理由就在于此。. 10
4、)()(suplim , )( 1 )( , , xFxFPxFxFnxnxnn即即一致收敛于分布函数一致收敛于分布函数以概率以概率时时当当对于任一实数对于任一实数. )( , )( )( , 使用使用来来从而在实际上可当作从而在实际上可当作只有微小的差别只有微小的差别与总体分布函数与总体分布函数数的任一个观察值数的任一个观察值经验分布函经验分布函时时充分大充分大当当对于任一实数对于任一实数xFxFxFnxn 160 196 164 148 170 175 178 166 181 162 161 168 166 162 172 156 170 157 162 154样本数据的整理是统计研究的基
5、础,整理数据的最常用方法之一是给出其频数分布表或频率分布表。例2 为研究某厂工人生产某种产品的能力, 我们随机调查了20位工人某天生产的该种产品 的数量,数据如下(1) 对样本进行分组:作为一般性的原则,组数通 常在520个,对容量较小的样本;(2) 确定每组组距:近似公式为组距d = (最大观测值 最小观测值)/组数;(3) 确定每组组限: 各组区间端点为a0, a1=a0+d, a2=a0+2d, , ak=a0+kd, 形成如下的分组区间(a0 , a1 , (a1, a2, , (ak-1 , ak对这20个数据(样本)进行整理,具体步骤如下:(4) 统计样本数据落入每个区间的个数频数
6、, 并列出其频数频率分布表。表1 例2 的频数频率分布表 组序 分组区间 组中值 频数 频率 累计频率(%) 1 (147,157 152 4 0.20 20 2 (157,167 162 8 0.40 60 3 (167,177 172 5 0.25 85 4 (177,187 182 2 0.10 95 5 (187,197 192 1 0.05 100合计 20 1一、直方图直方图是频数分布的图形表示,它的横坐标表示所关心变量的取值区间,纵坐标有三种表示方法:频数,频率,最准确的是频率/组距,它可使得诸长条矩形面积和为1。凡此三种直方图的差别仅在于纵轴刻度的选择,直方图本身并无变化。当取
7、得一组样本值后,一般先根据样本取值作频率直方图,对总体的分布情况有一个几何直观上的粗略了解,然后再进一步分析10直方图111213 例3 某工厂用自动包装机包装产品,为了考察每袋产品重量的波动情况,选取100袋产品测得其重量如下:(单位:kg),根据测得的数据作出频率直方图97.894.698.9100.999.8102.797.995.599.0101.199.6102.997.795.799.5101.299.9103.198.295.899.1101.3100.0103.898.196.099.0101.4100.198.396.399.2101.5100.2104.598.596.69
8、9.3101.4100.397.898.496.799.4101.1100.496.999.5101.0100.198.597.099.1101.2100.298.097.299.2101.6100.298.197.499.0101.6100.498.197.599.4101.8100.598.797.199.3102.1100.398.899.998.9102.0100.298.999.7100.6102.1100.498.899.6100.6102.3100.198.699.7100.7102.498.899.8102.2100.899.8100.9141516把每一个数值分为两部分,前面
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 表格模板-北邮考研概率论与数理统计62数据表示直方图等 精品 表格 模板 考研 概率论 数理统计 62 数据 表示 直方图