《教程:第三章 假设检验(详细共72页).docx》由会员分享,可在线阅读,更多相关《教程:第三章 假设检验(详细共72页).docx(78页珍藏版)》请在第一文库网上搜索。
1、第三章假设检验在第二章我们讨论了参数估计问题,本章将讨论统计推断的另一类重要问题假设检验。所谓的假设检验是先假设总体的分布形式或总体的参数具有某种特征,然后利用样本提供的信息来推断所提出的假设的正确性。这种处理问题的方法称为假设检验。3.1基本概念在这一节,我们给出一般的Neyman-Pearson假设检验构架。为此,我们从实际例子引入一些基本概念。例3.1.1洗衣粉装包机在正常工作时,装包量服从正态分布。根据长期经验知其标准差为15克,而额定标准为每袋净重500克。今为检验装包机工作是否正常,随机抽取它所包装的洗衣粉9袋,称得净重为497, 506, 518, 524, 488, 511,
2、510, 515, 512问由上述数据能否判定包装机工作正常?在这个例子中,已经知道包装量服从标准差为b = 15的正态分布NO/,。?)。所谓包装机工作正常就是 二500。我们先提出装包机工作正常的假设,记为“: =500。然后需要由所得的9个样本观测值来判断假设”是否成立?因此,这个例子实际上是在总体分布形式已知的前提下关于总体的数学期望假设检验问题。凡在总体分布形式已知前提下对总体X的分布中的参数提出作检验的问题统称为参数假设检验问题。否则,称为非参数假设检验问题。例如下面的例子是对总体X的分布类型提出假设作检验的问题。例3.L2认为某工厂生产的灯泡其光通量X服从正态分布,是否正确?又认
3、为某服务窗口在某段时间内接待的顾客数X服从Poisson分布,是否正确?下面我们结合讨论例3.1.1,阐述假设检验的基本思想及所涉及到的基本概念。原假设和备择假设在例3.1.1中,我们已知包装量服从正态分布,实际上是已知包装量X的分布属于正态分布族包装机工作是正常的,即为假设4 = 500。一般地,设统计模型为2;。,关于总体分布中的参数。的推测,即石u。称为假设,其中是参数空间。的非空真子集。如果仅有一个参数,即6= ,则称“为简单假设,否则称为复合假设。我们利用所得的9个样本观测值来判断包装机工作正常的假设H,只可能获得两种结果:包装机工作正常或不正常。这样,除了包装机工作正常的假设外,我
4、们还需要包装机工作不正常的假设,判断的结果是二选一。因此,在一个假设检验中,常常涉及到两个假设,所要检验的假设称为原假设或零假设,记为“。而与不相容的假设称为备择假设或对立假设,记为对参数统计模型e;。而言,原假设和备择假设这对矛盾的统一体“0: 0 G 0(), / G 0,称为假设检验问题。需要说明的是在假设检验问题(3.1.1)中,。和/是G)的两个互不相交的非空子集,但并不要求。0口露一定成立。保留这个灵活性,不仅是理论的需要,也有其实际意义。例3.1.1的假设检验问题可归结为H(): = ()= 500, H: /()= 500拒绝域、接受域、检验统计量和检验函数在例3.1.1中,包
5、装机的包装量XN(,b2),其中已知。我们需要判断的是总体均值是否等于500,即判断原假设“0: 4 = 4。=500是否成立。由于样本均值元是总体均值4的一致最小方差无偏估计,这样样本均值了在一定程度上就反映了总体均值的大小,因此可考虑用样本均值元来做推断。当原假设o成立时,样本均值元与总体均值。相差不应过大,即偏差|无- |不应过大,若偏差|元-相当大,我们就有理由怀疑“o不成立而拒绝“。又因为当原假设“。成立时,统计量U=半服从标准正态分布5 V nN(0,l),因此衡量|元-四)|的大小就等价于衡量| U |的大小。现在的问题是当|U|大到什么程度才算过大,我们才有理由拒绝“。,这就需
6、要规定一个界限因此,我们就获得了判断是否成立的一个法则:当。成立时,若|U|Nc,拒绝o,否则接受“,其中c是一个待定的常数,称。为检验的临界值。从上述解释可知,检验一个假设就是根据某一法则在原假设和备择假设之间做出选择,而基于样本内,/,,/做出拒绝“o或接受所依赖的法则称为检验。例3.L1的检验当中不等式I U但c实际上是将样本空间划分为两部分元一o(x),(3.1.6)的不同取值,这个函数称为功效函数。当时,g(e)= a(e),当时,g=1。)检验水平在检验一个假设时,我们自然希望犯两类错误的概率都尽可能的小。但当样本容量固定时.,要减少犯第一类错误的概率,就会增大犯第二类错误的概率;
7、反之,若要减少犯第二类错误的概率,就会增大犯第一类错误的概率。即就是说当样本容量固定时,不可能同时减少犯两类错误的概率,这是一对不可调和的矛盾。只有增大样本容量才能同时使。,夕都变小,这在很多实际问题中是不现实的。Neyman-Pearson检验原理就是控制犯第一类错误的概率在给定的范围内,寻找检验使得犯第二类错误的概率尽可能的小,即就是使检验的功效尽可能的大。这样就是在给定一个较小的数a(0al), 一般取为0.01, 0.05, 0.1等,在满足P0xelW = EcpxS) C、中常数。的选取原则是在保证犯第一类错误的概率满足cy/yln的前提下使得检验的功效尽可能的大,即犯第二类错误的
8、概率尽可能的小。此时可选取C=Z a,因此例3.1.1假设检验问题的拒绝域为1-2卬=。,工2,/ ” Z a)5 7n 2或简记为W = llz er V n 5根据这个定义,检验的水平不唯一。若以幻是一个水平为a的检验,则对任何满足的a,奴工)也是一个水平为a的检验。称sup自(e(x),eo为检验0(x)的大小或真实水平。实用上当提到一个检验的水平时,一般是指它的真实水平。3.2正态总体的检验3.2.1 单个正态总体方差已知时总体均值的检验设王,,匕是来自正态总体N(,b2)的样本,其中。2已知,考虑假设检验问题“o:4 = o,H a。(3.2.1)在3.1.1节我们已获得的检验统计量
9、为U=/G J n当原假设成立时,有UN(0,l),显著性水平a下的拒绝域为W = (.,%2,,瑞)1 2CL其中Z a为标准正态分布的1 -丝的分位点。W2这种用服从标准正态分布的统计量U作为检验统计量的检验称为检验。在上述假设检验问题中,备择假设中的参数0或 。,这种形式的假设检验也称为双侧假设检验。常常我们需要考虑如下的假设检验问题“0 : = (),(3.2.2)“(): A。(3.2.3)Ho: = 4o,H、: /0,H1:从7j = aa y/n a V n从而有以号专 = a v n a 7 n由标准正态分布分位点的定义,有可得C = 4() +Z】_a,因而拒绝域为W = (玉,):元 o + 京za等价地有W = 。,,): 一 ,1 Z-acr yjn这样可选取U=半作为检验统计量,假设检验问题(322)的显著性水平。的拒绝域b V n为W = (x),x2,%):/ zx_a(3.2.6)例321微波炉在炉门关闭时的辐射量是一个重要的质量指标。根据过去的经验,某厂该指标X服从正态分布N(,y2),长期以来。=0.1,且均值都符合要求:不超过0.12。为检查近期生产的产品质量,抽查了 36台,得其炉门关闭时辐射量的均值X = 0.1205。试问在显著性水平。=0.05下,该厂炉门关闭时辐射量是否升高了?解 根据题意,可考虑假设检验问题H