《显著性检验.docx》由会员分享,可在线阅读,更多相关《显著性检验.docx(14页珍藏版)》请在第一文库网上搜索。
1、显著性检验第7章显著性检验的基本问题教学目的与要求:通过本章讲授,使学生了解下列概念:观察到 的显著水平(PJS )、检验时规定的显著水平标准.显著水平、临界 值、检验规则.原假设和备择假设,知道什么是双尾检验,什么是左 (右)单尾检验以及各自的适用场合,知道什么是显著性检验中的两 类错误以及犯这类错误的概率的图示,掌握总体均值是否为某定值以 及两点分布总体中一次试验成功率为某定值的检验问题,知道显著性 检验中应当注意的问题。重点内容与难点:1 .显著性检验的基本问题2 .总体均值为某定值的显著性检验3 .随机试验中某种事件出现的概率为某定值的显著性检验7.1 显著性检验的基本问题1 .显著性
2、检验是除参数估计之外的另一类重要的统计推断问题。2 .显著性检验,又称假设检验:就是事先对总体(随机变量)的 参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假 设(原假设)是否合理,即判断总体的真实情况与原假设是否显著地 有差异。或者说,显著性检验要判断样本与我们对总体所做的假设之间的 差异是纯属机会变异,还是由我们所做的假设与总体真实情况之间不 一致所引起的。3 .显著性检验是针对我们对总体所做的假设做检验。一、显著性检验的基本思想显著性检验的基本思想可以用小概率原理来解释。1 .小概率原理:小概率事件在一次试验中是几乎不可能发生的, 假若在一次试验中事件事实上发生了。那只能认为
3、事件不是来自我们 假设的总体,也就是认为我们对总体所做的假设不正确。2 .观察到的显著水平:由样本资料计算出来的检验统计量观察值 所截取的尾部面积为。这个概率越小,反对原假设,认为观察到的差 异表明真实的差异存在的证据便越强,观察到的差异便越加理由充分 地表明真实差异存在。3 .检验所用的显著水平:针对具体问题的具体特点,事先规定这 个检验标准。4 .在检验的操作中,把观察到的显著性水平与作为检验标准的显 著水平标准比较,小于这个标准时,得到了拒绝原假设的证据,认为 样本数据表明了真实差异存在。大于这个标准时,拒绝原假设的证据 不足,认为样本数据不足以表明真实差异存在。5 .检验的操作可以用稍
4、许简便一点的作法:根据所提出的显著水 平查表得到相应的值,称作临界值,直接用检验统计量的观察值与临 界值作比较,观察值落在临界值所划定的尾部内,便拒绝原假设;观 察值落在临界值所划定的尾部之外,则认为拒绝原假设的证据不足。二.原假设和备择假设1 .原假设:对总体所作的论断或推测,指观察到的差异只反映机 会变异。记作HO2 .备择假设:是指观察到的差异是真实的。记作Hio3 .原假设和备择假设合在一起,应涵盖我们所研究的总体特征的 所有可能性。三、双尾检验和单尾检验采用双尾检验还是采用单尾检验(以及左单尾还是右单尾),取 决于备择假设的形式。拒绝域的单、双尾与备择假设之间的对应关系拒绝域位置原假
5、设备择假设双尾Ho: B= 0出: %左单尾H。:%(不可能有 %时,H。: = %)乩:K。0右单尾H。: OW %(不可能有%时,H。; = %)H: BO四、显著性检验的两类错误(-)显著性检验中的第一类错误及其概率显著性检验中的第一类错误是指,原假设Ho.= 6b事实上正确, 可是检验统计量的观察值却落入拒绝域,因而否定了本来正确的假设。 这是弃真的错误。发生第一类错误的概率(记作)也就是当原假设HGe=仇正确时 检验统计量的观察值落入拒绝域的概率。显然,在双尾检验时是两个 尾部的拒绝域面积之和;在单尾检验时是单尾拒绝域的面积。(二)显著性检验中的第二类错误及其概率显著性检验中的第二类
6、错误是指,原假设Ho: =自不正确,而备 择假设H: Q是正确的,可是检验统计量的观察值却 落入了接受域,因而没有否定本来不正确的原假设。这是取伪的错误。发生第二类错误的概率(记作)是指,把来自8= a(a/a)的总 体的样本值代入检验统计量所得结果落入接受域的概率。(三)和的关系当样本容量一定时,越小,就越大;反之,越大,就越小。五、显著性检验的P值若用计算机统计软件进行假设检验,我们会见到P-值。将算得检 验统计量样本值查表得的概率是就是P- (在那里我们称之为观察到 的显著水平)。六、关于显著性检验的结果(-)显著性检验回答什么问题我们所观察到的差异(是纯属于机会变异,还是反映了真实的差
7、 异?1 .如果显著性检验得到差异显著的结论这时并不能评价差异的大 小和重要性。2 .显著性检验只能告诉我们差异是否在事实上存在,而不能回答 差异产生的原因。3 .显著性检验不能检查我们对实验所作的设计是否有缺陷(二)显著性检验回答问题的方式在表述显著性检验结论的时候,应与检验的逻辑推理相符。当检验统计量的观察值落在拒绝域时,我们应该说,样本资料显著地(或高度显著地)表明,差异是存在的。(三)对观察到的显著水平数值的评价七、显著性检验中的总体和样本显著性检验的对象是无限总体(二)大样本可能会使检验统计量过分敏感(三)从有限总体中抽取样本用于显著性检验时,必须作概率抽样八.显著性检验的步骤显著性
8、检验的一般步骤或格式如下:(1)提出假设H0 :H :同时,与备择假设相应,指出所作检验为双尾检验还是左单尾或 右单尾检验。(2)构造检验统计量,收集样本数据,计算检验统计量的样本观 察值(3)根据所提出的显著水平,确定临界值和拒绝域(4)作出检验决策把检验统计量的样本观察值和临界值比较,或者把观察到的显著 水平与显著水平标准比较;最后按检验规则作出检验决策。当样本值 落入拒绝域时,表述成:拒绝原假设,显著表明真实的差异存 在;当样本值落入接受域时,表述成:“没有充足的理由拒绝原假 设没有充足的理由表明真实的差异存在。另外,在表述结论 之后应当注明所用的显著水平。7.2总体均值为某定值的显著性
9、检验总体均值的显著性检验可有双尾、左单尾、右单尾三种不同的情 况。下面就总体分布的不同情况,总体方差是否已知的不同情况以及 样本大小的不同情况分别介绍检验统计量和检验规则。一、总体为正态分布,总体方差已知,样本不论大小对于假设:=,在成立的前提下,有检验统计量如果规定显著性水平为,在双尾,左单尾,右单尾三种不同情形 下,拒绝域分别为:和;。二、总体分布未知,总体方差已知,大样本对于假设:=,在成立的前提下,如果样本足够大(30), 近似地有检验统计量如果规定显著性水平为,在双尾,左单尾,右单尾三种不同情形 下,拒绝域分别为和;。三、总体为正态分布,总体方差未知,小样本对于假设为:=,在成立的前
10、提下,有检验统计量如果规定显著性水平为,在双尾,左单尾,右单尾三种不同情形 下,拒绝域分别为:;。四、总体分布未知,总体方差未知,大样本对于假设例:=,在成立的前提下,如果总体偏斜适度,且样 本足够大,近似地有检验统计量如果规定显著性水平为,在双尾,左单尾,右单尾三种不同情形 下,拒绝域分别为:和;,7.3总体比例为某定值的显著性检验总体比例指的是随机试验中某种指定事件出现的概率。随机试验 中某种指定事件出现叫做“成功,把一次试验中成功的概率记作。对于假设=,在成立的前提下,如果,并且样本容量足够大,大 到足以满足时,近似地有检验统计量 (0,1)其中是样本比例。如果规定显著性水平为,在双尾,
11、左单尾,右单尾三种不同情形 下,拒绝域分别为:和;。一、显著性检验的意义为了便于理解,我们结合具体例子来说明显著性检验的意义。例 如,目前我国大豆育种工作者认为,大豆籽粒蛋白质含量高于45%(记 为)的品种为高蛋白品种。某种子公司对一大豆新品种随机抽取5个样 品进行测定,得平均蛋白质含量为=46.5% , 1.5%0我们能否根据 1.5%就认定该大豆新品种就是高蛋白品种?结论是,不一定。因为通过5个样品测定的蛋白质含量计算的样本平均数仅是该大 豆品种蛋白质含量总体平均数的一个估计值。由于存在抽样误差,任 何一个样品测定值,都可以表示为(1 , 2 , /7)(4-1)其中,为总体平均数,为抽样
12、误差。样本平均数为(4-2)(4-1)式表明,样本平均数包含了总体平均数与抽样误差二部分。于是,(4-3)(4-2 )式表明,是由两部分组成:一部分是两总体平均数的真 实差异;另一部分是抽样误差。()并不能代表新品种蛋白质含量总 体平均数与标准含量之间的真实差异,我们称为表面差异。虽然真实 差异未知,但表面差异是可以计算的,借助数理统计方法可以对试验 误差作出估计。所以,可将表面差异与试验误差相比较间接推断真实 差异是否存在,这就是差异显著性检验的基本思想。显著性检验的目 的在于判明,表面差异主要是由真实差异造成的,还是由抽样误差造 成的,从而得到可靠的结论。又如,某地进行了两个水稻品种对比试
13、验,在相同条件下,两个 水稻品种分别种植10个小区,获得两个水稻品种的平均产量为=510 kg/666.7 m2s =500 kg/666.7 m20 - =10 kg/666.7 m20 我们能否根据 -=10 kg/666.7 Irf就判定这两个水稻品种平均产量不同?结论仍是, 不一定。因为两个水稻品种平均产量、都是从试验种植的10个小区获得, 仅是两个品种有关总体平均数的估计值。由于存在试验误差,样本平 均数并不等于总体平均数,样本平均数包含总体平均数与试验误差二 部分,即,(4-4)于是,(4-5)其中,为试验的表面差异,为试验的真实差异,为试验误差。(4-5 )式表明,试验的表面差异
14、()是由两部分组成:一部分是试 验的真实差异;另一部分是试验误差。虽然真实差异未知,但试验的 表面差异是可以计算的,借助数理统计方法可以对试验误差作出估计。 所以,可将试验的表面差异与试验误差相比较间接推断真实差异是否 存在,即进行差异显著性检验。显著性检验的目的在于判明,试验的 表面差异主要是由试验的真实差异造成的,还是由试验误差造成的, 从而得到可靠的结论。二、显著性检验的步骤下面通过一个例子来介绍显著性检验的基本步骤。【例41已知某品种玉米单穗重N(300,9.52 ),即单穗 重总体平均数300g ,标准差9.5go在种植过程中喷洒了某种药剂的 植株中随机抽取9个果穗,测得平均单稳重3
15、08g ,试问这种药剂对该 品种玉米的平均单穗重有无真实影响?(-)提出假设 首先对样本所在的总体作一个假设。假设喷洒了 药剂的玉米单穗重总体平均数与原来的玉米单穗重总体平均数之间没 有真实差异,即或。也就是假设表面差异()是由抽样误差造成的。这种假设通常称为无效假设或零假设(null hypothesis ),意味 着,所要比较的两个总体平均数之间没有差异,记为从:。无效假设 是待检验的假设,它有可能被接受,也有可能被否定。因此,相应地 还要有一个对应假设,称为备择假设(alternative hypothesis ) o备 择假设是在无效假设被否定时,准备接受的假设,记为4 :或。对 于我们的例子,备择假设意味着喷洒了药剂的玉米单穗重总体平均数 与原来的玉米单穗重总体平均数之间存在有真实差异。通过检验,若 否定无效假设,我们就接受备择假设。(二)计算概率 在假定无效假设成立的前提下,根据所检验的统 计数的抽样分布,计算表面差异()是由抽样误差造成的概率。本例是在假定无效假设HO :成立的前提下,研究在N( 300 , 9.52)这一已知正态总体中抽样所获得的样