成对数据的统计分析 第7课时 列联表与独立性检验.docx
《成对数据的统计分析 第7课时 列联表与独立性检验.docx》由会员分享,可在线阅读,更多相关《成对数据的统计分析 第7课时 列联表与独立性检验.docx(15页珍藏版)》请在第一文库网上搜索。
1、8.3列联表与独立性检验(2课时单元教学设计)第一课时梁伟(安徽省淮南第四中学)第二课时洪敏(安徽省淮南第三中学)1教学内容和内容解析1.1 内容第1课时分类变量的概念、2X2列联表、等高条形图:第2课时两个分类变量的独立性检验.1.2 内容解析(1)引入分类变量的必要性:在当今大数据时代和“互联网+”的大背景下,本节课对提升学生的数据分析素养和提高学生的信息处理能力起到一个至关重要的作用.“独立性检验”是在考察两个分类变量之间是否具有相关性的背景下提出的.因此,教材上首先提到了分类变量的概念,并给出了考察两个分类变量之间是否相关的一种简单的思路,即利用随机抽样获得一定的样本数据,再利用随机事
2、件发生的频率稳定于概率的原理,求出相关概率进行比较,或借助更加直观的方法一等高条形图,为后续引出相对更精确的解决办法一独立性检验做铺垫.(2)分类变量:分类变量是说明事物类别的一个名称,其取值是分类数据。如“性别”就是一个分类变量,其变量值为“男”或“女”;行业”也是一个分类变量,其变量值可以为“零售业”、“旅游业”、“汽车制造业”等.教材首先举例说明了前面两节讨论的变量都是数值变量,通过数值变量与分类变量的对比,引出分类变量.从而引出我们本节课主要讨论分类变量的关联性问题.(3)22列联表:实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存.教材
3、通过举例的方法介绍了什么是2x2列联表.22列联表给出了成对分类变量数据的交叉分类频数.(4)等高条形图:教材介绍了如何通过不同的统计软件绘制等高条形图,并让学生感受利用等高堆积条形图可以更加直观地展示分类变量的关联性.(5)独立性检验是研究随机变量独立性的一种统计方法。为了解总体中两个分类变量是否相互独立,可以从总体中抽取简单随机样本,整理成一个2x2列联表,独立性检验就是根据列联表检验两个分类变量是否相互独立。独立性检验是假设检验的一个特例,假设检验是统计推断的一种基本形式,其基本思想是根据观察或试验的结果去检验一个假设(零假设)是否成立,即通过样本的某个指标对总体的某种属性进行推断,推断
4、的结果是拒绝或接受零假设。所以独立性检验本质上是一种概率推断,是一种依据概率在“0:无实质差异”与aH1:有实质差异”这两种推断中选择其一。这是一种“概率反证法”,通过样本出现的事件是否属于小概率事件来判断总体假设的真伪。独立性检验的数学基础是条件概率与独立事件概率的乘法公式,其推断步骤可分为:第一步,提出想要验证的假设”0,称为零假设;第二步,若假设“0不成立,则提出假设称为对立假设;第三步,若假设Ho成立,构造一个只有在小概率的情况下才能观察到的现象?;第四步,依据样本数据确认是否观察到了现象?;第五步,若能观察到现象/的情况下,则推断假设“0是错误的,此时便可以拒绝“0,而选择假设第六步
5、,若未能观察到现象,则无法拒绝假设H。,可选择假设独立性检验的依据是小概率原理:即小概率事件在一次试验中几乎不可能发生。在零假设成立的条件下,若一个不利于零假设的小概率事件在一次试验中发生了,则有理由拒绝零假设;若在一次试验中,此小概率事件没有发生,则没有充足的理由拒绝零假设,通常会接受零假设。所以独立性检验是检验假设而不是证明假设,所以推论会出现两类错误:第一类错误是拒绝了正确的零假设,犯了第一类错误的概率是Q;第二类错误是没有拒绝错误的零假设。独立性检验在犯第一类错误的概率和犯第二类错误之间做平衡,希望犯这两种错误的概率都尽可能地小,但减少第一类错误的概率就会增大犯第二类错误的概率。因为第
6、二类错误对样本量特别敏感,所以可以通过样本量降低第二类错误的概率。独立性检验是从样本数据中发现关系,是成对样本数据统计分析的重要内容,是依据数据进行合理推理的典型方法,体现了数学的理性精神,也是提升数据分析和逻辑推理素养的重要素材。2目标和目标解析2.1目标(1)了解分类变量与数值变量的区别.(2)了解回归与相关的区别.(3)通过实例,理解通过比较相关比率,利用2x2列联表或等高图可以初步检验两个随机变量的独立性.(4)通过对建立回归分析模型步骤的回忆,获得分析统计案例的一般性过程;能够将研究统计案例的一般化步骤应用到新的统计案例中.(5)理解通过比较相关比率判断随机变量独立性得到的结果有可能
7、会犯错误.(6)基于2x2列联表,通过具体实例,了解独立性检验的基本思想。(7)掌握独立性检验的基本步骤,会用独立性检验解决简单的实际问题,提升数据分析能力。2.2目标解析达成上述目标的标志分别是:(1)会判断一个变量是否是分类变量、是否是数值变量.(2)面对不同的数据分析案例,知道什么时候用回归分析,什么时候用相关分析.(3)会通过比较相关比率,判断两个随机变量的独立性.(4)会对简单的数据分析案例进行初步独立性分析.(5)明白通过比较相关比率判断随机变量独立性得到的结果有可能会犯错误,为下节课独立性检验做准备.(6)基于2x2列联表,通过具体实例,解释通过条件概率分析两个分类变量独立性的方
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成对数据的统计分析 第7课时 列联表与独立性检验 成对 数据 统计分析 课时 列联表 独立性 检验
![提示](https://www.001doc.com/images/bang_tan.gif)