《成对数据的统计分析 第2课时 成对数据的统计相关性.docx》由会员分享,可在线阅读,更多相关《成对数据的统计分析 第2课时 成对数据的统计相关性.docx(12页珍藏版)》请在第一文库网上搜索。
1、8.1成对数据的统计相关性(2课时,单元教学设计)柴化安(安徽省寿县第一中学)1教学内容和内容解析1.1 内容第I课时:变量的相关关系,主要包括变量的相关关系,散点图,正相关、负相关和线性相关等.第2课时:样本相关系数,主要包括如何构造相关系数以及相关系数的特性.1.2 内容解析本节课是人教A版选择性必修第三册第八章“成对数据的统计分析”中8.1的内容,是必修课程中统计知识的进一步延伸.通过必修课程的学习,学生初步建立了用样本估计总体的思想.本节课主要结合典型案例,利用成对样本数据的统计相关性,研究两个变量之间的统计相关性.对于成对样本数据研究两个变量的相关关系.根据先宜观描述后定量刻画的统计
2、中研究问题的一般思路,本节课先由成对样本数据的散点图直观推断变量之间的相关关系,再构造统计量相关系数,让学生感受由宜观想法到严格数学表达的逐步转化过程.利用从特殊到一般的研究方法,掌握样本相关系数绝对值的大小可以刻画样本相关程度的强弱,进一步推断两个变量之间相关的正负性和线性相关程度的强弱,为后面利用一元回归模型刻画两个数值变量的相关关系,并利用估计得到的回归方程进行预测奠定基础,也为后面通过抽样数据推断分类变量的独立性,构建力?统计量做了思想方法上的铺垫.2目标和目标解析2.1目标(1)通过实例,了解变量的相关关系,会区别变量之间的函数关系和变量之间的相关关系.(2)利用给出的数据画散点图,
3、通过散点图判断两个变量间的正相关、负相关以及线性相关.(3)结合实例,了解样本相关系数的统计含义,了解样本相关系数与“标准化”处理后的成对数据量分量向量夹角的关系.通过实例,会通过相关系数比较多组成对数据的相关性.2.2目标解析(1)通过实例,让学生认识到变量的相关关系是普遍的关系,理解学习变量的相关关系的必要性.通过“提出问题抽样调查画散点图f作出推断”的方式,先直观描述再定量刻画,利用散点图判断两个变量间是否具有相关关系.(2)通过数据研究问题,用成对样本数据呈现的统计相关性去估计变量之间的相关性,散点图知识初步阶段,散点图无法定量刻画成对样本数据相关程度的强弱,因此要构造新的统计量.在构
4、造样本相关系数的过程中,先初步建立刻画相关性的数学表达式,再逐步优化表达式,即对数据所做的“中心化”和“标准化”等处理,这些处理是统计学中常用的处理数据的方法,是一种重要的“标准化”思想,渗透了理性思维和科学精神.3教学问题诊断分析(1)问题诊断学生在在人教A版数学必修第二册的“统计”中的学习中,对于用样本估计总体的统计思想有一定的了解,基于数据观察、宜观表示及统计特征的刻画等相关知识和方法,研究了刻画单个变量特征的基本量,如均值、方差、中位数、众数等.这为本节课研究两个变量间的关系相关程度的强弱奠定了一定的基础.本节课结合现实生活中的具体实例,以样本估计总体为主要思想,在成对样本数据散点图的
5、基础上,定量研究成对样本数据的线性相关的强弱.(2)学生可能存在的困难学生经过函数的学习,对于两个变量之间的确定性关系先入为主,对学生相关关系的理解可能产生负迁移.在构造样本相关系数的过程中,对“中心化”和“标准化”处理的理解可能存在困难;在优化公式表达式的过程中,对公式烦琐的化简过程和符号表示的理解存在一定困难;对探究样本相关系数大小与相关性强弱的关系存在困难.(3)教学难点是通过散点图判断成对数据的相关性和样本相关系数的构造.4教学支持条件分析借助EXCe1等软件等制作课件,并进行数据处理,增强学生对数据分析的兴趣,提高教学效果.6课时教学设计2第二课时1.1 教学内容样本相关系数,主要包
6、括如何构造相关系数以及相关系数的特性.1.2 教学目标(1)结合实例,由散点图的图象特征构建线性相关系数的数学表达式,了解样本相关系数的绝对值大小与相关性强弱的关系;能使用统计软件分析数据,能对统计结果做出合理的解释.(2)通过逐步优化构建相关系数的过程,体会样本相关系数定义的合理性,积累利用数学工具刻画数据统计特征的经验,了解“中心化”“标准化”是常用的处理数据的方法,能用统计的眼光看待问题,培养学生的数据分析、数学建模、逻辑推理素养.1.3 教学重与难点教学重点:样本相关系数表达式的构建、优化过程及范围确定.教学难点:理解“中心化”“标准化”处理的必要性和合理性.1.4 教学过程设计6.
7、4.1温故知新,提出问题引导语:我们现在学习统计。研究统计问题的一般流程是什么?收集数据,整理数据,分析数据,作出推断预测。上节课我们借助“人体的脂肪含量与年龄”、“航班正点率与顾客投诉次数”等案例,学习两个变量的相关关系,这是现实世界中比函数关系更为普遍的两个变量的关系.我们如何判断两个变量之间的相关性?可以根据经验做出推断,更好的是借助数据说话,利用成对数据的散点图直观推断.通过观察散点图中成对数据的分布规律,大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关问题1:观察下面四幅图中,哪些图可以推断两个变量是相关的?哪些图表示的成对数据的相关性较强?引导语散点图
8、虽然很直观,但无法确切地反映成对样本数据的相关程度,但是这些推断都只是定性推断,也就无法量化两个变量之间相关程度的大小.能否像引入平均值、标准差等数字特征对单个变量数据进行分析那样,引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析,即从定量的角度刻画成对样本数据的线性相关程度呢?追问:假设一组数据是占,X2,X”,用X表示这种数据的平均数,那么请同学们回忆这组数据的标准差的概念及其意义.师生活动:这种数据的标准差是S=JJW(Xi-1)2.标准差刻画了数据的离散程度或波动大小,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.设计意图:这是上节课留下的问题,通过散
9、点图只能定性判断是否相关,通过类比单个变量数据的数字特征,引出本节课的研究目标一一构建一个统计量来定量刻画线性相关程度的强弱,提出构造统计量刻画成对数据相关性数字特征的必要性和可能性.7. 4.2问题引领,构建统计量对于变量X和变量y,设经过随机抽样获得的成对样本数据为(大,),(冗2,%),(乙,),其中平均数分别为=,+X2+1+X”),y=4(y+%+1+%),标准差问题2:对于具有线性相关的两个样本数据的散点图,我们考虑能否在不改变分布的情况下,将散点移到同一个点附近,以便更好地观察其分布特点.移到哪个点附近比较合适?设计意图:让学生感知,要研究数据,就要把数据放到统一的“环境中”,在
10、一致的“环境”下观察散点的分布特点,从而合理构造度量标准,通过数刻画图形中散点分布的特点.师生活动:移到原点附近最好,因为原点在坐标系中最特殊.追问:怎样将点(士,乂),(,必),(王,丹)都移到原点附近?师生活动:将每个点的坐标减去他们各自的平均数,这是统计中一个重要的数据处理方法,对样本数据进行“中心化”处理将样本数据以Gj)为零点进行平移,得平移后的成对数据为(X-%y-y),(2-,y2-j),(怎一问题3:针对8.1.1中的数据进行“中心化”处理.“中心化”处理后散点集中在原点附近.如图,两个变量正相关“中心化”处理后的散点图,你观察有什么特点?师生活动:将样本数据“中心化”处理后,
11、正相关的散点大多数分布在第一、三象限,大多数散点横、纵坐标同号;负相关的散点大多数分布在笫二、四象限,大多数散点横、纵坐标异号.问题4:你能根据上述特点,构造一个度量成对样本数据是正相关还是负相关的统计量吗?设计意图:数据“中心化”处理以后,成对数据大多数散点分布在一、三象限或二、四象限,可以让学生用一个量来表示,学生可以充分感知“中心化”处理的必要性和合理性.师生活动:1xy=(,-)(y1-y)2-v)(y2-,)+(-)(yn-y)-这个公式形式简单,具有对称性,比较合适.追问1如何解决数据个数对它的影响?生:我们可以除以数据的个数,就能够得到14=()-)(y1-y)+(-)(y2-y)+-+(,-)(.v-y)-一般情形下,4,O表明成对样本数据正相关;4yfn,炉M才H=,1rrr11r1rrrr11所以厂=(助)=一,忖cos=cos=cos6,其中。为向量。,务的夹角.由此得到,样本相关系数,就是标准化数据夹角的余弦值,所以r-1,1,即N0,1.追问2:当卜|=1时,成对样本数据之间具有怎样的关系?当N=I时,z=cos。中的夕=0或乃,向量;和力共线.由向量的知识可知,存在实数%,使得b=4a,即二i-=A,-,i=1,2,1SySX这表明成对样本数据(xpX)都落在直线y=(X-X)上.这时,成对样本数据的S