《专题五 第3讲 统计与成对数据的统计分析.docx》由会员分享,可在线阅读,更多相关《专题五 第3讲 统计与成对数据的统计分析.docx(20页珍藏版)》请在第一文库网上搜索。
1、第3讲统计与成对数据的统计分析考情分析高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、经验回归方程的求解与运用、独立性检验问题,常与概率综合考查,中等难度.考点一统计图表【核心提炼】1 .频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示普害,频率=组距X慧.组距组距2 .在频率分布直方图中各小长方形的面积之和为1.3 .利用频率分布直方图求众数、中位数与平均数.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即众数.(2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点
2、的横坐标之和.例1(1)(2023全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间答案C解析对于A,根据频率分布直方图可知,家庭年收入低于4.5万元的农户比率约为(0.02+0.04)1100%=6%,故A正确;对于B,根据频率分布直方图可知,家庭年收入不低于10.5万元的农户比率约为
3、(0.04+0.02+0.02+0.02)X1X100%=10%,故B正确;对于C,根据频率分布直方图可知,该地农户家庭年收入的平均值约为3X0.02+4X0.04+5X0.10+60.14+70.20+80.20+90.10+10X0.10+110.04+120.02+130.02+140.02=7.68(万元),故C错误;对于D,根据频率分布直方图可知,家庭年收入介于4.5万元至8.5万元之间的农户比率约为(0.10+0.14+0.20+0.2O)X1100%=64%50%,故D正确.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,
4、统计了该地区新农村建设前后农村的经济收入构成比例,得到如下扇形统计图:则下面结论中不正确的是()A.新农村建设后,种植收入略有增加B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入不变D.新农村建设后,种植收入在经济收入中所占比重大幅下降答案C解析因为该地区经过一年的新农村建设,农村的经济收入增加了一倍,不妨设建设前的经济收入为“,则建设后的经济收入为2加,A选项,从扇形统计图中可以看到,新农村建设后,种植收入比建设前增加2w37%-z60%=w14%,故A正确;B选项,新农村建设后,其他收入比建设前增加2mX5%-mX4%=mX6%wX4%,即增加了一倍以上,故B正确;C选项
5、,养殖收入的比重在新农村建设前与建设后相同,但建设后总收入为之前的2倍,所以建设后的养殖收入也是建设前的2倍,故C错误;D选项,新农村建设后,种植收入在经济收入中所占比重由建设前的60%降为37%,故D正确.易错提醒(1)对于给出的统计图表,一定要结合问题背景理解图表意义,不能似懂非懂.(2)频率分布直方图中纵坐标不要误以为是频率.跟踪演练1(1)构建德智体美劳全面培养的教育体系是我国教育一直以来努力的方向.某中学积极响应党的号召,开展各项有益于德智体美劳全面发展的活动.如图所示的是该校高三(1),(2)班两个班级在某次活动中的德智体美劳的评价得分对照图(得分越高,说明该项教育越好).下列说法
6、正确的是()体美实线:高三(1)班的数据虚线:离三(2)班的数据A.高三(2)班五项评价得分的极差为1.5B.除体育外,高三(1)班的各项评价得分均高于高三(2)班对应的得分C.高三(1)班五项评价得分的平均数比高三(2)班五项评价得分的平均数要高D.各项评价得分中,这两班的体育得分相差最大答案C解析对于A,高三(2)班德智体美劳各项得分依次为9.5,9,959,8.5,所以极差为9.5-8.5=1,A错误;对于B,两班的德育分相等,B错误;对于C,高三(1)班的平均数为9.5+9.25+9.59+9.57=9.35高三(2)班的平均数为二二-=9.1,故C正确;对于D,两班的体育分相差9.5
7、9=0.5,而两班的劳育得分相差9.25-8.5=0.75,D错误.A. (2)(多选)(2023绵阳模拟)在统计学中,同比增长率一般是指和去年同期相比较的增长率,环比增长率一般是指和上一时期相比较的增长率.根据下图,2023年居民消费价格月度涨跌幅度统计折线图,下列说法正确的是()B. 2023年全国居民每月消费价格与2019年同期相比有涨有跌C. 2023年1月至2023年12月全国居民消费价格环比有涨有跌D. 2023年1月全国居民消费价格同比涨幅最大E. 2023年我国居民消费价格中3月消费价格最低答案ABC解析对于A,观察图中同比曲线,除11月份同比为一0.5,其余均是正值,所以20
8、23年全国居民每月消费价格与2019年同期相比有涨有跌,A正确;对于B,观察图中环比曲线,有正有负,如2月份0.8,3月份一1.2,环比有涨有跌,B正确;对于C,观察图中同比曲线,1月份同比增加5.4,大于其他月份同比值,故2023年1月全国居民消费价格同比涨幅最大,C正确;对于D,观察图中环比曲线,3月份环比值一1.2,4月份一0.9,易知4月份消费价格比3月份低,故D错误.考点二回归分析【核心提炼】求经脸回归方程的步骤(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).(2)计算出X,y,x?,ErM的值.I-I11A(3)计算0,b.(4)写出经验回归方程.例2
9、某公司为了预测下月产品销售情况,找出了近7个月的产品销售量M单位:万件)的统计表:月份代码,1234567销售量M万件)y2J4*但其中数据污损不清,经查证Zyi=9.32,=40.17,A/(yi-y)2=0.55.尸1尸1i=1(1)请用样本相关系数说明销售量y与月份代码,有很强的线性相关关系:(2)求y关于t的经验回归方程(系数精确到0.01);公司经营期间的广告宣传费斯=”(单位:万元)(i=1,2,,7),每件产品的销售价为10元,预测第8个月的毛利润能否突破15万元,请说明理由.(毛利润等于销售金额减去广告宣传费)Q1t)(yi-y)参考公式及数据:由比2.646,样本相关系数,=
10、/=,当r0.75时认/(at)2(yI-y)2为两个变量有很强的线性相关关系,经验回归方程y=R+中斜率和截距的最小二乘估计公f1(ti-t)(y-y)式分别为b=,aybt.-7)2=1解(1)由统计表中的数据和参考数据得=4,(z,-7)2=28,-y(,0.75,所以销售量y与月份代码,有很强的线性相关关系.7&一I)(y-y)932i1289(2)由y=-5-=1331及(1)得b=饮0.103./7ZbZQ7A/=1A4=7-7F.3310.103X40.92,所以y关于,的经验回归方程为;=0.10f+0.92.(3)当Z=8时,代入经验回归方程得y=0.10X8+0.92=1.
11、72(万件),第8个月的毛利润为Z=IoX172-乖217.22X1.414=14.372(万元).由143720.5,解得x213,预计上市13个月时,即最早在2023年8月,市场占有率能超过0.5%.考点三独立性检验【核心提炼】独立性检验的一般步骤(1)根据样本数据列2X2列联表;(2)根据公式Z2=警J空、一八,计算好的值;(ab)(cc1)(a+c)(bd)(3)查表比较2与临界值的大小关系,作统计判断.Z2越大,对应假设事件HO成立(两类变量相互独立)的概率越小,Ho不成立的概率越大.例3(2023新高考全国I改编)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM、和SOz浓度(单位:gn),得下表:SO2PM2.0,50(50,150(150,4750,3532184(35,756812(75,1153710估计事件“该市一天空气中PM”浓度不超过75,且SO?浓度不超过150”的概率;(2)根据所给数据,完成下面的2X2列联表:SO20,150(150,4750,75(75,115(3)根据(2)中的列联表,依据小概率值=0.0I0的独立性检验,是否可以推断该市一天空气中PM2.5浓度与SCh浓度有关?n(ad-bc叩工(a+b)(c+d)(a+c)(