多元统计分析课后练习答案.docx
《多元统计分析课后练习答案.docx》由会员分享,可在线阅读,更多相关《多元统计分析课后练习答案.docx(9页珍藏版)》请在第一文库网上搜索。
1、第1章多元正态分布1、在数据处理时,为什么通常要进展标准化处理数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。在某些比照和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进展比照和加权。其中最典型的就是OT标准化和Z标准化。2、欧氏距离与马氏距离的优缺点是什么欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m维空间中两个点之间的真实距离。在二维和三维空间中的欧氏距离的就是两点之间的距离。缺点:就大局部统计问题而言,欧氏距离是不能令人满意的。每个坐标对欧氏距离的奉献是同等的。当坐标表示测量值时,它们往往带有大
2、小不等的随机波动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产生了各种距离。当各个分量为不同性质的量时,“距离的大小与指标的单位有关。它将样品的不同属性之间的差异等同对待,这一点有时不能满足实际要求。没有考虑到总体变异对距离远近的影响。马氏距离表示数据的协方差距离。为两个服从同一分布并且其协方差矩阵为的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。由标准化数据和中心化数据计算出的二点之间的马氏距
3、离一样。马氏距离还可以排除变量之间的相关性的干扰。缺点:夸大了变化微小的变量的作用。受协方差矩阵不稳定的影响,马氏距离并不总是能顺利计算出。3、当变量X1和X2方向上的变差相等,且与互相独立时,采用欧氏距离与统计距离是否一致统计距离区别于欧式距离,此距离要依赖样本的方差和协方差,能够表达各变量在变差大小上的不同,以及优势存在的相关性,还要求距离与各变量所用的单位无关。如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵,则马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧氏距离。4、如果正态随机向量X=(X,X2,XJ的协方差阵E为对角阵,证明X的分量是相互独立的随机变量。解:因
4、为X=(xrx2,xpy的密度函数为则/(x,.,XP)则其分量是相互独立。5.九和八是相互独立的随机变量,且以N(O,D,%N(3,4)。(a)求片的分布。(b)如果y=,J,写出Zr关于八与八的表达式,并写出的分Cy2-3)/2_布。(O如果y=;且写出可一。关于几与九的表达式,并写出yZ的分布。解:(a)由于匕由(0,1),所以匕42(1)。(b)由于匕由(0,1),%N(3,4);所以区TN(M);2故y7=yf+;3y,且y742(2)乙第2章均值向量和协方差阵的检验、略2:试谈WiIkS统计量在多元方差分析中的重要意义。3、题目此略多元均值检验,从题意知道,容量为9的样本,总体协方
5、差未知假设HO:=o,H1:0(n=9p=5)检验统计量产=(I)Maio)4(例)/6D72=mOyST(又-0)服从P,n1的72分布统计量实际上是样本均值与总体均值之间的马氏距离再乘以心(n-1),这个值越大,相等的可能性越小,备择假设成立时,有变大的趋势,所以拒绝域选择值较大的右侧局部,也可以转变为F统计量零假设的拒绝区域(n-p)/(n-1)*p*T21/10*T2F5,4(5)o=(6212.0132.8729729.515.78)样本均值(4208.7835.121965.8912.2127.79)(样本均值uo)*=(-2003.232.25-1006.112.7112.01)
6、协方差矩阵(降维一一因子分析一一抽取)Inter-ItemCovarianceMatrix人均GDP(元)三产比重()人均消费(元)人口增长()文盲半文盲()人均GDP(元1020190.840582.460331693.531-599.784-6356.325三产比重()582.46019.480-105.4646.62543.697人均消费(元)331693.531-105.464125364.321-213.634-3130.038人口增长()-599.7846.625-213.6346.09925.410文盲半文盲()-6356.32543.697-3130.03825.410196.
7、884协方差的逆矩阵计算:遥远及少数民族聚居区社会经济开展水平的指标数据.x1ST2=9*(-2003.232.25-1006.112.7112.01)*s-1*(-2003.232.25-1006.112.7112.01)=9*50.11793817=451,06144353F统计量=45.26.2拒绝零假设,边缘及少数民族聚居区的社会经济开展水平与全国平均水平有显著差异。4、略第3章聚类分析1.、聚类分析的根本思想和功能是什么聚类分析的根本思想是研究的样品或指标之间存着程度不同的相似性,于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间的相似程度的统计量,以这些统计量作为划
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 课后 练习 答案
![提示](https://www.001doc.com/images/bang_tan.gif)