多元统计分析试题.docx
《多元统计分析试题.docx》由会员分享,可在线阅读,更多相关《多元统计分析试题.docx(7页珍藏版)》请在第一文库网上搜索。
1、一、填空题(30分):1、多元正态分布检验用到的三大分布为、o2、若XN(4,Z),则AX + do (服从什么分布)3、常用的聚类方法有、动态聚类、等。4、我们将变量的类型按照尺度可分为、三类。5、统计距离公式为 o6、相似系数一般有、两种测度。7、常用的多元数据图表示法有、o二、计算证明题(30分):1、设抽取5个样本,每个样本只检测一个指标,他们是13, 14, 15.5, 19, 21o试用最短距离法对5个样本进行分类并画出谱系图。71 1 12、试验证函数/(X,九2,*3)=即+6刍+-玉工2,其中0XI 1,0犬2 2,0工3 %2 5 T),%2( 1)为自由度为 T的,分布上
2、的。/2分位点。这里我们应该注意数(33)式可以表示为t2 = 丁) = X -S2YX -/)(3.4)对于多元变量而言,可以将,分布推广为下面将要介绍的Hotelling T 分布。多元正态总体均值检验:(-)协差阵E未知时均值向量的检验(): ji = % (%为已知向量)H: No假设“。成立,检验统计量为(:1): + 1尸尸(p, p)(3.7)(一 1)其中,T2 =(n- 1)LV(X-Ji()ys-1 V(x-ji()J给定检验水平a,查产分布表,使定-二二a,可5-l)p J确定出临界值尸a,再用样本值计算出72,若二-屑(-1)则否定“。,否则接受“0。2、简单描述一下欧
3、氏距离、统计距离和马氏距离的定义并比较他们的优缺点。64欧氏距离:P、4(2) = (居一为)】优缺点:要求一个向量的n个分量是不相关的并且具有相同的方差或者说各坐标对欧氏距离的同等的并且变差大小也是相同的这是使用欧氏距离才合适效果也最好,否则就可能不能反映真实情况甚至导致错误结论。明氏距离%(,) = (E明氏的缺点:(1)量纲对距离的影响。(2)指标的相关性的影响。一般,要求指标是不相关的,并且方差相同。(注:为了矫正方差,提出统计距离。)统计距离:马氏距离:设我与分是来自均值向量为,协方差为E =(0)的总体G中的0维样品,则两个样品间的马氏距离为4(A7) = (X-X.yE-,(X,
4、-X/)优缺点:既排除了各指标之间相关性的干扰而且还不受个指标量纲的影响;将原数据做一线性交换后马氏距离仍不变。1、试比较因子分析中因子载荷、变量共同度、公共因子的方差贡献的意义。答:(1) Z, =%/(载荷矩阵中第i行,第j列的元素)反映了第i个变量与第j个公共因子的相关重要性。绝对值越大,相关的密切程度越高(2)所有的公共因子和特殊因子对变量X,的贡献为1。如果非./=常靠近1,。;非常小,则因子分析的效果好,从原变量空间到公共因子空间的转化性质好因子载荷矩阵中各列元素的平方和S j 鼎J i=称为尸/= ,加)对所有的X,的方差贡献和。 衡郭的相对重耍性。(3)2、简述逐步判别法的基本
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 试题