表格模板-MBA统计学08列联表及对数线性模型 精品.ppt
《表格模板-MBA统计学08列联表及对数线性模型 精品.ppt》由会员分享,可在线阅读,更多相关《表格模板-MBA统计学08列联表及对数线性模型 精品.ppt(36页珍藏版)》请在第一文库网上搜索。
1、统计学从数据到结论第八章列联表、列联表、c c2检验和对数线性模型检验和对数线性模型 三维列联表三维列联表(关于某项政策调查所得结果(关于某项政策调查所得结果:table7.txt)观点:赞成观点:不赞成低收入中等收入高收入低收入中等收入高收入男201055810女25157279列联表列联表l前面就是一个所谓的三维前面就是一个所谓的三维列联表列联表(contingency table).l这些变量中这些变量中每个都有两个或更多的可能取每个都有两个或更多的可能取值值。这些取值也称为。这些取值也称为水平水平;比如收入有三;比如收入有三个水平,观点有两个水平,性别有两个水个水平,观点有两个水平,性
2、别有两个水平等。平等。该表为该表为322列联表列联表l在下面在下面SPSS数据中,表就和上面的不同,数据中,表就和上面的不同,收入的收入的“低低”、“中中”、“高高”用代码用代码1、2、3代表;性别的代表;性别的“女女”、“男男”用代码用代码0、1代表;观点代表;观点“赞成赞成”和和“不赞成不赞成”用用1、0代表。有些计算机数据对于这些代码的形代表。有些计算机数据对于这些代码的形式不限(式不限(可以是数字,也可以是字符串可以是数字,也可以是字符串)。)。列联表列联表l列联表的中间各个变量不同水平的交列联表的中间各个变量不同水平的交汇处,就是这种水平组合出现的频数汇处,就是这种水平组合出现的频数
3、或或计数计数(count)。)。l二维的列联表又称为二维的列联表又称为交叉表交叉表(cross table)。)。l列联表可以有很多维。维数多的叫做列联表可以有很多维。维数多的叫做高维列联表。高维列联表。l注意前面这个列联表的变量都是定性注意前面这个列联表的变量都是定性变量变量;但列联表也会带有但列联表也会带有定量变量作为定量变量作为协变量。协变量。二维列联表的检验二维列联表的检验 l研究列联表的一个主研究列联表的一个主要目的是看这些变量要目的是看这些变量是否相关。比如是否相关。比如前面前面例子中的例子中的收入和观点收入和观点是否相关是否相关。l这需要形式上的检验这需要形式上的检验二维列联表的
4、检验二维列联表的检验 l下面表是把该例的三维表简化成下面表是把该例的三维表简化成只有收入只有收入和观点的二维表和观点的二维表( (这是这是SPSS自动转化自动转化的的: :Analyze-Descriptive Statistics-Crosstabs-.).OPINION * INCOME CrosstabulationCount71519414525128252403112301OPINIONTotal123INCOMETotal二维列联表的检验二维列联表的检验l对于上面那样的二维表。我们检验的对于上面那样的二维表。我们检验的零假设和备选假设为零假设和备选假设为lH H0 0:观点和收入这
5、两个变量不相关观点和收入这两个变量不相关;H H1 1:这这两个变量相关。两个变量相关。l这里的检验统计量在零假设下有(大这里的检验统计量在零假设下有(大样本时)样本时)近似的近似的c c2 2分布。分布。l当该统计量很大时或当该统计量很大时或p p- -值很小时,就值很小时,就可以拒绝零假设,认为两个变量相关。可以拒绝零假设,认为两个变量相关。二维列联表的检验二维列联表的检验l实际上有不止一个实际上有不止一个c c2 2检验统计量。包检验统计量。包括括Pearson c c2 2统计量统计量和和似然比似然比(likelihood ratio)c c2 2统计量统计量;它们;它们都有渐近的都有
6、渐近的c c2 2分布。分布。l对于我们的数据,根据计算可以得到对于我们的数据,根据计算可以得到(对于这两个统计量均有)(对于这两个统计量均有)p p- -值小于值小于0.0010.001。因此可以说,收入高低的确影。因此可以说,收入高低的确影响观点。响观点。 21niiiiOEQE12lnniiiiOTOEPearson c c2 2统计量统计量似然比似然比c c2 2统计量统计量二维列联表的检验二维列联表的检验l刚才说,这些刚才说,这些c c2 2统计量是近似的,统计量是近似的,那么那么有没有精确的统计量呢?有没有精确的统计量呢?l当然有。这个检验称为当然有。这个检验称为FisherFis
7、her精确精确检验检验;它不是;它不是c c2 2分布,而是分布,而是超几何超几何分布分布。l对本问题对本问题, ,计算计算FisherFisher统计量得到统计量得到的的p p- -值也小于值也小于0.0010.001。lFisherFisher精确检验的又一例子精确检验的又一例子二维列联表的检验二维列联表的检验l聪明的同学必然会问,既然有精确检聪明的同学必然会问,既然有精确检验验为什么为什么还要用近似的还要用近似的c c2 2检验呢?检验呢?l这是因为当数目很大时,超几何分布这是因为当数目很大时,超几何分布计算相当缓慢(比近似计算会差很多计算相当缓慢(比近似计算会差很多倍的时间);而且在计
8、算机速度不快倍的时间);而且在计算机速度不快时,根本无法计算。因此人们多用大时,根本无法计算。因此人们多用大样本近似的样本近似的c c2 2统计量。而列联表的有关统计量。而列联表的有关检验也和检验也和c c2 2检验联系起来了。检验联系起来了。具体运算:先具体运算:先加权加权,加权之后,按照次序选,加权之后,按照次序选AnalyzeDescriptive StatisticsCrosstabs。在打开的对话框中,把在打开的对话框中,把opinion和和income分别选入分别选入Row(行)和(行)和Column(列);至于哪个放入行或(列);至于哪个放入行或哪个放入列是没有关系的。哪个放入列
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 表格模板-MBA统计学08列联表及对数线性模型 精品 表格 模板 MBA 统计学 08 列联表 对数 线性 模型