《数据分析spss作业汇总.docx》由会员分享,可在线阅读,更多相关《数据分析spss作业汇总.docx(13页珍藏版)》请在第一文库网上搜索。
1、妁京交通乂孽数据分析方法及软件应用(作业)题目:4、8、13、16题指导教师:学院:交通运输学院姓名:学号:4、在某化工生产中为了提高收率,选了三种不同浓度,四种不同温度做试验。在同一浓度与温度组合下各做两次试验,其收率数据如下面计算表所列。试在=0.05显著性水平下分析(1)给出SPSS数据集的格式(列举前3个样本即可);(2)分析浓度对收率有无显著影响;(3)分析浓度、温度以及它们间的交互作用对收率有无显著影响。解答:(1)分别定义分组变量浓度、温度、收率,在变量视图与数据视图中输入表格数据,具体如下图。浓度温度收率111132T103T2124T2115T3136T397T4108T41
2、2929102711221012229132382j42311名称类型I1宽度小数标签值缺失列1浓度数值80无无82温度数值80无无83收率数值80无无8(2)思路:本问是研究一个控制变量即浓度的不同水平是否对观测变量收率产生了显著影响,因而应用单因素方差分析。假设:浓度对收率无显著影响。步骤:【分析-比较均值-单因素工将收率选入到因变量列表中,将浓度选入到因子框中,确定。输出:燮昊敷分析收率平方和df平均值平方F著性群Ia之39.083219.5425.074.016在群a且内80.875213.851119.95823显著性水平Q为0.05,由于概率P值小于显著性水平Q,则应拒绝原假设,认
3、为浓度对收率有显著影响。(3)思路:本问首先是研究两个控制变量浓度及温度的不同水平对观测变量收率的独立影响,然后分析两个这控制变量的交互作用能否对收率产生显著影响,因而应该采用多因素方差分析。假设,HOI:浓度对收率无显著影响;H02:温度对收率无显著影响;H03:浓度与温度的交互作用对收率无显著影响。步骤:【分析-一般线性模型-单变量工把收率制定到因变量中,把浓度与温度制定到固定因子框中,确定。输出:主旨效果检定因燮数:收率来原第IH平方和df平均值平方F著性修正的模型70.458a116.4051.553.230截距2667.04212667.042646.556.000浓度39.0832
4、19.5424.737.030温度13.79234.5971.114.382浓度*温度17.58362.931.710.648曾49.500124.1252787.00024校正彼8数119.95823a.R平方二.587/周整的R平方二.209)第一列是对观测变量总变差分解的说明;第二列是观测变量变差分解的结果;第三列是自由度;第四列是均方;第五列是F检验统计量的观测值;第六列是检验统计量的概率P值。可以看到观测变量收率的总变差为119.958,由浓度不同引起的变差是39.083,由温度不同引起的变差为13.792,由浓度和温度的交互作用引起的变差为17.583,由随机因素引起的变差为49.
5、500。浓度,温度和浓度*温度的概率P值分别为0.030,0.382和0.648o浓度:显著性0.05说明拒绝原假设(浓度对收率无显著影响),证明浓度对收率有显著影响;温度:显著性0.05说明不拒绝原假设(温度对收率无显著影响),证明温度对收率无显著影响;浓度与温度:显著性0.05说明不拒绝原假设(浓度与温度的交互作用对收率无显著影响),证明温浓度与温度的交互作用对收率无显著影响。8、以高校科研研究数据为例:以课题总数X5为被解释变量,解释变量为投入人年数X2、投入科研事业费X4、专著数X6、获奖数X8;建立多元线性回归模型,分析它们之间的关系。解释变量采用逐步筛选策略,并做多重共线性、方差齐
6、性和残差的自相关性检验。解答:思路:根据要求采用逐步筛选的解释变量筛选策略,利用回归分析方法建立多元线性回归模型,分析它们之间的关系,并且要求做多重共线性、方差齐性和残差的自相关性检验。(1)步骤:【分析-回归-线性工X5选入因变量,X2、X4、X6、X8选入自变量,方法选择【逐步】。【统计量】勾选【估计】、【模型拟合度】、【共线性诊断】与Durbin-Waston(U)1【绘制(T)按钮工将*ZRESID添加到Y(Y)框中,将*ZPRED添加到X2(X)框中,勾选【正态概率图】,【保存(S)J按钮。在预测值与残差中勾选【标准化】选项。选择菜单【分析一相关一双变量】将标准化预测值和标准化残差选
7、入【变量】框,在相关系数中选择SPeannan,各项完成后点击【确定】。输出:燮数已输入/已移除&模型燮数已率俞人燮数已移除方法1投入人年数逐步(Wfj:F-to-enter的械率=.100)。a.课题总数模型摘要b模型RR平方Ia整接R平方襟型偏斜度金昔Durbin-Watson1.959a.919.917241.95821.747a.于1值:(常数),投入人年数b.:课题总数表中变量为投入人年数,参考调整的判定系数,由于调整的判定系数(0917)较接近于1,因此认为拟合优度较高,被解释变量可以被模型解释的部分较多,未能被解释的部分较少。方程DW检验值为1.747,残差存在一定的正自相关。燮
8、昊敷分析,模型平方和df平均值平方F著性119379040.047119379040.047331.018.000b残差1697769.9532958543.79121076810.00030a.:课题总数b.于ff1值:(常数),投入人年数被解释变量的总离差平方和为21076810.00,回归平方和及均方分别为19379040.047和19379040.047,剩余平方和及均方分别为1697769.953和58543.791,尸检验统计量的观测值为331.018,对应的概率P值近似为0。依据该表可进行回归方程的显著性检验。如果显著性水平馥为0.05,由于概率P值小于显著性水平馥,应拒绝回归方
9、程显著性检验的零假设,认为回归系数不为0,被解释变量与解释变量的线性关系是显著的,可建立线性模型。模型非襟型化保数本票型化保数T著性共泉性统言十资料B才票举金昔Beta允差VIF1(常ID投入人年数-94.524.49272.442.027.959-1.30518.194.202.0001.0001.000a.:课题总数依据该表可以进行回归系数显著性检验,写出回归方程和检测多重共线性。可以看到,如果显著性水平馥为0.()5,投入人年数变量的回归系数显著性t检验的概率P值小于显著性水平出因此拒绝零假设,认为其偏回归系数与0有显著差异,与被解释变量与解释变量的线性关系是显著的,应保留在方程中。同时
10、从容忍度和方差膨胀因子看,解释变量与投入人年数多重共线性很弱,可以建立模型。最终回归方程为,课题总数=-94.524+0.492投入人年数。排除的燮数,模型Beta入T著性偏相共女泉性统言十资料允差VIF允差下限1投入科研事业费(百元).152b1.528.138.278.2673.748.267专著数.023b.182.857.034.1885.308.188获奖数.030b.411.684.077.5421.846.542a.课题总数b.模型中的于1值:(常数),投入人年数该表展示回归方程的剔除变量,可以看到,如果显著性水平馥为0.()5,表中三个变量的回归系数显著性t检验的概率P值大于显
11、著性水平处因此不拒绝零假设,认为其偏回归系数与0无显著差异,与被解释变量与解释变量的线性关系是不显著的,不应保留在方程中。同时从容忍度和方差膨胀因子看,解释变量与三个解释变量多重共线性严重,在建立模型的时候应当被剔除。共性粉Bfa模型雉度特徵值脩件指数燮累数比例(常数)投入人年数111.8001.000.10.102.2003.001.90.90a.鹰燮数:课题总数依据该表可进行多重共线性检测,从方差比例上看第二个变量可解释常量的90%,也可解释投入人年数的90%,一次认为这些变量存在多重共线性。条件指数都小于10,说明存在共线性较弱,低个变量特征值小于0.7,说明线性相关关系较弱。残差励十资
12、料最小值最大值平均数襟型偏差NS-57.6423246.986960.000803.721331残差-466.2850509.6787.0000237.891431襟型SH测值-1.2662.845.0001.00031襟型残差-1.9272.106.000.98331a.:课题总数数据点围绕基准线还存在一定的规律性,但标准化残差的非参数检验结果表明标准化残差与标准正态分布不存在显著差异,可以认为残差满足了线性模型的前提要求。随着标准化预测值的变化,残差点在。线周围随机分布,但残差的等方差性并不完全满足,方差似乎有增大的趋势。但计算残差与预测值的SPearman等级相关系数为。176,且检验并
13、不显著,因此认为异方差现象并不明显。StandardizedPredictedVa1ueStandardizedResidua1Spearman的rhoStandardizedPredicted相信正系数1.000-.176Va1ueSH著性(曼尾).344N3131StandardizedResidua1相保数-.1761.000SH著性(曼尾).344N3131依据该表可以对标准化残差和标准化预测值的SPearman等级进行分析,可以看到,计算残差与预测值的相关性弱,认为异方差现象不明显。13、利用1950年1990年的天津食品消费数据,分析这段时间内的人均生活费用年收入的变化情况。要求:数据进行对数变换后,运用HOIt线性趋势平滑模型分析。(1)输出均方根误差和参数估计结果;(2)输出ACF和PACF图形并对其特征进行分析,是否满足白噪声序列的条件;(3)给出19911992的预测值,并输出拟合图。解答:思路:根据题意,先不进行序列图和自相关、偏自相关的观察和检验阶段处理。直接利用指数平滑模型中的HO1t线性趋势模型对数据进行分析,同时输出均方根误差和参数估