第一讲普通最小二乘法的代数.docx
《第一讲普通最小二乘法的代数.docx》由会员分享,可在线阅读,更多相关《第一讲普通最小二乘法的代数.docx(22页珍藏版)》请在第一文库网上搜索。
1、第一讲普通最小二乘法的代数一、问题假定y与x具有近似的线性关系:y =片+丹工+ ,其中是随机误差项。我们对口、川这两个参数的值一无所知。我们的任务是利用样本数据去猜测其、片的取值。现在,我们手中就有一个样本容量为N的样本,其观测值是:(%,%),(% ,%2),(如,/)。问题是,如何利用该样本来猜测片、力的取值?为了回答上述问题,我们可以首先画出这些观察值的散点图(横轴X,纵轴y)。既然y与X具有近似的线性关系,那么我们就在图中拟合一条直线:$ = Bo+BX。该直线是对y与x的真实关系的近似,而反,4分别是对片,片的猜测(估计)。问题是,如何确定6。与2,以使我们的猜测看起来是合理的呢?
2、笔记:1、为什么要假定y与x的关系是y = 4呢? 一种合理的解释是,某一经济学理论认为x与y具有线性的因果关系。该理论在讨论x与y的关系时认为影响y的其他因素是不重要的,这些因素对y的影响即为模型中的误差项。2、y = 4+/x + 被称为总体回归模型。由该模型有:E(y|x)= 4 +4X + E(x)。既然代表其他不重要因素对y的影响,因此标准假定是:E(X)= O。故进而有:E(y|x)= 4+4工, 这被称为总体回归方程(函数),而八八勺=4)+相应地被称为样本回归方程。由样本回归方程确定/X/a的 y 与 y 是有差异的,y-y 被称为残差。进而有:/XAy = &+/% + ,
3、这被称为样本回归模型。二、两种思考方法法一:(%, y2,,%)与(%, %,,9)是N维空间的两点,围与6的选择应该是这两点的距离最短。这可以归结为求解一个数学问题:NN一 x-)2=i=Bo.Bi i=由于凡 -戈.是残差片的定义,因此上述获得反与6的方法即是A与6的值应该使残差平方和最小。法二:给定玉,看起来/与1.越近越好(最近距离是0)。然而,当你选择拟合直线使得力与力是相当近的时候,x与少的距离也许变远了,因此存在一个权衡。一种简单的权衡方式是,给定%,X2,-,/,拟合直线的选择应该使y与%、%与Z、n与心的距离的平均值是最小的。距离是一个绝对值,数学处理较为麻烦,因此,我们把第
4、二种思考方法转化求解数学问题:NN犷/N = Miny-P.-曝了 / N女),61 i=iBo,B i=i由于N为常数,因此法一与法二对于求解A与6的值是无差异的。三、求解N定义q=(x-A-自七y,利用一阶条件,有:i=eo八 人m = Z2(y,一4丹为)(1)二。邓。=Z(y-/。一/闻=$=。由(1)也有:人人9=4+4元1 N1 N在这里歹丁小、高七笔记:人人这表明:1、样本回归函数勺=A+4X过点(乱歹),即穿过数据集的中心位置;2 y = y (你能证明吗?),这意味着,尽/X/X/X/X管Bo、P的串值不能保证x- = y,但Bo、P的取值能够保证y的平均值与y的平均值相等;
5、3、虽然不能保证每一个残差都为0,八/X但我们可以保证残差的平均值为0。从直觉上看,Bo、以 作为对00、4 的一个良好的猜测,它们应该满足这样的性质。二工20- BX)(-xJ = 0= (* Bo Bl七)七二0E柄=0笔记:对于简单线性回归模型:y = /3(+ /3x + s, 在 0LS 法下,由正规方程(1)可知,残差之和为零【注意:只有拟合宜线带有截距时才存在正规方程(1),由正规方程(2), 并结合正规方程(1)有:_ 见练习提示一3我七=0=2(一)七 =2(*一)(%无)=Cov(s.x) = 0无论用何种估计方法,我们都希望残差所包含的信息价值很小,如果残差还含有大量的信
6、息价值,那么该估计方法是需要改进的!对模型y = 4 +直工+利用0LS,我们能保证(1 ):残差均值为零;(2)残差与解释变量X不相关【一个变量与另一个变量相关是一个重要的信息工方程(1)与(2)被称为正规方程,把血二-囚无带入(2),有:Za96(%一元)及二。a = Z(y一刃为1 X (七元)玉上述获得60、幺的方法就是普通最小二乘法(OLS)。(1)验证:a = E(k一刃七二 E一)a无)=一 君分1 2(不一君为2(七-a (x,.-i)2= 一府?一玉2_际_N提示:定义Z.的离差为z. =Z.-Z,则离差之和yz.=o义为II I7Ii=零。利用这个简单的代数性质,不难得到:
7、Z(y 一刃亍)=Z(y刃玉Z(y 一刃一无)二Z,(七无)笔记:定义y与x的样本协方差、X的样本方差分别为:Cov(x, y) = Z(%i 一无)(乂 一刃 / NVar(x) = YJ(xi-x)2 / N nl A Covx.y)则 I =oVar(x)上述定义的样本协方差及其样本方差分别是对总体协方差5及xy其总体方差bj的有偏估计。相应的无偏估计是:*v5町二2(七一君(一歹)/0 1)sl=2i制 2/(N 1)基于前述对与Cbv(x,y)的定义,可以验证:Var(a + bx) = b2Var(x)Cova + bx, y) = bCovx, y)其中a, b是常数。值得指出的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一 普通 最小二乘法 代数