全面Logistic回归模型详细版.docx
《全面Logistic回归模型详细版.docx》由会员分享,可在线阅读,更多相关《全面Logistic回归模型详细版.docx(20页珍藏版)》请在第一文库网上搜索。
1、1ogistic回归模型1 1ogistic回归模型的根本知识1.1 1ogiStiC模型简介主要应用在研究某些现象发生的概率p,比方股票涨还是跌,公司成功或失败的概率,以及讨论概率P与那些因素有关。显然作为概率值,一定有0p1,因此很难用线性模型描述概率P与自变量的关系,另外如果P接近两个极端值,此时一般方法难以较好地反映P的微小变化。为此在构建P与自变量关系的模型时,变换一下思路,不直接研究p,而是研究P的一个严格单调函数G(p),并要求G(P)在接近两端值时对其微小变化很敏感。于是1ogit变换被提出来:1ogit(P)=1n(1)I-P其中当P从Of1时,1OgiKP)从一8这个变化范
2、围在模型数据处理上带来很大的方便,解决了上述面临的难题。另外从函数的变形可得如下等价的公式:1ogit(p)=n-f-=,X=P=r(2)I-Pi+ex模型(2)的根本要求是,因变量Iy)是个二元变量,仅取0或1两个值,而因变量取1的概率P(y=1X)就是模型要研究的对象。而X=(1E,电,XA),,其中Z表示影响y的第i个因素,它可以是定性变量也可以是定量变量,B=(BO,?。为此模型可以表述成:Pe%+即产-外,In=0+,xxHFkxk=p=-7(3)_pkof1Uy+Jo+g+显然E(y)=p,故上述模型说明In一是玉,x2,的线性函数。此时我们称满足上面条件1-E(y)的回归方程为1
3、OgiStiC线性回归。1ogistic线性回归的主要问题是不能用普通的回归方式来分析模型,一方面离散变量的误差形式服从伯努利分布而非正态分布,即没有正态性假设前提;二是二值变量方差不是常数,有异方差性。不同于多元线性回归的最小二乘估计法那么(残差平方和最小),1ogistic变换的非线性特征采用极大似然估计的方法寻求最正确的回归系数。因此评价模型的拟合度的标准变为似然值而非离差平方和。定义1称事件发生与不发生的概率比为优势比(比数比oddsratio简称OR),形式上表示为OR=(4)1-p定义21ogiStiC回归模型是通过极大似然估计法得到的,故模型好坏的评价准那么有似然值来表征,称-2
4、In1()为估计值方的拟合似然度,该值越小越好,如果模型完全拟合,那么似然值1()为1,而拟合似然度到达最小,值为0。其中/“1(N)表示6的对数似然函数值。定义3记Ma/)为估计值/的方差-协方差矩阵,S()=W(/)E为方的标准差矩阵,那么称为夕的Waki统计量,在大样本时,吗近似服从N?)分布,通过它实现对系数的显著性检验。定义4假定方程中只有常数项4,即各变量的系数均为0,此时称z2=-21n1()-1M)为方程的显著性似然统计量,在大样本时,力?近似服从2(幻分布。1.21OgiStiC模型的分类及主要问题根据研究设计的不同,1ogisiic回归通常分为成组资料的非条件1OgiSti
5、C回归和配对资料的条件1OgiS1iC回归两种大类。还兼具两分类和多分类之分,分组与未分组之分,有序与无序变量之分。具体如下:两分类非条件1ogiSIiC回归:分组数据的1OgiStiC回归,未分组数据的1ogiSIiC回归;多分类非条件1ogistic回归:无序变量1ogiS1iC回归,无序变量1ogistic回归;条件1OgiSIiC回归:1:1型、1:M型和M:N型1OgiS1iC回归。关于1OgiS1iC回归,主要研究的内容包括:1 .模型参数的估计及检验2 .变量模型化及自变量的选择3 .模型评价和预测问题4 .模型应用21OgiStiC模型的参数估计及算法实现2.1 两分类分组数据
6、非条件1ogistic回归因变量(反响变量)分为两类,取值有两种,设事件发生记为y=1,不发生记为y=0,设自变量X=(M,/,尸是分组数据,取有限的几个值;研究事件发生的概率尸(y=1X)与自变量X的关系,其1ogistic回归方程为:ZVV=I1Y)网格明In=&+6内+kxk或P(y=X)=AP(y=0|X)产IFAv71+v+-川在一次住房展销会上,与房地产商签订初步购房意向书的有n=325人,在随后的3个月时间内,只有一局部顾客购置了房屋。购置房屋的顾客记为1,否那么记为0。以顾客的年家庭收入(万元)作为自变量X序号年家庭收入X(万元)签订意向人数实际购买人数11.525822.53
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 全面 Logistic 回归 模型 详细
