工业大数据分析回归算法教学讲义.docx
《工业大数据分析回归算法教学讲义.docx》由会员分享,可在线阅读,更多相关《工业大数据分析回归算法教学讲义.docx(17页珍藏版)》请在第一文库网上搜索。
1、任务6.1回归算法任务概述数值预测是对连续值函数进行预测的一类数据挖掘任务,通过构造相关的预测模型对连续数值进行预测。与分类问题相同之处在于数值预测也是有标号的学习问题,即监督学习问题,与之不同在于数值预测对连续的变量进行学习和预测,而分类对于离散的目标进行学习和分类。回归分析是最常用的统计学数值预测方法,它是在分析现象自变量和因变量之间相关关系的基础上,建立变量之间的回归方程,并将回归方程作为预测模型,根据自变量在预测期的数量变化来预测因变量的值。回归分析主要解决以下几个方面的问题:确定几个特定的变量之间是否存在相关关系,如果存在的话,找出它们之间合适的数学表达式。根据一个或几个变量的值,预
2、测或控制另一个变量的取值,并且可以知道这种预测或控制能达到何种精确度。进行因素分析。例如在对于共同影响一个变量的许多变量(因素)之间,找出哪些是重要因素,哪些是次要因素,这些因素之间又有什么关系等等。回归分析有很广泛的应用,例如实验数据的一般处理,经验公式的求得,因素分析,产品质量的控制,气象及地震预报,自动控制中数学模型的制定等等。多元回归分析是研究多个变量之间关系的回归分析方法,按因变量和自变量的数量对应关系可划分为一个因变量对多个自变量的回归分析(简称为“一对多”回归分析)及多个因变量对多个自变量的回归分析(简称为“多对多”回归分析),按回归模型类型可划分为线性回归分析和非线性回归分析。
3、以下内容分别以线性回归和决策树回归为例进行回归算法方面案例的讲解。通过本任务的学习:(1)能够构建线性回归模型对工业大数据进行分析。(2)能够构建决策树回归模型对工业大数据进行分析。任务实现611线性回归建模线性回归算法假设每个影响因素与目标之间是线性关系,并通过特征选择,得到关键影响因素的线性回归系统。该算法是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计方法,通过凸优化的方法进行求解。在实际业务中应用十分广泛。图6-1-1线性回归图标数据格式:必须设置类属性(输出),且类属性(输出)必须是连续型(数值);非类属性(输入)可以是连续型(数值)也可以是离散型(名
4、词)。参数说明:线性回归题眼住化无压基本法欣tJ7.12623411.1S660ZOI2O13jfi22加&91加刖(17SSdOUXOI2013a2200&91293290785S7O2065刈皿22786JXM.150.7855011234201322301.57OJ*548113Z2013823h00&8S2Z330176567186432O1W23M68627933OTS5521S32011234)0&3B2Z33017S5370107162O1M23SO6M2793307656570W2012362Z.130765O3tU1M201皿匕782233OM61UM1WnicOO32”.A
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 工业 数据 分析 回归 算法 教学 讲义