工业大数据分析自动学习教学讲义.docx
《工业大数据分析自动学习教学讲义.docx》由会员分享,可在线阅读,更多相关《工业大数据分析自动学习教学讲义.docx(7页珍藏版)》请在第一文库网上搜索。
1、任务6.6自动学习任务概述自动学习算法能实现一个数据集的多种算法或多种参数组合的一次性建模,在多种模型下选择和推荐出最佳的模型或者组合得到最优预测结果,轻松实现模型的自动化和智能化学习,大大提升了建模的效率。本节使用自动学习中的分类交叉验证来验证相关案例。图6-6-1分类交叉验证图标交叉验证是一种模型选择方法,将样本的一部分用于训练,一部分样本用于测试。因此过程中不仅考虑了训练误差,同时也考虑了泛化误差。交叉验证有助于从某些候选模型中选择最适合某个学习问题的模型,有助于确定参数使得该模型对解决相应的分类问题最为有效,使得模型在偏差和方差之间寻求到最佳的平衡点。数据格式:必须设置类属性(输出),
2、且类属性(输出)必须是离散型(名词);非类属性(输入)可以是连续型(数值)也可以是离散型(名词)。参数说明:参数配置X表6-11分类交叉验证-参数说明参数类型描述验证次数k文本框指出交叉验证的次数。假设指定为k,则意味着将原始样本分为k份,将每份子集数据分别做一次测试验证集,其余的k-1组子集数据作为训练集,这样会得到k个分类模型,用这k个模型的的准确率平均值作为此固定参数下的分类模型的性能指标。本案例数据模型与任务6.6一致。通过本任务的学习:(1)能够构建分类交叉验证自动学习算法模型对工业大数据进行分析。任务实现具体操作如下:步骤1:建模区分别拖入文件输入节点、设置角色节点和随机森林分类节
3、点,构建如下模型,如图6-6-3所示:fengji.dt.t1.-.数ffiIftSS色分费交叉验证图6-6-3分类交叉验证-构建模型步骤2:双击“分类交叉验证”,进入参数配置界面,如图6-6-4所示:步骤3:在建模区配置一个分类算法,从左侧拖入“随机森林分类”节点,步骤4:点击左上角流程1,进入主建模界面,如图6-6-6所示:步骤5:补充“分类交叉验证”连接,如图6-6-7所示:国I=;S!QQQq图6-6-7补充连接步骤6:“文件输入”节点配置如下,选择fengji_data_t1_demo2数据集,点击确定如图6-6-8所不:fengjidatat1demo2文件上传题诠全部删除XQ1数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 工业 数据 分析 自动 学习 教学 讲义