工业大数据分析分类评估.docx
任8.3分类评估任务概述分类评估是对自变量和因变量相同类数据集,比较一种分类算法一组参数、不同参数组合或者多种分类算法之间的分析性能,检验分类模型的准确性和可靠性;最终根据一些评价的指标(如分类的准确率)或者图表展示,获得质量最佳的分类模型。本节结合逻辑回归分类算法做分类分析,结合分类评估节点做模型评估。图8-3-1分类评估按钮图8-3-2逻辑回归分类按钮逻辑回归算法可用于二元及多元分类问题,是分类算法的经典算法。对于二分类问题,算法输出一个二元1ogiStiC回归模型。对于K分类问题,算法会输出一个多维1OgiStiC回归模型,包含KT个二分类模型。数据格式:(1)分类模型:机器通过学习与训练已有的数据,从而预测新数据的类别。(2)分类数据集;数据集,又称为资料集、数据集合或资料集合,是种由数据所组成的集合。分类数据集即用于分类的数据集。参数说明:批注许1:这一段建议和任务概述里面的儿子介绍、背景目的合并批注12:为了格式统夕坟海估二ROC.X®钱KS修GiniMJUft3e座篌中至功“组®幅眼涌图8-3-3分类评估参数说明表8-4分类评估参数说明参数类型描述是否输出类别列文本框用户选择是否是否输出类别列,如果选择是,则在评估数据集中显示并输出IabeI列中每个类别的评估指标值二分类评估选项下拉框当输入模型为二分类模型时,用户可选择二分类评估选项。分类评估洞察中将展示勾选的评估指标,包括RoC、PR曲线,KS曲线,Gini系数,1ift曲线,Gains曲线。当待评估模型为多分类模型时,不显示二分类评估指标数据说明:木段中所用数据为风机结冰故障数据。数据集文件名称:fengji_data_t1_demo3.csv0具体数据集字段同8.1数据说明。通过本任务的学习:(1)会使用分类评估模型检验逻辑回归分类算法应用于工业大数据分析的可靠性。任务实现具体操作如下:步骤1:建模区“数据管理”下拉列表内拖入“文件输入”节点、“数据处理”下拉列表内拖入“数值型属性变换”、“设置角色节点”、“机器学习”下拉列表内拖入“逻辑回归分类”节点,“模型管理”下拉列表内拖入“分类评估”节点,每个节点右侧的英文字母D拖拽互相连接,构建如下模型,如图8-3-4所示:图8-3-4分类评估构建模型步骤2,点击“文件输入”节点,弹出下图,点击“选择数据”右下方图标,上传数据文件配置如下,如图8-3-5所示:fengjidatat1dmo3×aga文件上的全配利峥_3JmmCTwroa*fengj.dtj1-demo3timeWindJPeedgenerator,speed2015/11/4(H»1.09658428112368897452015/11/40K)169453776212634801842015/11/414<M6676156124U50149652015/11/4143051.07445648412734515992015/11/414:061.11133614712800992092015/11/414071.738290417163480184分区ooooo步骤3:“数值型属性变换”节点配置如下,如图8-3-6所示:Q生*为与我名名称*XfiStt4皿iEtnWfrwn.1户.目川gX感值里“住变换×*nd>peedgeoeF<x.*eedpW*nd.dircbocywj>osat>onE.pdPiuh1jm9epch1moto.tmp«.«ACCay*H力华测®图8-3-6分类评估-数值型数形变换-节点配置上图可看到,frozen_sta属性变换后为frozen_s,变换后类型为字符型,变换方式为数字转字符。步骤4:“设置角色”节点配置如下,如图8-3-7所示:识角色×OSIS。月QM。女之o*IWTIW5»Opch1.ogkpcM.f.frozen.StMe>O9Pi1Ch1.mc*o.tPiUh1mo*0<OioACCJ1MCeX«11CCJccyO12<wo<vwnt.tnvonment.tO13t.tmpHjmpG14WW.DCpchg5-(©15pch2.n95wCXpch2.n95.CK16pcM.h95.0Cpch3.n95.(XO17,gMn.M1<rMnsUM1买型角色B*MttrgD88JSxA×CrgD"6dOSft×C1fiiDOJfc.!au×Mffi;D<xe.ja»×tf21iDC*ue<1SmAXn1D<Xec1Qxft×cisidoj&uasb×mRQ8eUBZ×rt22iDC*j1asa×将文xft×MK«步骤5:“逻辑回归分类”节点配置如下,如图8-3-8所示:了辑回归分类×JEJtKtMS0.011收敛Cat0.000001的BffiU2奥音工示变一»性<5M¾feM®WS0图8-3-8分类评估-逻辑回归分类-节点配置步骤6:点击上图“确定”按钮,完成配置,点击右上角运行按钮,运行后在洞察中查看模型运行结果,参考如图8-3-9和图8-3-10所示:图8-3-9分类评估-模型运行结果1图8-3-10分类评估-模型运行结果2运行结果说明:该节点用来评价一个分类任务中的模型表现。适用于二分类的任务,也适用于多分类的任务,且只能用于分类算法而无法用于其他算法的评估。通过模型训练和评价指标,该节点自动计算出较得到可靠的分类模型。