工业大数据分析数据融合教学讲义.docx
《工业大数据分析数据融合教学讲义.docx》由会员分享,可在线阅读,更多相关《工业大数据分析数据融合教学讲义.docx(11页珍藏版)》请在第一文库网上搜索。
1、任务2.5数据融合任务概述本节主要介绍常见的数据融合的原理和方法,并通过案例实现进行实操演示。数据集选用“工业用水处理投药量数据”。数据连接是基于连接字段按照给定的连接方式进行两个表格的字段组合得到新的数据表,支持两个数据表的单个或多个字段为连接字段的连接操作,连接方式包括内连接、外连接、左连接、右连接。数据追加是针对原有业务数据库系统分析基础上提出的,它解决的是在数据仓库初始数据转载后,如何再向数据仓库输入变化的数据的问题。它要求对原有的业务系统作最小改造,并记录在数据追加周期内数据的变化过程减小由于提取周期而影响数据分析展现,同时减少访问整个业务数据库。“数据追加周期”是指将操作型环境的变
2、化反映到数据仓库中,会有一个时间延迟。数据拆分即数据分割,是指把逻辑上是统一整体的数据分割成较小的、可以独立管理的物理单元进行存储,以便于重构、重组和恢复,以提高创建索引和顺序扫描的效率。数据分割使数据仓库的开发人员和使用者具有更大的灵活性。通过本任务的学习:(1)能够选择系统内的数据源,通过数据融合的方式对数据进行连接;(2)能够选择系统内的数据源,通过数据融合的方式对数据进行追加;(3)能够选择系统内的数据源,通过数据融合的方式对数据进行拆分。任务实现2.5.1 数据连接数据连接是基于连接字段按照给定的连接方式进行两个表格的字段组合,从而得到新的数据表,支持多个数据表的单个或多个字段为连接
3、字段的连接操作,连接方式包括内连接、外连接、左连接、右连接。数据连接0Q图2-5-1数据连接节点数据连接案例操作步骤如下:步骤1:在建模界面放置2个文件输入节点,文件输入节点中的数据文件选择“工业用水处理投药量数据”,选择“数据融合-数据连接”,拖入建模区进行连接,如图2-5-2所示。图2-5-2数据连接建模步骤2:双击打开“数据连接”节点,如图2-5-3所示,配置两个数据表的连接关系。数据连接连接方式内连接(给定条件,仅返回酶的行)连接条件表达式右表的列时间IV时间Vandv点击查看功能娴取消图2-5-3数据连接配置步骤3:完成连接配置,点击右上角“运行”按钮,如图2-5-4所示。图2-5-
4、4完成连接配置步骤4:数据连接处理后,运行结果如图2-5-5所示。图2-5-5数据连接处理结果2.5.2 数据追加数据追加支持将两个或多个类似数据表的行进行连接,追加成一个新的数据集。匹配的属性列必须具备同样的数据类型。结果数据集包含各个输入表中的每行。图2-5-6数据追加节点数据追加有“按列顺序添加”和“自定义”两种追加方法,如图2-5-7所示。数据追加追加密去按列顺彩釉口二:自定义下表新届性名称点击查看功能说明确定取消图2-5-7数据追加数据追加提供将具有相同个数的属性列的两个输入表的行记录连接,以创建一个输出数据集。匹配的属性列必须具备同样的数据类型。作为结果的数据集包含同样多个属性列以
5、及各个输入表中的每行。参数说明:按列顺序:将追加前的两个或多个数据集中的属性列按照顺序合并成新的列,依次追加相应的行记录。自定义:按照用户指定的需求,将追加前的两个或多个表的属性列进行匹配,追加匹配列相应的行记录。支持新增或删除属性列,可进行重复指派,部分行没有对应字段时用空值填充。数据追加案例操作步骤如下:步骤1参照下图构建模型:选择“数据管理-文件输入”,拖入2个“文件输入”节点到建模区;选择“数据融合-数据追加”节点到建模区,建立连接,如图25-8所示。工业用水处理投药量数据1选择数据FCVUE用水婢喇撒文件上传翻除全部刷除数据内容数据结构原水PH原水浊度出水浊度取水量PAs2013/8
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 工业 数据 分析 融合 教学 讲义