数据挖掘技术在地铁中的应用研究.docx
《数据挖掘技术在地铁中的应用研究.docx》由会员分享,可在线阅读,更多相关《数据挖掘技术在地铁中的应用研究.docx(9页珍藏版)》请在第一文库网上搜索。
1、数据挖掘技术在地铁中的应用研究摘要探讨地铁中的数据挖掘技术,可以提高数据挖掘技术的质量与效果,从而为地铁工程工作的推进奠定良好的基础。基于此,文章从智能决策分析系统的系统架构、系统运行方式等方面,分析了地铁自动售检票系统在地铁工程中的应用。在此基础上,提出客流分析预测系统过程、建立客流分析模型两方面来加强数据挖掘技术的应用策略,希望能给相关人员一些借鉴。关键词数据信息资源挖掘;地铁;自动售检票系统;聚集式计算;可视化技术中图分类号TP311.13文献标识码A文章编号2096-8949(2022)12-0050-03收稿日期:2022-04-15作者简介:彭琼芳(1982),女,本科,高级工程师
2、,研究方向:电气工程及自动化。0引言科学的进步,社会的发展,促使信息时代的到来。在当前,人们可以是数据的丰富也使得人们缺乏有效方法来识别一些隐藏的、对决策有益的信息,而传统查询方法和报表工具也根本无法满足信息数据挖掘的需要。因此需要一套技术来管理这些冗杂的数据,从中选择并挖掘出有用的信息,由此就形成了数据挖掘技术1,如图1。另一方面,数据挖掘技术是数据仓库技术逐步发展和完善的成果,但并不是任何信息挖掘的技术都可以归类到数据挖掘技术。比如,信息检索技术也能够利用数据库的管理系统来检索个别记录,又或者利用互联网的检索功能来找到特殊的页面,这些都不属于数据挖掘技术。L2概述以数据库、数理统计学、人工
3、智能、可视化研究等为基石,算法的设计工作需要这些来描述和解释数据分析。算法的设计工作主要包括录入、产出和数据处理。数据库是数据挖掘的计算入口,计算产出是挖掘数据信息知识的模型,而算法处理的流程则是设计具体工作的方式。1.3分类数据挖掘可以按不同的方式分为不同的类别。以数据库的视角来定义数据挖掘的3个基本技术方面,分别为数据信息挖掘视角、数据挖掘对象、数据分析信息挖掘方式。数据信息挖掘视角是将数据挖掘对象细分为若干个信息库或数据源,如关联、面对的对象、空间环境、时态、文本库、多媒体、历史等相关领域方面的数据库和万维网等2。而数据分析信息挖掘方式则可粗分为数据分析方式、机器学习方法、神经网络方式和
4、数据库方法。数据分析方式可划分为回归式数据分析、判别分析方式等。机器学习方式可划分为遗传算法等。神经网络方式可划分为前向神经网络、自组织神经网络等。数据库方法则主要为多维的数据挖掘方式等。L4作用数据挖掘过程是指自动提取并利用各种数据表中隐藏的有价值信息的过程,消息的类型可分为规律、法则、定义和模型等。管理人员通过这一技术,能剖析当前数据信息、历史数据信息及二者之间的关联,并从中找到隐藏的模型和关系,以便于预见未来可能出现的重大事件。这一过程也是人们探索认知系统的过程,是一个涉及方面非常广泛的新兴交叉性学科,主要应用于数据库、大数据计算、新一代人工智能和信息可视化与并行计算等领域。L5常见技术
5、形式数据分析挖掘中掌握专业知识的重要技能是机器学习和数理分析计算,目前研究数据挖掘的重点聚集于计算基础理论与应用方面。机器学习作为另一种深入研究人工智慧的分支方法,被称作归纳与推理;采用关联分析法,也可以从关系数据库中获取相关联系。而挖掘关联则是指根据系统查找各种事件,以找出符合条件概率比较高的模式;资源数据分析挖掘以人工神经元网络使用最为普遍,计算方法是采用模拟个人神经系统,不断地训练和掌握相应的数据集合,在每个待分析数据的集合里,出现可估计和分析的建模。决策方法是一个预测模型,呈树型构造,非终端节点显示属性,叶节点则显示不同类型;遗传算法则是一种基于优化生物学发展理论研究的技术,基础观念是
6、“适者生存”。遗传算法可进行多种类型、并行处理大量数据分析3;聚合后发现,整个数据库都能够分为不同集群,群和集群之间存在明显区别,同一个群的数据信息也尽量接近。聚类分析方法只是其他如特征和类型等预处理的第一步,算法在新生成的簇上等待数据处理。与分类方法不同的地方是在开始聚合之前,人们不清楚如何将数据信息分门别类,也不清楚如何按照变量分类。在聚合后,熟悉业务的人有多种方式理解分群的含义。大多数情形第一次聚合后所获得的分群信息对业务没有直接价值,需要通过删减和添加变数,来修正数据信息分群所采用的多种方法。如此,在重复多次以后,就会得出一个非常理想的结论。聚合方法主要分为两类,即神经网络方法和统计分
7、析方法。K-均值和自组织的神经网络方式在聚合计算中应用更为普遍。2地铁自动售检票系统1.1 智能决策分析系统的系统架构由于现有自动售检票系统都自建内部网络,在管理上属于私有内网范围。目前自动售检票系统的数据库中一般存储60天历史数据,但出于行业需要和安全方面的要求,可首先采取增加备用策略,把自动售检票系统的数据库数据备份到备用数据库服务器,之后再提取历史数据到本信息系统业务数据库,同时再向其他的辅助管理系统导入新数据,从而构成了该信息系统的全部服务统计信息。所以,在大数据分析集成处理过程中,必须本着安全性第一、兼顾成本的原则,通过防火墙实现隔离,以确保自动售检票系统与该信息系统业务数据库的安全
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 技术 地铁 中的 应用 研究