1基于大数据的数据分析.docx
《1基于大数据的数据分析.docx》由会员分享,可在线阅读,更多相关《1基于大数据的数据分析.docx(5页珍藏版)》请在第一文库网上搜索。
1、基于大数据的数据分析作者:戴争干钟业荣来源:科学与信息化2018年第31期摘要在当今世界的发展过程中,计算机信息技术的飞速发展使得数据的应用和扩展变得更加容易。在今天的时代,可以说大数据的时代,无论是数据,存储,分析,在机遇的新时代,处理,挖掘等仍然面临着机遇和挑战。在时代机遇背景下,大数据技术的快速发展对于社会各方面事业以及科学技术的进步具有非常显著的促进作用,因此对于大数据其所存在的价值,以及其在项目数据分析工作当中所发挥的作用,要进行真实有效的研究。因此在文章中,笔者将从数据分析角度着手,对国内外相关研究工作进行分析,对大数据项目数据分析工作进行论述。关键词大数据;项目;数据分析;价值前
2、言近年来,业界和学术界都在进行大数据讨论,大数据时代已经一夜之间到来。大数据为学术界带来了新的思潮。据预测,大数据将成为商业,政府,科研,教育和医疗等行业面临的挑战。在大数据时代,数据分析和数据挖掘工作面临机遇和挑战。结合国内外研究,试图回答大数据是什么以及如何处理大数据。1对大数据的有效认识1.1 大数据的宗旨:经过分析的数据才有价值必须分析大数据,这是由大数据的4V特性(大数据量,多种数据类型,快速处理速度,低密度)决定的。换句话说,数据是高维的,低密度的,并且很难从单个数据中看到法则。因此,有必要分析和优化高维度的维度并细化大量低密度信息的值以便起作用。否则,在大数据的环境中,更容易使“
3、实时”信息沉浸在大量的“死”数据中。大数据的分析应该是“简单,快速,大规模”。1.2 大数据的目标:实现基于数据的决策与资源配置大数据最终需要实现科学决策,基于信息对称的有效资源分配。随着大数据分析技术的发展,数据源可以从离线封闭数据库和数据仓库扩展到打开020(在线到离线)融合数据。可分析数据结构已经从基于数值的结构化数据演变为多媒体数据,例如文本,视频和音频。因此,大数据将逐步改变我们的决策目标以及如何部署社会资源。基于数据的科学决策是一贯追求的目标。然而,信息不对称是常态,因此传统的决策目标是建立相对满意而非最优(由决策科学家Simon建议),资源配置效率是基于计划的市场优势。13大数据
4、的角度:个性化服务+中间索弓1+宏链接目前,大数据的开发,主要是基于数据,为客户提供个性化的营错服务,预测中观行业或区域趋势指数,基于链接的宏观资源配置方案等角度。这不仅反映在阿里小伟的个性化风险控制决策中,高端品牌在线销售品牌和定价动态决策(基于阿里巴巴网络业务活动指数和零售商品价格指数)以及识别集团企业发展战略咨询报告,它也反映在阿里巴巴商业智能指数(预测经济发展趋势)和基于公共气象数据的资源配置优化服务中。互联网金融是大数据开发各个方面的前沿。在金融领域,我们必须实现从金融互联网到互联网金融的快速转变。传统模式下的金融企业开展在线业务,如:网上银行和网上银行不是真正的互联网金融。互联网金
5、融是指通过互联网上的新技术为客户提供搜索或风险控制等增值服务。消除供需结构不对称的P2P贷款,提高增值理财产品的效率。1.4 大数据的关键点:保证数据质量要开发大数据分析,首先要确保数据的质量。错误的输入必然导致错误的输出。没有数据质量.一切都是浮云C数据质量没有保证,是不敢用的。数据质量是一个耗时且费力的基础。确保数据质量需要数据收集和清理的两个原则:相关性和低噪声。首先,大数据不是越“大”越好,但越大的相关数据越多越好。特别是,在数据收集中,有必要尽可能多地收集“相关”数据,而不是尽可能不过滤。其次,当获取数据时,必须确保不存在诱导趋势的干扰因素,同时执行去噪处理。保证数据质量可以建立数据
6、。在建立数据质量数据标签方面取得了进展。利用数据质量数据,决策者可以更安全、科学和有效地使用数据1。2大数据的有效利用2.1 大数据时代,数据分类和清理工作首先,数据清理和清理是数据分析的基础。根据经验,大数据专家普遍认为,这项工作是一项基本工作,既耗时又简单,占数据分析工作量的60%以上,这是数据分析的前提和基础。在此基础上,数据分析需要识别数据,进行深入分析,编写专题报告,确保结果得以实施,最后实施决策和实施。其次,在大数据时代,有必要充分利用IT技术来管理数据质量工作。在大数据时代,手动发现和解决数据质量问题的方法成本高,效率低且不可持续。有必要对数据质量工作进行标准化,系统化和自动化管
7、理,并将节省的人力资源投入到新问题的研究中。2.2 大数据时代,数据分析的特点使用倒金字塔模型来分配,思考,工作,分享”的时间比例。数据分析工作包括三部分:“思考”,分析实际问题,将实际问题转化为数学模型,提出解决方案;“工作”,对解决方案进行编程并产生结果的过程;“分享”,即将分析结果转化为决策并将其付诸实践的过程。在时间分布中,金字塔结构或柱结构的分布形式不是最优结构,倒金字塔结构是合理的。也就是说,思考过程需要很长时间,这可以减少后期的工作量,少走弯路。第二,通过数据分析进行科学决策C许多人都有误解,并认为数据分析是做报告和撰写报告。在大数据时代,数据分析不仅仅是在这里,还需要深入分析才
8、能建立基于数据的决策过程。尊重数据,识别数据,但不识别迷信数据C在尊重数据和尊重事实的前提下,减少主观因素的干扰,快速做出数据决策是一种能力。第三,在大数据时代,数据分析的本质是简单,快速,大规模。数据分析的结果要简洁、易懂;数据分析的时间应该很短,结果应该尽可能自动化,并且应该快速满足客户的需求;数据分析方法可实现大规模扩展。一个好的数据分析师应该有一个全球性的远见,如果有问题,问题可以立即分解成很多问题。即使是一个问题也会被克隆到很多问题中,从而与业务人员建立信任并减少工作量。第四种是将“实时信息与死”消息分开。大数据有大量数据-产生大量“死”数据。错误的数据意味着数据与实际情况不一致。在
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 数据 分析