1大数据综述.docx
《1大数据综述.docx》由会员分享,可在线阅读,更多相关《1大数据综述.docx(3页珍藏版)》请在第一文库网上搜索。
1、大数据综述作者:叶磊来源:商情2014年第46期【摘要1:大数据的出现和发展只有短短十几年的时间,可是却从社会生活、商业、科技等各个方面给人们的生活带来了巨大的影响,大数据的特征是数据量、时效性、多样性和数据准确性或数据的价值密度低。大数据主要的大数据处理模式有流处理和批处理两种。关键词:大数据特征处理模式流处理批处理大数据(Bigdata或Megada1a),或称巨量数据、海量数据、大数据,指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。在总数据量相同的情况下,与个别分析独立的小型数据集(dataset)相比,将各个小型数据集合并后
2、进行分析可得出许多额外的信息和数据关系性,可用来察觉商业趋势、判定研究质量、避免疾病扩散、打击犯罪或测定实时交通路况等;这样的用途正是大型数据集盛行的原因。1大数据的概念现代社会是一个信息化、数字化的社会,互联网、物联网和云计算技术的飞速发展,使得数据充斥着整个世界,从而让数据成为一种新的资源,亟待人们对其加以合理、高效、充分的利用。数据的数量以指数形式递增,数据的结构也越来越复杂,使得“大数据”具有和普通“数据”的不同的深层内涵。在天文学、高能物理、生物学、计算机仿真、互联网应用、电子商务等领域,数据量呈现快速增长的趋势。美国互联网数据中心(IDC)指出,互联网上的数据每年增长50%以上,每
3、两年翻一番,世界上90%以上的数据是最近几年才产生的。数据并非单纯指人们在互联网上发布的信息,全世界的工业设备、汽车、电表上有着无数的传感器,随时测量和传递有关位置、运动、震动、温度、湿度乃至空气质量变化等信息,也产生了海量的数据C著名数据库专家、事务处理的作者、图灵奖获得者JimGray博士总结出,在人类的科学研究史上,先后经历了实验(EmPiriCa1)、理论(TheoretiCa1)和计算(ComPUtationa1)三种范式,而在数据量不断增加和数据结构越来越复杂的今天,这三种范式已经无法满足新领域的科学研究需要,所以JimGray博士提出了科学的“第四种范式(TheFOUthPara
4、digm)这一新型的数据研究方式,即“数据探索”(DataExporation),用以指导和更新不同领域的科学研究。数据量的大小不是判断大数据的唯一指标。大数据的特征可以用4V概括:分别是数据量(Vo1ume)x时效性(Ve1ocity)x多样性(Variety)和数据准确性(Veracity),也有人把第四个V定义为数据的价值(Va1ue)密度低。和传统意义上的数据相比,大数据的数据类型复杂,其中包括了大量的非结构化或半结构化数据,如网络日志、图片、音频、视频、地理位置信息等。大数据的价值密度低。例如:在大量的视频监控数据中,真正有价值的信息可能只有几帧,大量的视频数据是无价值数据。大数据的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 综述