对大数据的认知概览.docx
《对大数据的认知概览.docx》由会员分享,可在线阅读,更多相关《对大数据的认知概览.docx(6页珍藏版)》请在第一文库网上搜索。
1、大数据之我见数据,在人类社会产生之时就已经存在,它是信息的表现形式和载体,不仅仅是数字,还可以是文字、图像、语音、视频等。随着互联网技术的深入发展,人类所创造的数据量呈现爆炸式增长,利用科技对这些原本没有意义的数据进行存储、处理和分析而得到的信息将对我们的生活方式产生巨大的影响。而大数据正是一种大小远远超过传统数据库系统所能收集、存储并分析的能力的数据集,分布式存储和分布式处理例如云计算等技术使得分散的大数据得以被集中的处理分析,毫无疑问,在互联网高速发展的时代下,大数据应运而生的数据应用已经渗透到了我们生活的方方面面,以其规模巨大、种类繁多、增长速度快、变化频繁和极具数据价值这五大特征,开创
2、了新时代的数据智慧。多维度数据碰撞产生的火花,让我们更加深刻的了解自己并贴近未来世界。大数据时代来临,我们的生活发生了巨大改变,数据应用带来了变革性的便利之处。在教育上,利用大数据实时记录学生的学习进度,让学生和教师都能及时、全面的掌握学习情况,从而发现不足和优势,有针对性的提出解决方案,加强练习;在日常生活中,各类智能家居设备已经进到家中,如智能门锁、智能冰箱、智能空调、智能传感器等等,让我们不在家时也可以第一时间掌握异常情况,或是提前让设备运行,为自己的生活带来便捷。还比如专门针对老人的智能监测系统,基于收集的老人海量行为数据和生理数据,发现其作息规律,形成一套完整的数据系统,从而预测异常
3、值,在有异常情况发生时能及时做出行动。在医疗上,我们让机器人如同资质深厚的老医生一样不断地学习积累病例中的数据,从读懂诊断报告,读懂某个病人的病例,到利用数字3D导航辅助医生的手术,帮助实现精准手术。在金融上,在农业上大数据在社会各个方面所带来的技术都极大的提高了人们的生活质量和生活水平,人们对于海量的数据的挖掘和运用,深刻的改变了传统的工作和思维模式,成为推动社会发展的创新引擎。正因如此,作为当代大学生的我们应该把握时代潮流,更新迭代,不断学习。首先,学会采集数据。数据采集是指从真实世界中获得原始数据的过程,是大数据分析的入口,是获取有效数据的重要途径。数据采集的办法有很多,用于采集物理世界
4、信息的传感器、用于采集数字设备运行状态的日志文件以及用于采集互联网信息的网络爬虫,其中网络爬虫是需要我们重点学习的。网页的生成主要是通过编写HTML文件,是一种半结构化数据,我们可以学习python语言来进行爬虫,也可以利用八爪鱼等爬虫软件来搜集我们想要的信息。其次,得到原始数据后,为了使数据更好地为我们所用,需要对大数据进行预处理。预处理是使残缺的数据完整,将冗余的数据删除,有效提高数据质量的一个必备步骤。数据预处理可以分为数据变换和数据清洗两个部分。数据变换是将数据转换成适当的形式以便更好地理解和处理,如简单函数变化、数据标准化、数据归一化、数据平滑等;数据清洗则是根据数据质量的五个维度的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 认知 概览