基于B+树的电力大数据混合索引设计与实现.docx
《基于B+树的电力大数据混合索引设计与实现.docx》由会员分享,可在线阅读,更多相关《基于B+树的电力大数据混合索引设计与实现.docx(5页珍藏版)》请在第一文库网上搜索。
1、基于B+树的电力大数据混合索引设计与实现随着电力行业数字化、信息化的发展,电网数据来源多元化、复杂化,各种智能电表、传感器、信息系统等分布式数据源在发电、输电、配电、用电及调度、营销等多个环节持续不断地产生大量数据,促使电力数据呈几何级数增长。这些数据是建设稳定、可靠、高效智能电网的支撑性元素之一,它在揭示电力行.业内部某些特有的规律的同时,反映着社会的经济发展状况,是未来电力发展的重要参考依据。考虑到电力数据中数据类型复杂多样,字符型和数值型属性并存,本文构建基于B+树以及倒排索引的双层混合索引,来完成对电力数据的检索需求。O前言随着社会的快速进步以及信息技术的迅猛发展,促使各行业数据量以惊
2、人的速度快速增长。据2016年IDC研究报告统计,到2023年全球数据总量预计会达到40ZB,相当于平均每人拥有5247GB的数据。由此可见数据浪潮澎湃来袭,社会各个行业也将开始进入“大数据时代”。中国电力工业作为社会根本能源支持体系也开始步入大数据浪潮之中。随着电力行业信息化的发展,以及全新的数据计算处理技术如云计算和物联网等技术在电力行业中的普遍应用,电力行业中数据量的增长也呈现出相似的态势并形成了一定的规模。智能电网、智能园区、智能楼宇、智能家居等都向智能化、信息化靠拢,未来将会产生大量的实时监控数据、各种用电信息的实时采集数据、地理信息数据等各种数据资源。除此之外,数据的采集的密度不断
3、增大,数据类型不胜枚举,对数据的精细化程度的要求也越来越严格,这使得电力系统中的数据急剧增长,中国的电力企业开启了全新的电力大数据时代。在电力信息化快速发展的背景下,电力大数据具有数据量规模巨大、数据类型种类繁多、计算速度快等特点,传统的数据分析处理方法在管理大数据时显得捉襟见肘,现今的数据形式对电力数据的管理、分析及展示技术提出了新的要求。在海量的数据中快速获得有价值的信息有助于提升电力公司数据资源价值利用的整体水平,为电网的安全稳定运行提供有效支撑。1电力大数据特点和检索方式1.1 电力大数据2013年3月,中国电机工程学会编制发布了中国电力大数据白皮书,重新定义了电力大数据的特征,即3V
4、和3E:3V指数量大(Vo1Ume)、类型多(Variety)和速度快(VeIoCity),3E指数据即能量(Energy)、数据即交互(Exchange)、数据即感知(Empathy)o提出了重新塑造电力企业核心竞争力和转变中国电力行业发展方向两条中心主线;为领导辅助决策划定了重点,为电力系统大数据发展指明了方向。1.2 数据检索方法在电力大数据中,用户的检索请求的目标数据可能来自多个数据。与传统搜索引擎不同的是,大数据服务的检索用户有两种,一种是单独普通用户,一种是针对行业内部人员以及应用程序。就普通的个人用户而言,他们不了解数据的基础模型、存储位置以及组织结构信息等,适合使用关键字检索;
5、对于专业人员和应用程序来说,他们对要检索的数据所在的系统相对了解,因此采用语义查询并且使用SPARQ1查询语言进行检索。因为数据规模较大,要采用分布式数据库存储,传统的串式检索方法便不再适用,这就要求在数据检索时也要采用同样的分布式信息检索方法来适应大数据的检索需求。1.3 关键技术索引是提高数据检索和查询效率的一种有效机制,即在信息检索过程中,把数据实际存储的地址与和它相关的关键码或多个辅码联系起来,让数据查询请求可以很快的找到相关数据。B树是一种适用于外查找的树形结构,它是一种平衡多叉树,支持多路查找。目前在大多数数据库系统及文件系统中最常用也是最基础的都是采用B树或其变形B+树作为其索引
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 电力 数据 混合 索引 设计 实现