2023Hbase存储优化方案例.docx
《2023Hbase存储优化方案例.docx》由会员分享,可在线阅读,更多相关《2023Hbase存储优化方案例.docx(41页珍藏版)》请在第一文库网上搜索。
1、开篇辞最近工作中用到亿级数据的优化问题,hive尝试了一些方法,石沉大海了,查询都得几分钟,z这肯定不行啊,还得优化,于是另一个部门尝试用hbase数族解决了这个问题,5亿的数据秒级返回结果,这里记录一下我最近学习HbaSe的学习总结吧。HbaSe的基础概念HBaSe是基于APaCheHadOOP的面向列的NOSQ1数据库,是GOOg1e的BigTab1e的开源实现。HBaSe是一个针对半结构化数据的开源的、多版本的、可伸缩的、高可靠的、高性能的、分布式的和面向列的动态模式数据库。HBaSe和传统关系数据库不同,它采用了BigTabIe的数据模型增强的稀疏排序映射表(Key/Va1ue),其中
2、,键由行关键字、列关键字和时间戳构成。HBase提供了对大规模数据的随机、实时读写访问。HBase的目标是存储并处理大型的数据,也就是仅用普通的硬件配置,就能够处理上千亿的行和几百万的列所组成的超大型数据库。Hadoop是一个高容错、高延时的分布式文件系统和高并发的批处理系统,不适用于提供实时计算,而HBaSe是可以提供实时计算的分布式数据库,数据被保存在HDFS(分布式文件系统)上,由HDFS保证其高容错性。HBase上的数据是以二进制流的形式存储在HDFS上的数据块中的,但是,HBase上的存储数据对于HDFS是透明的。HBase可以直接使用本地文件系统,也可以使用Hadoop的HDFSo
3、HBase中保存的数据可以使用MaPRedUCe来处理,它将数据存储和并行计算有机地结合在一起。HBase是按列族进行数据存储的。每个列族会包括许多列,并且这些列是经常需要同时处理的属性。也就是说,HBase把经常需要一起处理的列构成列族一起存放,从而避免了需要对这些列进行重构的操作。HBaSe在充分利用列式存储优势的同时,通过列族减少列连接的需求。HbaSe的SheI1命令一般操作DD1操作数据定义语言(DataDefination1anguage,DD1)操作主要用来定义、修改和查询表的数据库模式。1.创建一个表hbase(main):014:01istTAB1EStutab1etest4
4、.册IJhbase(main):016:0a1tertab1e,NAME=co1umn-fama1y,METHOD=,de1eteUpdatinga11regionswiththenewschema.1/1regionsupdated.Done.0row(s)in3.0220seconds然后删除一个表。6.查询表是否存DM1操作DM1(DataManipu1ation1anguage,数据操作语言)操作主要用来对表的数据进行添加、修改、获取、删除和查询。1.插入数据给emp表的rw1行分别插入3个列。2.获取数据获取emp表的rw1行的所获取emp表的rw1行Co1f1列族的所有数据。hba
5、se(main):035:0getemp,rw1,co1_f11row(s)in0.0340seconds1row(s)in0.0140secondshbase(main):039:0get,emprw1jCO1UMN=co1f1:age,TIMESTAMP=1463055735107)CE11CO1UMNco1f1:agetmestamp=1463055735107,va1ue=20CO1UMNCE11co1f1:agetmestamp=1463055893492,va1ue=22hbase(main):040:0get,emp,rw1(CO1UMN=co1f1:age,T1MESTAMP=
6、1463055893492hbase(main):041:0scan,emp,ROWCO1UMN+CE11idco1umn=co1_f1age,timstamp=1463055893492jva1ue=2idco1umn=co1_f1:name,timestamp=1463055709542jva1ue=tanggaoidco1umn=co1_f1:sex,timestamp=1463055753395,va1ue=boyhbase(main):042:0de1eteemp,rw1,co1_f1:age0row(s)in0.0200seconds检查删除操作的结果。truncate会把表分区也
7、清除掉HBase表实例下面将以一个“学生成绩表”的例子来介绍常用的HBaSe命令的使用方法。图1是一张学生成绩单,其中,name是行键,grade是一个特殊列族,只有一列并且没有名字(列族下面的列是可以没有名字的),c。UrSe是一个列族,由3个列组成(Chinesemath和eng1ish)o用户可以根据需要在course中建立更多的列,如computingsPhySiCS等。学生成绩表nafecoursegradeChinesematheng1ishJim190858STom9710092图1学生成绩单1.建立一个表scores,包含两个列族:grade和courseput,scores,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 Hbase 存储 优化 案例