主流分布式存储技术对比分析-GFS-HDFS-GlusterFS-Ceph-Swift.docx
《主流分布式存储技术对比分析-GFS-HDFS-GlusterFS-Ceph-Swift.docx》由会员分享,可在线阅读,更多相关《主流分布式存储技术对比分析-GFS-HDFS-GlusterFS-Ceph-Swift.docx(9页珍藏版)》请在第一文库网上搜索。
1、主流分布式存储技术对比分析GFSHDFSG1usterFSCephSwift【导读】如今分布式存储产品众多令人眼花缭乱,如何选型?要根据其背后的核心架构来分析它本来的原貌,然后才能决定其是否适合我们的具体场景。1引言目前市面上各个厂家的分布式存储产品五花八门,但是如果透过产品本身的包装看到其背后的核心技术体系,基本上会分为两种架构,一种是有中心架构的分布式文件系统架构,以GFS、HDFS为代表;另外一种是完全无中心的分布式存储架构,以CePh、Swift.GIUSterFS为代表。对具体分布式存储产品选型的时候,要根据其背后的核心架构来分析它本来的原貌,然后才能决定其是否适合我们的具体场景。2
2、主流分布式存储技术对比分析2.1 GFS&HDFSGFS和HDFS都是基于文件系统实现的分布式存储系统;都是有中心的分布式架构(图2.1);通过对中心节点元数据的索引查询得到数据地址空间,然后再去数据节点上查询数据本身的机制来完成数据的读写;都是基于文件数据存储场景设计的架构;都是适合顺序写入顺序读取,对随机读写不友好。图2.1中心化的分布式存储架构接下来,我们来看GFS和HDFS都有哪些具体特性,我们应该如何应用?1. GFS是一种适合大文件,尤其是GB级别的大文件存储场景的分布式存储系统。2. GFS非常适合对数据访问延迟不敏感的搜索引擎服务。3. GFS是一种有中心节点的分布式架构,Ma
3、Ster节点是单一的集中管理节点,既是高可用的瓶颈,也是可能出现性能问题的瓶颈。4. GFS可以通过缓存一部分MetaC1ata到CIient节点,减少C1ient与MaSter的交互。5. GFS的MaSter节点上的OPerationIog和CheCkPOint文件需要通过复制方式保留多个副本,来保障元数据以及中心管理功能的高可用性。相对于GFS来说,我们来看HDFS做了哪些区别?1. HDFS的默认最小存储单元为128M,比GFS的64M更大。2. HDFS不支持文件并发写,对于单个文件它仅允许有一个写或者追加请求。3. HDFS从2.0版本之后支持两个管理节点(NameNode),主备
4、切换可以做到分钟级别。5. UDFS更适合单次写多次读的大文件流式读取的场景。6. HDFS不支持对已写文件的更新操作,仅支持对它的追加操作。2.2 G1usterFSG1usterFS虽然是基于文件系统的分布式存储技术,但是它与GFS/HDFS有本质的区别,它是去中心化的无中心分布式架构(图2.2);它是通过对文件全目录的DHT算法计算得到相应的Brike地址,从而实现对数据的读写;它与Ceph/Swift的架构区别在于它没有集中收集保存集群拓扑结构信息的存储区,因此在做计算的时候,需要遍历整个卷的Brike信息。图2.2G1usterFS接下来,我们来看GhISterFS都有哪些具体特性,
5、我们应该如何应用?1. GIUSterFS是采用无中心对称式架构,没有专用的元数据服务器,也就不存在元数据服务器瓶颈。元数据存在于文件的属性和扩展属性中。2. G1USterFS可以提供Raid0、RaidkRaidI+0等多种类型存储卷类型。3. G1USterFS采用数据最终一致性算法,只要有一个副本写完就可以COmmit。4. G1USterFS默认会将文件切分为128KB的切片,然后分布于卷对应的所有Brike当中。所以从其设计初衷来看,更适合大文件并发的场景。5. G1usterFS采用的DHT算法不具备良好的稳定性,一旦存储节点发生增减变化,势必影响卷下面所有Brike的数据进行再
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 主流 分布式 存储 技术 对比 分析 GFS HDFS GlusterFS Ceph Swift