大型集团企业海量非结构化数据存储解决方案.docx
《大型集团企业海量非结构化数据存储解决方案.docx》由会员分享,可在线阅读,更多相关《大型集团企业海量非结构化数据存储解决方案.docx(33页珍藏版)》请在第一文库网上搜索。
1、大型集企业海量非结构化数据存储解决方案目录1 .项目背景41.1 Y集团概述41.2 建立大容量存储所遇到的问题42 .需求分析63 .解决方案设计思路83.1 存痴殳备的艇83.2 整体架构的建设84 .总体设计94.1 方案说明94.2 数据调用方案104.3 数据的粉备份方案114.3.1. 磁带备份.114.4 归档存储系统架构设计124.5 数据调用方案134.6 离线备份方案144.7 容灾方案144.8 今后扩容方案154.9 存储容灾备份策略164.10 同步后数据调阅流程174.11 对于可能损坏数据的自动修复184.12 数据的误删除保护194.13 对于大容量文件的处理1
2、95 .存储系统实施规划206 .使用CAS存储方案的优势226.1 高安全性226.2 高访问效率2263.在线备份226.4. 灵活的扩充能力236.5. 对于文件的自我修复237.CAS存储产品将237.2. ICAS内部架构介绍257.3. 产品组成与功能介绍267.3.1 心模块277.3.2 基于WEB的监控管理界面277.3.3 自我管理模块287.3.4 节点间的通讯、管理模块297.3.5 数据复制.297.3.6 开放AP1297.4. 节点内部架构297.5. 安全可靠的硬件架构307.6. 节点间的架构307.7. 报警监控机制317.8. 设备性能指标327.9. 与
3、业务系统整合321 .项目背景1.1 Y集团概述Y集团正在研发中国最大的艺术品图片数据库,将填补中国文化艺术领域的空白在数据库中,Y集团高精度扫描后的艺术图片分三个等级:网络级(几百K1出版级(大部分小于50M,个别达到200M复制级(大至5G),现已超过IOO万份。16年底存储容量达5T,17年底达IOT,18年10月已到25To现有存储设备为:HPMSA1500一套,使用磁带作为离线备份设备。19年计划北京新增50TB存储,深圳新增20TB,上海新增5TBo今后根据实际情况进行三地容量的扩充,满足异地两份文件在线备份的安全性要求。公司到2023年存储容量预计达到170TB。1.2 建立大容
4、量存储所遇到的问题1)容量可能成为瓶颈由于局限于很多类型存储设备的设计,可能单个存储无法支持到实际的海量需求,如果使用多台存储设备则备份、同步等都会出现问题。2)读写效率对于海量存储的读写效率不同于普通容量的存储,由于计算机运算和存储位的限制,可能面临海量读写瘫痪的隐患问题,而目前对于这种高精度艺术图片的读写性能是非常需要看重的。3)备份和恢复能力的挑战对于海量数据的备份和恢复不同于传统的,关键在于大容量备份和恢复的时间周期,需要将备份和恢复的时间接受程度进行评估,因而目前使用的磁带备份方式会存在海量数据的备份问题,按1T02的实际测试速度计算(IOM/S),30TB的数据备份一次需要36天,
5、这是在实际应用中无法接受的。4)存储的高可用性存储设备作为海量数据的保存的平台,由于备份恢复的成本和时间,需要有一个非常安全的高可用性方案,设备应该充分考虑到比如硬盘等硬件损坏的情况对整个系统的影响降至1最氐。5)管理成本管理成本也是一个海量存储设备需要考量的问题,由于对安全性要求很高,如何实时来跟踪设备使用的情况和及时做出对策是非常重要的。6)大容量文件的展示问题需要管理的文件的容量远远要大于计算机所能在线打开的容量极限时的对策。7)文件损坏问题存储设备缺少主动监测功能。只能单纯的存入数据,但是并不能检测文件的完整性。往往由于磁头写入时的位错造成文件无法正常读取。8)确保整个存储系统的稳定需
6、要一个由一家厂商提供的整体存储方案。便于整个存储的维护与管理。9)全在线性能力保证数据的全在线能力,最快的寻找到数据。提高系统反应速度与等级。10)部署与实施充分利用现有的网络和服务器资源,在不影响网络通讯和不间断重要的关键业务应用的情况下,可以快速的部署实施。设备开机就能使用。2 .需求分析针对Y集团文化目前所用存储遇到扩容瓶颈的问题,我们认为Y集团文化需要一套整体的海量数据存储解决方案,具体需求为:1)需要海量可扩充的存储设备不仅可以满足对于日常文件的存储和读取,还要适应Y集团文化对于单个大容量文件(几百MB甚至GB级别的文件)的高速读写,随着Y集团文化存储容量的飞速发展,整个存储系统需要
7、有扩充灵活与无限制。扩容不能影响整个系统的性能。2)需要高读写性能由于1)文件的存储总容量非常大2)单个文件的容量演E常大,需要在这两个特性的前提下有很好的读写性能。3)备份和恢复能力存储设备要支持在海量情况下高速的在线备份和恢复解决方案。4)设备管理希望购买的存储是一个智能的可自动报警的设备5)存储的高可用性和性价比需要存储支持高可用性方案,比如双机热备,在线容灾等,在确保安全性的情况下希望有一个比较好的价格。6)与应用系统的整合能力目前现有的管理系统中可以在线查看网络级图片文件,对于出版级和复制级文件提供目录的链接,而希望通过存储扩容提供所有文件的在线查看解决方案7)消除重复存储对于相同的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大型 集团 企业 海量 结构 数据 存储 解决方案