DBA 眼中的存储监控运维进阶.docx
《DBA 眼中的存储监控运维进阶.docx》由会员分享,可在线阅读,更多相关《DBA 眼中的存储监控运维进阶.docx(6页珍藏版)》请在第一文库网上搜索。
1、DBA眼中的存储监控运维进阶【摘要】数据库出现IO问题的时候,DBA总是希望能把问题推诿给存储,说是存储的IO能力不行,而存储专业后面已经没有背锅侠了,所以没办法再往后推,只能选择反击数据库和存储是密切相关的两个IT组件,很多数据库的问题有可能和存储的问题相关。不过在IT运维中,数据库和存储的运维管理一般属于两个互相独立的部门,因此二者的配合总是无法达到十分默契的程度。数据库出现IO问题的时候,DBA总是希望能把问题推诿给存储,说是存储的IO能力不行。而存储专业后面已经没有背锅侠了,所以没办法再往后推,只能选择反击,自证自己没问题,问题一定出在数据库本身或者前面的应用。存储管理员一般会用一份D
2、BA看的云山雾罩的报告来证明存储本身没有问题。DBA也因为专业知识不够丰富而往往只能接受这个问题,集中精力去找前端应用的麻烦。这样的例子在实际生活中比比皆是,不过这种情况存在,对于企业的IT运维来说并不是一件好事情,很多这样的隐患都被这种退位埋藏下来,等到爆发的那一天一定是一件大事。78dbfi1epara11e1write平间:2502.17,超0定国-,30.077模型指标扣分严重1ogfi1esync平均等砌间:20874.15,大于50)W|g)771ogfi1epara11e1write平均等痔时间:32.81,超出范困H16.0Jfu1(Wg751ogfi1epara11e1wri
3、te平均等待时间:247.54.超出范图-,16.0f(Wg75模型搭标扣分严量;1ogfi1esync平均等恃时间:18241.95,大于5074模型指标扣分严重Jogfi1esync平均等待时间:1251.36.大于50酗)ds74一项:1ogji1e.sync.wa懿:1OGFI1ESYNCS延时超过n或就由泰乐存在性能屋里:值为152.96,超出定BB:510。)g72dbfi1epara11e1write平均等与时间:743.75.超出金国-,30.0)W)gAAEOA几年前遇到一个案例,客户的系统中的5套数据库突然依次宕机,后来重启后系统恢复正常。从D-SMART的历史数据看,存在
4、大量的写IO的延时异常问题。从健康模型上看,这个问题实际上在宕机前就已经比较严重了。IO存在十分严重的问题。通过工具进行了一下IO诊断。诊断工具分析后端存储的IO性能存在问题。根据这种情况,我们认为存储的链路可能存在问题,报给客户后,客户也找存储厂商过来检查了一番。因为这件事发生在早上业务高峰,对企业的一个核心外网APP造成了严重的影响,因此大家都在推诿。存储厂商坚称存储绝对没有问题,因为数据重启后系统都很正常。我们通过D-SMART观察发现,数据重启后,写IO的性能依然不是很正常,不过存储厂家坚称没问题。于是客户也就只能找了几条写的不好的SQ1,让开发商整改了事了。事后我和负责系统运维的主管
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DBA 眼中的存储监控运维进阶 眼中 存储 监控 进阶