从智慧运维到系统可观测性.docx
《从智慧运维到系统可观测性.docx》由会员分享,可在线阅读,更多相关《从智慧运维到系统可观测性.docx(4页珍藏版)》请在第一文库网上搜索。
1、从智慧运维到系统可观测性可观测性是近期最热的IT话题之一。本文带你了解可观测性的意义、可观测性与监控以及智慧运维关系。一、什么是可观测性从去年下半年开始一直到现在,在IT运维领域有一个词一直热度不减,甚至一度超过了当初的AIOps,那就是“可观测性”。可观测性(Observabi1ity)本来是一个自动控制领域的一个术语,在控制论中,可观测性是指系统可以由其外部输出,来推断其内部状态的程度,系统的可观测性越强,我们对系统的可控制性就越强。2018年CNCF把这个概念引入了IT运维领域,称其是云原生时代最重要的系统能力。这个观点虽然跟CNCF的定位有关,但也绝不是危言耸听,至少可观测性是2023
2、年最热的IT话题之一。可观测性的核心是什么,其实就是度量,度量你的从基础设施、平台、应用、数据和业务,了解他们是如何运行的,系统状态从黑盒专向白盒。二、为何需要可观测性管理学大师彼得德鲁克曾经说过“你如果无法度量它,就无法管理它(“Ifyoucantmeasureit,youcan,tmanageit”)。要想有效管理,就难以绕开度量的问题。IT也是一样,近些年IT架构和技术栈发生了非常大的变化,新技术的应用以前所未有的速度吞噬着传统IT势力。随着容器、微服务、中台的迅速流行,使得系统间的访问越来越复杂,在云内、云间可能会运数千个进程和服务,服务的调用用传统的点对点和点对多点演变成网状,使用传
3、统的监控技术和手段很难跟踪这些分布式架构中的数据流、调用链和相互依赖关系,系统内部的可见性就变得非常重要。可观测性工具和系统可以有效的帮助运维团队实现对复杂系统的监测和控制,协助团队有效的从纷繁复杂的原始监控数据中,找到线路,追溯到故障原因,进行有效的根因分析。三、可观测性与监控的关系1、可观测性概念分析我们谈可观测性这个概念,更多的是站在管理者的视角在看问题,如果管理者可以轻易的从可观工具上得到想要的数据和答案,没有阻力和没有困惑,这就是我们满意的可观测性。比如我们想看了解基础设施的状态,我们有仪表盘。我们想看查看系统延迟的原因,我们有服务调用链追踪。我们的需求都可以被各种不同的工具满足。但
4、是系统原来越复杂,管理者和被管理对象都发生了很大变化,原有的可观测工具不再满足日益增长的需求,于是我们建立了越来越多的工具竖井,我们的运维系统和IT监控重新陷入了混乱。我们在这种“一乱一治”中消耗着我们的热情和成本。现在正在被热捧的可观测性,把上面的那些竖井和柱子整合了三大要素,日志(1og)、指标(MetriC)和追踪(TraCe)。D日志:记录了特定时间发生的各种离散事件的信息,用于检测系统中无法预知的行为。2)指标:指标是根据随时间变化的数据,是在一段时间内测量的数值。与日志不同,指标在默认情况下是结构化的,这使得查询和优化存储变得更加容易,让您能够将它们保留更口时间。3)追踪:请求通过
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智慧 运维到 系统 观测