2024 Zabbix中国峰会 关于我们 联系我们 加入我们
5

Zabbix+Grafana,打造领导青睐的数据可视化大屏

图片

本文整理自Zabbix大中华区认证培训师任勇老师在2023峰会上的演讲。


一文掌握Grafana+Zabbix强强联合带来的数据可视化效果,让你做出备受领导青睐的数据大屏,酷炫展示技术工作成效和数字化成果!


以下是演讲内容:



大家下午好,我是任勇,非常荣幸能和各位老师进行本次技术交流和学习,今天我带来的主题是:Grafana+Zabbix打造领导爱看的数据可视化


图片

分享主要包括以下四个部分:第一部分关于运维监控可视化的现状,从具体的使用场景来分析目前运维监控可视化的现状;第二部分将介绍一下 Grafana 可视化平台的一些功能和设计理念;第三部分介绍运维监控可视化的设计原则,介绍如何才能设计一个既漂亮又有逻辑的大屏;最后分享一些 Grafana+Zabbix的一些落地案例,是我们这两年里客户认可度较高的项目,也是性价比较高的一种解决方案。


1

运维监控可视化现状

图片
图片

随着混合云和云原生的诞生与发展,监控系统越来越多,监控的维度也越来越丰富。我们可能对传统的架构采用Zabbix,对于云原生可能用K8S,日志监控可能采用的是ELK的一套解决方案等等。每一个监控软件都有可视化的能力或者组件在,但是公司里可能有多个工程师要打开四五个URL去查看,这个效率是非常低的,而且数据也比较分散,相互之间也没有关联性。

图片

想必大家之前也有类似的一些不好的体验,加上可视化的效果比较单一,不够酷炫,达不到领导的要求,或者领导根本看不懂,达不到他想要的数据可视化的数据大屏的效果。

图片

关于监控可视化工具,市面上主要有两种:一种比较重量级的叫BI工具,这些产品相对来说也是比较成熟的,也比较重量级,一般是架在我们数据中台上面,直接对接监控系统,需要大量的开发。第二个是比较轻量级的,像关于运维的可视化的产品,像Kibana,还有阿里开源的DataV,这是我们国内用的比较多的。

图片

针对这些工具我们也做了一些详细的对比。BI工具是经过大数据中台去进行转化,它的优势是对这种ES的这种展示有管理的能力,非常方便。那么关于DataV,阿里前期用的是这个,不过现在阿里已经跟Grafana合作了,阿里上的可观测平台就是用Grafana去打造的,所以说综合对比来看,Grafana是占据了绝对的优势,这也是我们为什么选择Grafana。

图片

这个是我们传统运维监控可视化的整体架构,主要就是采集层、处理层和展示层,采集层就是各自在擅长的这个领域里面去使用工具。那么我们在上层直接架一个Grafana,做一个统一的全局,会非常方便,性价比也比较高,基本上都不用开发,开箱即用。


2

Grafana 可视化平台简介

图片

图片

接下来第二部分我们介绍一下Grafana,它是一个开源的监控数据分析和可视化平台,对Metrics 、 Log 、 Trace 数据进行可视化分析和展示,这个就是它主要的核心理念。


其次 Grafana 还是 Prometheus官方推荐的可视化组件, 它非常轻量级,你解压 run 起来就可以跑了,不用让这个环境再装什么中间件、数据库之类的,它是不保留我们展示的数据的,只保留配置数据。

图片

它的第一个优点是非常灵活,支持拖拉拽,可以根据我们的屏幕进行任意的布局,以及分辨率、颜色什么的都可以进行调整;


第二就是低代码,你不用有任何开发基础,也可以在页面上进行配置;最后就是它是基于 H5 去写的,所以对于移动端去访问完全没有问题啊。


另外,Grafana提供了开箱即用的数据源,它默认社区里面目前已经有166个数据源;还有就是前端的展示插件也是非常丰富的,目前在社区里面已经有 133 种了,也就是我们看到的是这种柱状图、折线图和一些酷炫的地图都是开箱即用的。

图片


我们再看一下关于 Grafana 跟Zabbix集成的优势, Grafana 本身是提供了Zabbix的这样一个对接的插件,是开箱即用的,大家安装好了之后点击 enable 一下就能启用了。然后就可以直接去前端页面上去查询数据,想要查哪一类型的数据直接选哪个类型,然后它就会把你Zabbix上有的数据直接以动态的方式给你弹出来,你只需要做选择就行了。


那么我们在Grafana上要展示咱们的数据,大概也就10到20分钟的时间,非常的便捷。如果你是要走自定义开发的方式的话,没有一星期肯定搞不定,搞定了可能还有bug,大家用过的应该都知道。


3

运维监控可视化设计原则

图片
图片


第三部分我将分享关于运维监控可视化设计原则。我们如何去设计一个既漂亮又有逻辑的数据大屏呢?主要的核心原则是两点,第一点是UI 设计原则,第二点是数据设计原则。关于 UI 这一块主要是布局、图表、字体、颜色这四个方面,这个有一定的参考样例。关于数据设计原则有指标、日志、链路、和资产

图片


关于 UI 的布局,通用的布局主要1: 1 布局和 2: 1 布局;图表就是关系到我们要展示的数据,你要展示什么类型的数据就选择什么类型的图表;关于字体和颜色,字体的话我们建议使用目前比较流行的字体,像微软雅黑、思源黑体等。字体颜色建议通过公司LOGO的主色调,注意字体颜色不要太多,可以通过 3- 5 种的颜色,通过 2: 1 的布局绘制一个非常酷的图片。


图片

数据的设计原则主要是以受众为中心,也就是说我们这个屏是做给谁看的,其次每一个观看者的角色,他关注的内容是不一样的。


一般在运维系统中心里面会有值班运维、系统运维、应用运维管理者4种不同的角色,管理者关注的可能是整个数据中心的宏观数据;应用运维可能关心某个应用系统可观测性的数据;系统运维,他可能关注的是某个资源、某个实例的状态、容量、性能数据;值班运维关注的可能是某个时间段的详细报警以及某个设备以及当天的值班人员信息,他能通过这个报警联系到对应的人去做处理。


图片

对于管理者,可以通过这三个维度的数据来支撑我们的大屏。最下面放报警信息,中间一部分放整体资产的性能统计,最上一层可以放资产信息,这样对于管理者来说,就可以从全局视角来看整个数据中心。

图片


对于应用运维,可以以某一个应用系统,从这个应用系统到IAAS层、PAAS 层到 SaaS 层分别去展示这个应用系统的健康状态。还可以通过可观测性的这个维度,绘制Metrics 、 Log 、 Trace 这三层数据去展示某一个应用系统。

图片


对于系统运维,我们就可以基于某一个实例去展示这个实例的容量、性能以及状态,这都是关于每一个实例具体的一些 KPI 指标。

图片


对于值班运维,我们可以展示当天的值班人员、事件统计以及事件的一些明细。


4

Grafana 在 Zabbix的一些落地案例

图片
图片


第一个案例是某银行支付公司,当时他们想新建一个机房,需要搭建一个统一的监控平台以及统一可视化平台,选了Zabbix作为他们整个的监控平台,主要是监控他们的操作系统、数据库、硬件、网络,是一个全覆盖监控。其次我们通过 Grafana 来对接Zabbix去做一个统一的展示。该公司主要做了一些像网络拓扑的展示,资源水位的展示,包括应用画像,也就是可以以应用的维度展示应用的画像。还做了机房的画像,也就是机柜的画像以及某个资源的性能仪表。每一个层面的展示也是做了关联的,也就是说可以通过机柜的画像下钻到他的机房,通过机房可以下钻到资源,或者说从一个网络拓扑下钻到某一个设备资源,这样的话应用人员在看起来就非常方便。对于领导来说可以看到全局的数据,这是我们最终落地的效果图。


图片


再看第二个案例,这个是某期货公司,背景是通过开源监控系统去替换他们原有的商软。当时选型选的也是用Zabbix作为整个的全覆盖的监控平台,而且当时也是使用 Grafana 做了一张大屏给他们领导去看的,Zabbix也是一样的对基础设施进行了全覆盖的监控。


我们看到这个右上角这是一个关于Grafana绘制的资产的统计,包括整体的性能和整体的告警,中间的地图展示了全国业务专线状态。

图片


最后一个案例是某跨国企业,他们的环境是一个混合云,也就是有传统架构,也有云原生的架构。他们的传统架构采用的是Zabbix做监控,云原生是通过Prometheus去进行监控,在上层架了一个 Grafana 作为展示。我们可以看到展示的其中两张效果图,一个是应用画像,可以展示某个应用系统里每一个服务之间的调用的这个状态,还有一个是网络监控可视化大屏,可以展示整个数据中心以及一些客户站点的网络详情。


2024-07-05