0
点赞
收藏
分享

微信扫一扫

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍


文档编写目的




在CDSW1.7及以后版本引入了Prometheus + Grafana提供了一套可视化的Dashboard,可以监视CDSW中各个Pod是如何使用集群的CPU/GPU、内存及存储资源。Prometheus是一个内部的时序数据源,会自动记录CDSW中每个部署资源使用数据,Grafana是一个可视化的监控仪表盘,可以自定义自己的监控图表。CDSW默认已提供了3个Grafana的Dashboards:K8 Cluster,K8s Container 和K8 Node,通过提供的基础监控仪表盘可以创建更多的自定义监控图表。本文档会介绍如何查看及使用Grafana。

  • 测试环境

1.CDSW1.7.2


功能介绍及使用





2.1 Grafana监控界面

1.使用管理员登录CDSW,进入“Admin”>“Overview”页面,然后点击链接跳转

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_自定义


2.Grafana主页如下:

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_数据_02


3.点击左上角的Home,可以看到Grafana默认提供的三个仪表盘:

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_自定义_03

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_数据源_04


2.2 K8s Containers Dashboard


进入K8s Containers的Dashboard界面,该监控图表主要提供了CDSW集群中所有启动的Pods监控信息(每个pod的资源使用情况)

Pods使用的内存和CPU:

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_自定义_05


Pods使用的CPU曲线图以及各进程使用的CPU情况:

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_数据_06


Pods使用的内存曲线图以及各进程使用的内存情况:

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_数据源_07


Pods使用的网络IO曲线图以及各进程使用的网络IO情况

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_自定义_08


查看单个pod的资源使用情况(可以对应到CDSW启动的Session)

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_数据源_09

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_自定义_10


2.3 K8s Node Dashboard

进入K8s Node的Dashboard界面,该监控仪表盘主要提供了CDSW集群所有Node节点资源使用情况的监控(可以理解为服务器级别的资源使用监控),包括CPU、内存、磁盘、网络等。

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_数据_11


2.4 K8s Cluster Dashboard

进入K8s Cluster的Dashboard界面,该监控仪表盘主要提供了对K8s Cluster所有NameSpace级别的资源使用情况监控(通过该Dashboard可以看到用户级别的资源使用情况)

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_自定义_12

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_数据源_13


指定Namespace(default-user-{userid}该类型的Namespace即为用户级别的监控)

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_数据源_14

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_数据_15


2.5 自定义Dashboard

1.创建一个自定义的Dashboard

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_自定义_16

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_自定义_17


2.选择创建一个Graph类型的图表

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_数据_18


3.选择Edit

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_数据_19


4.进入图表编辑界面,选择数据源并输入查询语句完成图表的构建

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_自定义_20


5.点击右上角的保存按钮将构建的图表保存至自定义的Dashboard即可

0775-1.7.2-CDSW的Prometheus和Grafana功能介绍_数据_21


总结




1.CDSW1.7.x的新功能Grafana,可以很好的监控CDSW上的资源使用情况,包括系统服务以及用户使用。

2.Grafana中支持告警的配置,可以针对仪表盘进行配置,触发阈值后会进行告警。

3.除了系统提供的默认Dashboard,还可以进行自定义,将想要监控的指标通过PromQL语句转化成图表即可,参考链接:


https://prometheus.io/docs/prometheus/latest/querying/basics/

举报

相关推荐

0 条评论