1 告警路由介绍
所谓的告警路由,就是将不同的告警消息转发给不同的接收⼈,以便故障能快速的被处理和解决。
Alertmanager 的告警路由配置,使⽤的是树状结构来定义,以确保每条告警消息都能够按照定义好的路径进⾏处理。当⼀条告警消息进来后,会先进⼊根路由,然后逐级的去匹配每个⼦路由的规则,然后将消息通过媒介发送给对应的接收⼈。
例如,我们可以设置⼀个规则,将标签severity级别为 critical 的告警发送到钉钉,⽽剩余其他的告警则全部发送给邮箱。
AlertManager告警路由场景示例:
1、mysql_exporter 和 redis_exporter 的Job告警时,就将其发送给钉钉团队。
2、node_exporter 的Job告警时,则将告警路由到邮箱139团队。
3、最后,如果告警消息不符合上述任何⼀个规则,它们将默认路由到邮箱qq团队。
2 告警路由实践
2.1 配置AlertManager
添加⼦路由规则
2.2 检查语法
#检查语法
/app/module/alertmanager/amtool check-config /app/module/alertmanager/alertmanager.yml
2.3 重新加载AlertManager
#重新加载
curl -X POST http://192.168.137.131:9093/-/reload
3 告警路由验证
1、触发mysql和redis的告警,验证钉钉团队是否能收到告警消息
2、触发node相关的告警,验证邮箱139团队是否能收到告警消息
3、触发zookeeper相关的告警,验证邮箱qq团队是否能收到告警消息