做了一个 elk 日志监控系统,通过 elastalert2 推送到钉钉上,遇到的问题是微服务某一个服务发版重启了,(目前都是单机部署)会导致不断的发送 timeout 这类的报警,期望是,重启服务阶段不进行报警,大佬们有好的思路吗

举报· 413 次点击
登录 注册 站外分享
3 条回复  
2Nfree 小成 前天 11:16
elastalert2 的日志告警原理上就是查询 ES ,直接设置规则 query must_not 对应 timeout 的日志类别,如果要是要求更高级的日志告警还是推荐用 flink cep 去做
Curiosity777 楼主 小成 前天 11:18
@2Nfree 好的,只是想控制重启期间的 timeout ,正常的还是要的,cep 我去了解下,感谢您的宝贵回答
2Nfree 小成 前天 11:22
@Curiosity777 #2 如果重启期间的 timeout 报错和正常的 timeout 的报错是一致的,那你这种需要监听日志上下文,如应用程序获取了 SIGNTEM 的信号,就发出一个应用被关闭的信号日志,然后通过窗口监听上文中有被关闭的信号再去屏蔽发版的 timeout 报错,但是我感觉这个需求有点伪需求的意思了,你知道他在发版了实际上就人工忽略就好了
返回顶部