您现在的位置是:数据库 >>正文
Alertmanager 配置终极指南:从“邪道”到正规军
数据库772人已围观
简介Prometheus Operator 的 AlertmanagerConfig 死活不生效时,我选择了对加密配置下手...问题背景部署 Prometheus Operator 后,精心配置的 Ale ...
Prometheus Operator 的邪道 AlertmanagerConfig 死活不生效时 ,我选择了对加密配置下手...
问题背景
部署 Prometheus Operator 后,配置精心配置的终极指南正规 AlertmanagerConfig 资源死活不生效 。在无数次调试无果后 ,邪道我决定绕过 Operator,亿华云配置直接对加密的终极指南正规默认配置动手——这是一条邪修之路 ,但效果立竿见影 !邪道
邪道方案 :直捣黄龙
1.获取加密配置 复制kubectl get secret alertmanager-rancher-monitoring-alertmanager-generated \ -n cattle-monitoring-system -o yaml > secret.yaml1.2. 2.解密核心配置 复制# 安装 yq 工具 wget https://github.com/mikefarah/yq/releases/download/v4.25.1/yq_linux_amd64 -O /usr/local/bin/yq chmod +x /usr/local/bin/yq # 解密 alertmanager 配置 echo "$(yq eval .data."alertmanager.yaml.gz" secret.yaml)" | base64 -d | gzip -d > alertmanager.yaml # 解密模板文件 echo "$(yq eval .data."rancher_defaults.tmpl" secret.yaml)" | base64 -d > rancher_defaults.tmpl1.2.3.4.5.6.7. 3.魔改配置(QQ邮箱示例) 复制global: resolve_timeout: 5m smtp_smarthost: smtp.qq.com:465 smtp_from: xxxx@qq.com smtp_auth_username: xxxx@qq.com smtp_auth_password: xxxxxxx smtp_require_tls: false route: receiver: "k8s-alarm" group_by: [alertname] routes: - receiver: "null" matchers: - alertname = "Watchdog" group_wait: 30s group_interval: 5m repeat_interval: 12h receivers: - name: "k8s-alarm" email_configs: - to: test@gmail.cn send_resolved: true - name: "null" templates: - /etc/alertmanager/config/*.tmpl1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25. 4.重新加密并部署 复制# 压缩配置 gzip -c alertmanager.yaml > alertmanager.yaml.gz # Base64 编码 ALERTMANAGER_CONFIG=$(base64 -w0 alertmanager.yaml.gz) TEMPLATE_CONFIG=$(base64 -w0 rancher_defaults.tmpl) # 生成新 Secret yq eval ".data.\"alertmanager.yaml.gz\" = \"$ALERTMANAGER_CONFIG\" | .data.\"rancher_defaults.tmpl\" = \"$TEMPLATE_CONFIG\"" secret.yaml > updated-secret.yaml # 修改 Secret 名称 sed -i s/name: alertmanager-.*/name: alertmanager-main/ updated-secret.yaml # 应用配置 kubectl apply -f updated-secret.yaml -n cattle-monitoring-system1.2.3.4.5.6.7.8.9.10.11.12. 5.修改Alertmanager工作负载 复制# 修改 volumes 配置 volumes: - name: config-volume secret: secretName: alertmanager-main # 替换默认值1.2.3.4.5. 效果验证
图片
图片
图片
警告:此方案虽快但险,配置Operator 升级可能导致配置被覆盖!模板下载终极指南正规
正规军方案:优雅之道
1.配置告警接收器和路由 复制# k8s-alarm.yaml apiVersion: monitoring.coreos.com/v1alpha1 kind: AlertmanagerConfig metadata: name: k8s-alarm namespace: test spec: receivers: - name: tialert webhookConfigs: - url: https://your-webhook-url sendResolved: true route: groupBy: [alertname] groupInterval: 5m groupWait: 30s matchers: - name: severity value: "warning|critical" regex: true receiver: tialert repeatInterval: 4h1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24. 2.配置静默路由 复制# null.yaml apiVersion: monitoring.coreos.com/v1alpha1 kind: AlertmanagerConfig metadata: name: silence-watchdog namespace: cattle-monitoring-system spec: receivers: - name: null-receiver route: matchers: - name: alertname value: "Watchdog" receiver: null-receiver1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16. 3.自定义告警规则 复制# app-alert.yaml apiVersion: monitoring.coreos.com/v1 kind: PrometheusRule metadata: name: app-backend-alerts namespace: test labels: prometheus: rancher-monitoring role: alert-rules spec: groups: - name: app-backend rules: - alert: HighRequestRate expr: | sum(rate(http_requests_total{ job="app-backend"}[5m])) by (service) > 100 for: 10m labels: severity: critical annotations: summary: "High request rate on 邪道{ { $labels.service }}" description: "Request rate is { { $value }} per second"1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.总结对比
图片
选择建议:调试阶段可用“邪道”快速验证 ,生产环境务必使用正规方案!配置
无论是终极指南正规“邪道”还是“正规军”,最终目的建站模板邪道都是让告警系统稳定、可靠、配置可控。终极指南正规调试阶段 ,适当“走捷径”可以快速验证思路 ,服务器租用但千万别让临时方案变成长期债务 。真正的运维高手 ,不是不走捷径 ,而是香港云服务器知道什么时候该回头 ,把“邪修”的经验,沉淀为“正道”的规范 。
免费模板Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“算法与编程”。http://www.bzli.cn/news/238c299759.html
相关文章
分布式计算是什么——分布式计算协议
数据库分布式计算协议分布式计算协议是计算机科学和软件工程领域的重要概念,涉及到一个或多个计算实体之间的交互和合作,以完成特定的计算任务。这些实体可能位于不同地点,由不同组织拥有和管理。分布式计算协议的目的是 ...
【数据库】
阅读更多三星S6接收不了彩信怎么解决?
数据库1)没有开通网络数据,在这里跟大家说一下收发彩信都是需要使用GPRS数据的。 2)还可以重置彩信参数3)如果重置彩信参数后S4还是收发不了彩信的话,你可以试一下新建APN,具体操作方法如 ...
【数据库】
阅读更多安卓手机常见WLAN网络wifi故障问题解决大全
数据库第一招:关闭并重启WIFI连接用手机上网,手机中会保留一个由WIFI连接分配的网络IP地址,它会被应用到当前WIFI中,如果没有出现地址冲突,就不用担心,如果有冲突就得关闭并重启Wi-Fi连接。方法如 ...
【数据库】
阅读更多
热门文章
最新文章
友情链接
- 小米膜的优点和特点(为你的手机屏幕保驾护航)
- IBM携手腾讯联合发布《无边界零售》白皮书:洞察行业新格局,赋能企业“无边界零售”转型
- Metabones(全面解析Metabones的优势及应用领域)
- 华为Mate9拍摄视频全方位评测(华为Mate9拍视频功能强大,画质出色,满足各类拍摄需求)
- 探索触控耳机的革新之道(解锁未来音乐体验,触摸即操控)
- 华硕笔记本光盘换系统安装教程(轻松学会如何通过光盘更换华硕笔记本系统)
- 紫光云柳义利:通过可复制的行业云服务模式,助力数字化转型迈入新阶段
- X270在双核CPU中的性能表现(探索X270在双核CPU中的优势和应用场景)
- HP系统重装教程(详解HP系统重装步骤,让你的电脑焕然一新)
- 戴尔推出更高性能的PowerEdge产品组合 助力企业加速取得AI成果 网站建设源码库亿华云云服务器香港物理机b2b信息平台企业服务器