核心逻辑
zabbix的“监控-触发-动作”联动机制
核心原则
只处理“原因明确、修复方式固定、重复执行无副作用”的问题,目的是减少人工的重复劳动,而非代替人工决策。
适用场景
- 服务/进程异常:服务意外停止(如nginx、mysql进程消失)→ 自动重启;进程资源占用过高(内存/cpu超限)→自动重启释放资源
- 资源阈值超标:磁盘空间满(如日志占满)→ 自动清理旧文件\日志;非核心进程资源超限→自动杀死异常进程
- 网络/端口问题:关键端口未监听(如80,3306)→ 自动重启对应服务;临时网络抖动导致断开→ 自动重连服务
- 配置文件/权限异常:服务配置文件误改→ 自动覆盖为备份文件;目录/文件权限错误→ 自动修正权限
不适用的场景
- 复杂故障:数据损坏、硬件故障(如硬盘坏道);业务逻辑错误,代码bug
- 需人工判断的情况:业务流量突增;多原因导致的同一现象
- 高风险操作:删除数据库表、修改核心配置;可能引发连锁故障的操作
评论 (0)