复制粘贴于博客:http://www.52yunwei.net/704.html。https://blog.51cto.com/215687833/1886671
公司有大量测试环境的url需要监控是否能够访问,即url状态不为200即报警。状态为200即正常。
因url比较多,且经常发生改变,如通过web场景配置(我没配过)会比较繁琐,工作量比较大
通过网上查找资料,可通过脚本结合zabbix的自动发现功能即可批量监控,只需维护一个url列表即可
1.在任意的zabbix agent端添加如下脚本,我这里是在客户机的/opt/zabbix/scripts/目录下新建的web_site_code_status.sh
#!/bin/bashUrlFile="/opt/zabbix/scripts/WEB.txt"
IFS=$'\n'web_site_discovery () {WEB_SITE=($(cat $UrlFile|grep -v "^#"))printf '{\n'printf '\t"data":[\n'num=${#WEB_SITE[@]}for site in ${WEB_SITE[@]}donum=$(( $num - 1 ))url=$(echo $site|awk '{print $1}')ip=$(echo $site|awk '{print $2}')if [ $num -ne 0 ] ; thenprintf "\t\t{\"{#SITENAME}\":\""${url}"\",\"{#PROXYIP}\":\""${ip}"\"},\n"elseprintf "\t\t{\"{#SITENAME}\":\""${url}"\",\"{#PROXYIP}\":\""${ip}"\"}\n"printf '\t]\n'printf '}\n'fidone
}web_site_code () {if [ "$2" == "" ]; thencurl -s --connect-timeout 2 -m 4 -o /dev/null -w %{http_code} $1elif echo $2 |grep ':' &>/dev/null ; thencurl -s --connect-timeout 2 -m 4 -o /dev/null -w %{http_code} $1 -x $2elsecurl -s --connect-timeout 2 -m 4 -o /dev/null -w %{http_code} $1 -x $2:80fi
}case "$1" inweb_site_discovery)web_site_discovery;;web_site_code)web_site_code $2 $3;;*)echo "Usage:$0 {web_site_discovery|web_site_code [URL]}";;
esac
2.在/opt/zabbix/scripts/新建WEB.txt文件,格式如下
http://www.baidu.com
http://www.sina.com.cn
http://www.163.com 10.10.10.10
http://www.sohu.com 115.23.16.97:80
http://www.111.com
3.在zabbix客户端加配置文件:
#vim /etc/zabbix/zabbix_agentd.d/web_site_discovery.conf
UserParameter=web.site.discovery,/opt/zabbix/scripts/web_site_code_status.sh web_site_discovery
UserParameter=web.site.code[*],/opt/zabbix/scripts/web_site_code_status.sh web_site_code $1 $2
4.在服务端测试是否正常
#yum install zabbix-get #安装zabbix-get工具
#zabbix_get -s 192.168.10.234 -k web.site.discovery #ip为客户端地址,运行会返回一些josn数据即正常
6.在web界面配置,大致步骤如下
1.在配置>主机>找到安装了脚本的客户机。创建自动发现(其余默认)
名称:web.site.discovery
类型:Zabbix客户端
键值:web.site.discovery
1.1过滤器添加宏{#SITENAME},表达式为空
2.监控原型处添加(其余默认)
名称:http_code ON {#SITENAME}
类型:Zabbix客户端
键值:web.site.code[{#SITENAME}]
3.触发器类型问题表达式(通过选择原型添加自动生成表达式)
{Linux CentOS7 3.10.0-693.2.2.el7.x86_64 _1 SMP Tue Sep 12 22_26_13 UTC 2017 x86_64_3:web.site.code[{#SITENAME}].last(#3,5)}<>200
4.触发器类型恢复表达式(通过选择原型添加自动生成表达式)
{Linux CentOS7 3.10.0-693.2.2.el7.x86_64 _1 SMP Tue Sep 12 22_26_13 UTC 2017 x86_64_3:web.site.code[{#SITENAME}].last(#1,60)}=200