Zabbix分布式监控系统


生产环境中,我们为了实现地域容灾,我们会把服务器放在不同的地域,如果一台zabbix server去监控的话,延迟会高,因为中国的网络由很多运营商在经营,包括联通,移动,电信,教育等等,有玩游戏的同学应该清楚,家里是联通的网络,你去会去电信的服务器么?不会,因为延迟太高。为什么延迟高?因为运营商之间的出口带宽是有限制的,为什么有限制?因为费用不一样,你在便宜的运营商这里办宽带,在贵的运营商这里玩,这种事,换做是谁都不会高兴的。有的同学说我用游戏加速器怎么延迟就低了?使用游戏加速器相当于在大家都从一扇门进出的时候,你发现了一扇窗,而这扇窗就你自己在用,但是当其他人也发现了这扇窗之后呢?所以即便是使用了游戏加速器,在上网高峰时,延迟还是高,只不过没有那么拥挤而已。说完了为什么延迟会高,我们再看一下另外一个问题,这种把服务器放在不同的地域也会造成zabbix server压力也会很大,所以为了避免这种情况,我们的处理方法就是将权利下发,在不同的地域都找一个机器来充当代理,本地的监控工作由代理(proxy)来完成,代理完成收集工作后交给zabbix server,zabbix server在将收到的数据统一整理展示到web。

其实这个例子很简单就是你开了很多分公司,你一个人去管理这些分公司的员工的话,你是管不全面的,所以我们的方法是在每个分公司弄一个负责人,负责人管当地的员工,你管负责人。有问题他们集中向你汇报就好了。这样你就能很顺利的掌控全局了。

架构图

image20200219101305467.png

所以在这个分布式监控的架构中的流程是

1、zabbix server发布指令给代理

2、zabbix-proxy将指令发给被监控主机

3、被监控机将数据汇报给zabbix-proxy

4、zabbix-proxy再交给zabbix-server

5、zabbix-server将数据展示

这样解决了延迟问题,只要保证一条线路畅通就可以了,至于保证一条线路畅通的手段就看你的公司了,有钱可以接专线,没钱可以使用VPN,实在不行可以直接走广域网

实验拓扑图

zabbix_proxy.png

在这个架构中我们至少需要三台机器,他们的角色为

  • zabbix-server: 192.168.98.200
  • zabbix-proxy: 192.168.98.205
  • 被监控主机: 192.168.98.xxx

实验步骤

部署server监控平台 (略)

部署proxy代理平台

被监控机安装zabbix-agent(略)

一、部署zabbix-proxy代理平台

1.1、安装zabbix-proxy平台

#设置yum源
[root@proxy ~]# cat >> /etc/yum.repos.d/zabbix.repo <<EOF
[zabbix]
name=Zabbix Official Repository - $basearch
baseurl=http://repo.zabbix.com/zabbix/4.4/rhel/8/$basearch/
#baseurl=https://mirrors.aliyun.com/zabbix/zabbix/4.4/rhel/8/$basearch/
enabled=1
gpgcheck=0
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-ZABBIX-A14FE591

[zabbix-non-supported]
name=Zabbix Official Repository non-supported - $basearch
baseurl=http://repo.zabbix.com/non-supported/rhel/8/$basearch/
enabled=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-ZABBIX
gpgcheck=0

#安装软件包
[root@proxy ~]# dnf -y install mariadb-server mariadb zabbix-proxy-mysql zabbix-agent

############################################################
注意:如果无法连接公网的源,可以用浏览器将软件包下载到本地,然后自己创建本地源
step1
[root@proxy ~]# dnf install createrepo -y

step2
[root@proxy ~]# createrepo zabbix/(此路径为存放软件包的路径)

step3
[root@proxy ~]# vim /etc/yum.repos.d/server.repo 
[server-app]
name=server-app
enable=1
gpgcheck=0
baseurl=file:///mnt/AppStream
[server-os]
name=server-os
enable=1
gpgcheck=0
baseurl=file:///mnt/BaseOS
[zabbix]
name=zabbix
enabled=1
gpgcheck=0
baseurl=file:///root/zabbix

step4
[root@proxy ~]# dnf -y install mariadb-server mariadb zabbix-proxy-mysql zabbix-agent
############################################################



#mariadb设置
#启动服务
[root@proxy ~]# systemctl enable mariadb
Created symlink from /etc/systemd/system/multi-user.target.wants/mariadb.service to /usr/lib/systemd/system/mariadb.service.
[root@proxy ~]# systemctl start mariadb
[root@proxy ~]# mysqladmin -u root password '123456'
#创建数据库 zabbix_proxy及管理用户
[root@proxy ~]# mysql -u root -p
MariaDB [(none)]> create database zabbix_proxy character set utf8 collate utf8_bin;
Query OK, 1 row affected (0.00 sec)

MariaDB [(none)]>  grant all privileges on zabbix_proxy.* to zabbix@localhost identified by '123456';
Query OK, 0 rows affected (0.00 sec)

MariaDB [(none)]> flush privileges;
Query OK, 0 rows affected (0.00 sec)

MariaDB [(none)]> exit
Bye

#导入数据
[root@proxy ~]# zcat /usr/share/doc/zabbix-proxy-mysql/schema.sql.gz |mysql -u zabbix -p123456 zabbix_proxy

1.2、修改proxy配置文件

[root@proxy ~]# egrep "^(Server|Hostname|DBPass)" /etc/zabbix/zabbix_proxy.conf 
Server=192.168.98.200       #将数据汇报给谁
Hostname=zabbix_proxy       #自己的名字
DBPassword=123456               #数据库密码

1.3、关于proxy的监控问题

由于proxy既是监控也是被监控机,所以本机的agent的服务器地址可以设置本机或者server地址,这里建议设置server地址。因为这样zabbix server能够直接监控到本机的状态

[root@proxy ~]# egrep "^(Server|Hostname)" /etc/zabbix/zabbix_agentd.conf 
Server=192.168.98.200
ServerActive=192.168.98.200
Hostname=proxy 

1.4、启动服务

[root@proxy ~]# systemctl enable zabbix-proxy zabbix-agent
Created symlink from /etc/systemd/system/multi-user.target.wants/zabbix-proxy.service to /usr/lib/systemd/system/zabbix-proxy.service.
Created symlink from /etc/systemd/system/multi-user.target.wants/zabbix-agent.service to /usr/lib/systemd/system/zabbix-agent.service.
[root@proxy ~]# systemctl start zabbix-proxy zabbix-agent

查看一下日志显示的内容,以及确认下端口是否打开

[root@proxy ~]# tail -f /var/log/zabbix/zabbix_proxy.log
34539:20200215:133633.989 proxy #13 started [history syncer #2]
 34547:20200215:133633.990 proxy #21 started [poller #4]
 34548:20200215:133633.996 proxy #22 started [poller #5]
 34546:20200215:133633.998 proxy #20 started [poller #3]
 34551:20200215:133634.000 proxy #25 started [preprocessing manager #1]
 34550:20200215:133634.003 proxy #24 started [icmp pinger #1]
 34549:20200215:133634.003 proxy #23 started [unreachable poller #1]
 34552:20200215:133635.011 proxy #26 started [preprocessing worker #1]
 34554:20200215:133635.014 proxy #28 started [preprocessing worker #3]
 34553:20200215:133635.019 proxy #27 started [preprocessing worker #2]
 34534:20200215:133641.038 cannot send proxy data to server at "192.168.98.200": proxy "zabbix_proxy" not found
 34534:20200215:133642.041 cannot send proxy data to server at "192.168.98.200": proxy "zabbix_proxy" not found
 34534:20200215:133643.044 cannot send proxy data to server at "192.168.98.200": proxy "zabbix_proxy" not found
 34534:20200215:133644.046 cannot send proxy data to server at "192.168.98.200": proxy "zabbix_proxy" not found
 34534:20200215:133645.049 cannot send proxy data to server at "192.168.98.200": proxy "zabbix_proxy" not found

[root@proxy ~]# netstat -ntlp 
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name    
tcp        0      0 0.0.0.0:10050           0.0.0.0:*               LISTEN      33953/zabbix_agentd 
tcp        0      0 0.0.0.0:10051           0.0.0.0:*               LISTEN      33960/zabbix_proxy  
tcp6       0      0 :::10050                :::*                    LISTEN      33953/zabbix_agentd 
tcp6       0      0 :::10051                :::*                    LISTEN      33960/zabbix_proxy  
tcp6       0      0 :::3306                 :::*                    LISTEN      33219/mysqld        

通过查看日志,我们发现日志当中好像有报错,这个我们一会再说,通过查看端口可以发现zabbix_proxy与zabbix_server使用的端口是一样的,所以这两个角色不能配置在一台主机上

1.5、监控平台设置

刚才我们在查看日志的时候发现日志中好像有错误提示,这个提示产生的原因就是服务端不认这个代理,代理给服务端发数据,服务端不要,所以我们要告诉服务端,它的代理是谁

管理—agent代理程序

zabbixproxy1.png

选择 创建代理 进入代理设置模式

zabbixproxy2.png

设置代理名称:一定要和proxy配置文件中的Hostname一致

设置代理模式:主动

1)proxy主动模式

zabbix_proxy主动发数据给zabbix_server(proxy的默认模式)

# vim /etc/zabbix/zabbix_proxy.conf
ProxyMode=0                         --此参数为0表示proxy主动模式  

2)proxy被动模式

zabbix_server找zabbix_proxy为收集数据

# vim /etc/zabbix/zabbix_proxy.conf
ProxyMode=1                        --此参数为1表示proxy主动模式                         

警告

为了避免服务端不识别代理或者其它主机的情况,建议在zabbix_server最好给代理名字及其它主机做个解析
[root@zabbix ~]# vim /etc/hosts
192.168.98.205  proxy zabbix_proxy 

二、设置被监控机

[root@node4 ~]# egrep "^(Server|Hostname)" /etc/zabbix/zabbix_agentd.conf 
Server=192.168.98.205
ServerActive=192.168.98.205
Hostname=node4

[root@node4 ~]#  systemctl restart zabbix-agent
[root@node2 ~]# netstat -ntlp 
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name     
tcp        0      0 0.0.0.0:10050           0.0.0.0:*               LISTEN      7836/zabbix_agentd  
tcp6       0      0 :::10050                :::*                    LISTEN      7836/zabbix_agentd  

三、验证

由于之前配置过自动注册,所以应该在主机列表中能看到就算成功了。

配置—主机

image20200215140100181.png

看到了,node2后面有一个zabbix_proxy 说明该主机走的是代理模式。

如果查看监测–图形时很久不出图,建议分别重启zabbix_proxy和客户端的zabbix-proxy以及zabbix-agent服务