一、服务器相关参数
修改
/etc/security/limits.conf
- soft nofile 655350
- hard nofile 655350
- soft nproc 655350
- hard nproc 655350
修改
/etc/systemd/system.conf 和 /etc/systemd/user.conf
DefaultLimitCORE=infinity
DefaultLimitNOFILE=100000
DefaultLimitNPROC=100000
修改
/etc/sysctl.conf
kernel.sem =500 64000 64 128
fs.file-max = 6553600
执行命令
sysctl -p
systemctl daemon-reload
systemctl daemon-reexec
网络配置参数
sysctl -w net.ipv4.tcp_max_syn_backlog=4096
sysctl -w net.ipv4.tcp_rmem="4096 87380 16777216"
sysctl -w net.ipv4.tcp_wmem="4096 87380 16777216"
sysctl -w net.ipv4.tcp_fin_timeout=30
sysctl -w net.core.reme_max=16777216
sysctl -w net.core.weme_max=16777216
二、 调整数据库连接数
vim /etc/my.cnf
slow_query_log = NO
slow_query_log_file = /mydata/mysql/zbx_server-slow.log
long_query_time = 10
max_connections = 1000 #如果connection 报错可以调整到20000
三、zabbix_server.conf
默认生成配置项:
ListenPort=10051 #监听端口
SourceIP= #多IP地址情况下,与其他服务器通信使用的源IP地址
LogType=file #日志类型
syslog 通过rsyslog可发送到远程主机记录
file 本地文件记录
console 输出到标准输出
LogFile=/tmp/zabbix_server.log #日志路径,编译安装的默认位置
LogFileSize=1 0-1024,M单位,日志文件达到定义的大小,会进行滚动清空重写,0关闭
DebugLevel=3 #自定义日志级别
0 有关启动和停止Zabbix进程的基本信息
1 关键信息
2 错误信息
3 警告,默认级别
4 debug级别,用于调试(产生大量信息),一般排错4足以
5 扩展调试(产生更多信息)
PidFile=/tmp/zabbix_server.pid #PID文件路径
SocketDir=/tmp #socket文件路径
DBHost=192.168.7.104 #数据库地址
DBName=zabbix_server #数据库名称
DBSchema= #数据库访问协议
DBUser=zabbix #数据库用户名称
DBPassword=123456 #数据库用户密码
DBSocket= #数据库socket文件
DBPort=3306 #数据库端口
HistoryStorageURL= #elasticsearch服务器地址,保存zabbix历史数据到ES里面,优化zabbix性能,新版本zabbix的才支持
HistoryStorageTypes=uint,dbl,str,log,text #elasticsearch索引类型,使用时一般默认即可
HistoryStorageDateIndex=0 #将历史数据保存到不同的elasticsearch索引
ExportDir= #定义实时导出触发器事件,监控项采集值,趋势数据的目录
ExportFileSize=1G #定义每个导出文件的最大大小
高级选项:
StartPollers=5 #启动多少个进程收集来自agent的数据,默认轮询方式,处理完一个agent的数据换下一个进程
StartIPMIPollers=0 #IPMI(硬件)数据收集进程数
StartPreprocessors=4 #预启动多少个进程用于处理zabbix agent数据
StartPollersUnreachable=1 #对不可达主机的进行轮询探测的进程的初始实例启动数量
StartTrappers=5 #预启动的Trappers(报警触发器)进程数据
StartPingers=3 #ICMP ping进程的初始实例数量
StartDiscoverers=1 #自动发现主机的进程数量,建议不高于cpu核心数
StartHTTPPollers=3 #web界面的http进程数量
StartTimers=3 #计时器实例数量,计时器用于记录问题的发生时间和步骤同步等
StartEscalators=1 #escalators进程的初始实例数量,用于处理动作中的自动步骤的进程的数量
StartAlerters=3 #报警实例预启动数量
JavaGateway=192.168.7.101 #javagateway服务器地址,java pollers必须设置
JavaGatewayPort=10052 #javagateway端口
StartJavaPollers=20 #java轮训实例预启动数量
StartVMwareCollectors=0 #用于设置监控VMWARE Esxi主机实例时使用,若为0则不启用,若要监控ESXI主机,此值最少为1,根据监控ESXI数量设置对应数值
VMwareFrequency=60 #监控vmware获取最新数据间隔频率,单位为秒
VMwarePerfFrequency=60 #监控vmware获取性能数据间隔
VMwareCacheSize=8M #vmware数据缓存大小,会占用zabbix server服务器内存
VMwareTimeout=10 #超时时间
SNMPTrapperFile=/tmp/zabbix_traps.tmp #snmp触发器临时文件路径
StartSNMPTrapper=0 #SNMP触发器预启动数量,0关闭,1开启
ListenIP=0.0.0.0 #监听地址
HousekeepingFrequency=1 #多少小时清理一次代理端数据库的历史数据,1-24h
MaxHousekeeperDelete=5000 #每次最多删除历史数据的行数,0-1000000
CacheSize=8M #配置信息缓存大小,128K-8G
CacheUpdateFrequency=60 #Zabbix更新缓存数据的频率,单位为秒,范围是1-3600
StartDBSyncers=4 #zabbix和数据库同步数据的进程数量
CacheUpdateFrequency=300 #Zabbix更新缓存数据的频率,单位为秒,范围是1-3600
StartDBSyncers=4 #zabbix和数据库同步数据的进程数量,1-100
HistoryCacheSize=2G #历史数据的缓存大小,128K-2G
HistoryIndexCacheSize=128M #历史数据索引缓存的大小,128K-2G
TrendCacheSize=2G #用于设置划分多少系统共享内存用于存储计算出来的趋势数据,此参数值从一定程度上可缓解数据库读压力,范围是128K-2G
ValueCacheSize=8M #历史值缓存的大小,用于缓存历史数据请求的共享内存大小,128K-2G
Timeout=30 #数据获取等待超时时间,1-30s,过期不候,哪怕数据来了也是记录超时
TrapperTimeout=300 #触发器处理新数据的最长时间,1-300s
UnreachablePeriod=60 #当主机不可达多少秒后,设置为主机不可用,范围是1-3600s
UnavailableDelay=60 #当主机不可用了,多久检查一次该主机的可用性,单位为秒,范围是1-3600
UnreachableDelay=60 #当主机不可到达了,多久检查一次该主机的可用性,单位为秒,范围是1-3600
AlertScriptsPath={datadir}/zabbix/externalscripts #自定义脚本存储路径
FpingLocation=/usr/sbin/fping #fping命令的位置
Fping6Location=/usr/sbin/fping6 #fping6的位置
SSHKeyLocation= #用于SSH检查和操作的公钥和私钥的位置
LogSlowQueries=3000 #慢日志时间(以毫秒为单位),仅当DebugLeve l设置为3,4或5时才可用,0不记录慢查询,范围是1-3600000
TmpDir=/tmp #临时文目录
StartProxyPollers=1 #启用多少子进程与代理端通信,若代理较多可考虑加大此数值,范围是0-250
ProxyConfigFrequency=300 #proxy被动模式下,server多少秒同步配置文件至proxy,该参数仅用于被动模式下的代理,范围是1-3600247
ProxyDataFrequency=300 #被动模式下,zabbix server间隔多少秒向proxy请求历史数据,1-3600s
AllowRoot=0 #是否允许root启动zabbix
User=zabbix #设置zabbix 启动用户
Include=/opt/zabbix/etc/server_conf.d/ #导入其他目录的配置文件
SSLCertLocation={datadir}/zabbix/ssl/keys #SSL客证书私钥位置,用于web监控
SSLCALocation= #SSL CA钥文件目录
StatsAllowedIP= #定义允许访问zabbix server的IP地址列表
LoadModulePath=${libdir}/modules #第三方模块目录路径
LoadModule= #第三方模块路径
TLSCAFile= #CA文件,一般证书在nginx主机上配置
TLSCRLFile= #包含已吊销证书的文件的完整路径名
TLSCertFile= #公钥文件路径
TLSKeyFile= #私钥文件路径
zabbix agent配置文件说明:
相同参数的,作用与server的是一样的,不重复介绍,不了解的可看上面server的
zabbix_agent.conf
PidFile=/opt/zabbix_server/run/zabbix_agentd.pid
LogFile=/tmp/zabbix_agentd.log #编译安装的默认位置
LogFileSize=1 0-1024,M单位,日志文件达到定义的大小,会进行清空重写,0关闭
DebugLevel=3 #debug日志
SourceIP= #多IP地址情况下,与其他服务器通信使用的源IP地址
EnableRemoteCommands=0 允许server端到本地执行命令
0 不允许
1 允许
Server=127.0.0.1 #允许哪些主机来本机获取监控数据
域名
ip、ip/mask
2.2.2.10,2.2.2.20,...
ListenPort=10050 #监听端口
ListenIP=0.0.0.0 #监听ip
StartAgents=3 #默认被动模式,收到服务端的指令后,本地开启几个进程进行数据采集,取值范围:0-100,0为关闭(关闭时同时关闭tcp连接,也就是设为主动模式)
ServerActive=127.0.0.1 #主动模式,向上级汇报,上级ip
Hostname=Zabbix server #在服务端显示的名称,要保持唯一性,建议使用ip
UserParameter=名称,脚本或命令 #指定自定义脚本,可用于添加自定义监控项
例:nginx.status[*],/bin/bash /opt/nginx.sh "1
EnableRemoteCommands=1 #启用远程执行命令的功能,用于配置web界面中动作中的远程命令执行
UnsafeUserParameters=1 #启用特殊命令,避免一些特殊命令不允许执行
zabbix proxy配置文件说明:
zabbix_proxy.conf
标准配置:
ProxyMode=0 #代理模式,0为主动模式,1为被动模式
Server=127.0.0.1 #允许谁能访问我
ServerPort=10051 #server的监听端口,主动模式必须配置,被动模式不用管
Hostname=2.2.2.32-proxy #请求上级时的主机名,此处写的必须根上级web界面的名称一致
ListenPort=10051 #代理监听的端口,为下级agent提供
LogType=file #日志类型
LogFile=/tmp/zabbix_proxy.log
LogFileSize=1
DebugLevel=3
EnableRemoteCommands=0
LogRemoteCommands=0
SocketDir=/tmp
DBHost=2.2.2.12
DBName=zabbix_proxy #代理的数据库名,与server的库分开
DBUser=proxy
DBPassword=123456
代理相关配置:
ProxyLocalBuffer=0 #已经发送给server的数据在本地保留时间,0-720h
ProxyOfflineBuffer=1 #未发送给server的数据在本地保留时间,1-720h
HeartbeatFrequency=120 #主动模式生效,心跳检测server的间隔时间,0-3600s
ConfigFrequency=300 #间隔多少秒从zabbix server获取监控项信息
DataSenderFrequency=5 #主动模式,数据发送上级时间间隔,默认为1秒,范围为1-3600秒,被动模式不使用
高级选项:
StartPollers=20 #启动的数据采集器数量
JavaGateway=172.31.0.104 #java gateway服务器地址,当需要监控java的时候必须配置否则监控不到数据
JavaGatewayPort=10052 #Javagatewa服务端口
StartJavaPollers=20 #启动多少个线程采集数据
缓存优化相关:尽量大一点
CacheSize=2G #保存监控项而占用的最大内存
HistoryCacheSize=2G #保存监控历史数据占用的最大内存
HistoryIndexCacheSize=128M #历史索引缓存的大小
Timeout=30 #监控项超时时间,单位为秒
LogSlowQueries=3000 #毫秒,多久的数据库查询会被记录到日志