历史版本15 :系统可用性监测工具 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:

目录:

 0. 前言编辑

系统可用性检测工具可以对集群环境的可用性进行监测,可监测集群入口以及各个节点的宕机情况,适用于windows和Linux系统,需要在jdk1.7及以上的环境运行,监测情况记录在日志中,可以直接查看。

1. Linux 环境编辑

1.1 安装检测工具

1.1.1 检查依赖环境

依赖Java环境,第一步需要检测

java -version  # 检测依赖环境

1.1.2 下载安装包

下载安装包并将其放到/usr目录下

cluster-check-2.0-SNAPSHOT.zip:下载地址  提取码:qxb8 

1.1.3 解压并为其配置可执行权限

cd /usr #进入/usr目录
unzip cluster-check-2.0-SNAPSHOT.zip -d usableTool #解压安装包到usableTool文件夹
cd /usr/usableTool #进入目录
chmod +x  *.jar *.sh #给cluster-check-2.0-SNAPSHOT、start.sh、 stop.sh、 reload.sh赋予可执行权限

1.2 修改配置

 在conf.properties中配置监测选项,注意该配置文件需要放在jar文件的同级目录下

#要监控的工程地址,需要配置集群入口和各节点入口,例如(http://crm.finereporthelp.com)或者ip+端口,以空格分隔
urls=http://localhost:80 http://localhost1:8081 http://localhost2:8080
#默认使用 /webroot/decision/system/info 作为健康监测的地址,2019.08后的jar包可以用 /webroot/decision/system/health 作为健康监测的地址,允许自定义健康监测地址
defaultUri=/webroot/decision/system/info
#请求超时时间
timeout=10000
#请求间隔
period=5000
#失败次数,失败10次才认为系统不可用
failedTime=10
#日志等级【info|warn|debug】,默认为debug,会返回错误代码,即系统没有挂掉但是状态码不是健康状态码
#若设置为info,会记录所有请求
#若设置为warn,则只记录失败的请求
logLevel=debug
#日志时间格式
dateFormat=yyyy-MM-dd HH:mm:ss
# 健康状态码,支持正则,以空格分隔
expectAliveCode=30* 20*
# 是否开机自启动,需要root用户权限,默认为true
startOnUp=true

1.3 运行监测工具

./start.sh  # 开始          
./stop.sh  # 结束
./reload.sh   #修改配置文件后,reload即可生效
ps -ef|grep cluster-check   # 查看进程 

1570541311576650.png

2. Windows 环境编辑

2.1 安装检测工具

下载安装包并利用解压工具解压, 在conf.properties中配置监测选项

注意:windows环境的安装包同linux一致,并且配置项的修改内容也一致

2.2 运行监测工具

点击start.bat开始,点击stop.bat结束,修改配置文件后,点击reload.bat生效。

查看进程:

1569225109244417.png

3. 监测报告示例编辑

/usableTool/logs路径下的 system.log 中查看,示例如下图:

企业微信截图_15675686794711.png