Board logo

标题: linux实战(十)----shell监控tomcat服务是否正常----综合运用 [打印本页]

作者: look_w    时间: 2019-5-11 13:57     标题: linux实战(十)----shell监控tomcat服务是否正常----综合运用

前面一章我们 尝试了 批量的监控服务器是否存活, 这一章我们来学习监控tomcat服务是否正常。



脚本代码

脚本代码如下:

#!/bin/sh


# func:自动监控tomcat并且在异常时执行重启操作


# 定义环境变量
PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/usr/java/jdk1.5.0_11/bin
export JAVA_HOME=/usr/java/jdk1.5.0_11
export CLASSPATH=$JAVA_HOME/libJAVA_HOME/lib/tools.jar
export PATH=$PATHJAVA_HOME/bin


# DEFINE


# 获取tomcat进程ID
TomcatID=$(ps -ef |grep tomcat |grep -w 'apache-tomcat-5.5.23'|grep -v 'grep'|awk '{print $2}')


# tomcat启动程序(这里注意tomcat实际安装的路径)
StartTomcat=/usr/apache-tomcat-5.5.23/bin/startup.sh
TomcatCache=/usr/apache-tomcat-5.5.23/work


# 定义要监控的页面地址
WebUrl=http://localhost:8080


# 日志输出
GetPageInfo=/tmp/TomcatMonitor.Info
TomcatMonitorLog=/tmp/TomcatMonitor.log


Monitor()
{
  echo "[info]开始监控tomcat...[$(date +'%F %H:%M:%S')]"
  if[ $TomcatID ];then  # 这里判断TOMCAT进程是否存在
    echo "[info]当前tomcat进程ID为TomcatID,继续检测页面..."
    # 检测是否启动成功(成功的话页面会返回状态"200")
    TomcatServiceCode=$(curl -s -o $GetPageInfo -m 10--connect-timeout 10 $WebUrl -w %{http_code})
    if[ $TomcatServiceCode -eq 200];then
        echo "[info]页面返回码为$TomcatServiceCode,tomcat启动成功,测试页面正常......"
    else
        echo "[error]tomcat页面出错,请注意......状态码为$TomcatServiceCode,错误日志已输出到$GetPageInfo"
        echo "[error]页面访问出错,开始重启tomcat"
        kill -9 $TomcatID  # 杀掉原tomcat进程
        sleep 3
        rm -rf $TomcatCache # 清理tomcat缓存
        $StartTomcat
    fi
  else
    echo "[error]tomcat进程不存在!tomcat开始自动重启..."
    echo "[info]$StartTomcat,请稍候......"
    rm -rf $TomcatCache
    $StartTomcat
  fi
  echo "------------------------------"
}
Monitor>>$TomcatMonitorLog



代码解析

export  是给脚本配置环境,配置环境后可使用该环境下的命令

ps  -e  显示所有进程

ps -f   按树状显示

grep tomcat  只取含有tomcat的行

grep -w 'apache-tomcat-5.5.23'        -w选项搜索一个单词,并且避免搜索到词中的部分字串。 搜索含有apache-tomcat-5.5.23的行

grep -v 'grep'    去掉含有grep的行

awk '{print $2}'  用空格切分 取第二列

ps -ef |grep tomcat |grep -w 'apache-tomcat-5.5.23'|grep -v 'grep'|awk '{print $2}'   获取tomcat的进程id

但是仅仅是 tomcat进程存在是不够的,需要访问下  站点页面看看 是否访问正常  正常状态为200  通过curl

curl -s -o $GetPageInfo -m 10 --connect-timeout 10 $WebUrl -w %{http_code}   访问页面并保存页面内容返回状态码
-s --silent 静默模式,就是不显示错误和进度
-o $GetPageInfo 将文件保存到本地并命名为$GetPageInfo  
-m  表示获取网页的最长时间(数据传输的最大允许时间)
-m 10 表示如果10秒内无法完成获取网页源码的操作,则放弃
--connect-timeout 连接超时时间
--connect-timeout 10  表示如果10秒内无法连接,则放弃
$WebUrl 就是我们要访问的页面路径变量
-w  curl的-w参数我们可以自定义curl的输出,%{http_code}代表http状态码


如果状态码为200则 tomcat正常,否则 kill  杀掉tomcat 进程, 访问tomcat的启动脚本 start.sh  启动tomcat




欢迎光临 电子技术论坛_中国专业的电子工程师学习交流社区-中电网技术论坛 (http://bbs.eccn.com/) Powered by Discuz! 7.0.0