Linux grep命令与$?命令结合使用技巧
今天检查前同事留下的一个shell脚本时,其中一个脚本中有一个业务逻辑处理:要判断Oracle数据库实例是否启动,如果数据库实例处于OPEN状态的话,则执行/运行一些业务逻辑操作。脚本大体如下(脚本做了一下混淆和精简收缩)
up_flag=`${SCRIPT_DIR}/chkdbup.sh ${ORACLE_SID}`
if [ ${up_flag} -eq 0 ]; then
.......
exit
else
.......
fi
其中chkdbup.sh脚本的内容如下:
ps -ef | grep -i smon_${1} | grep -v "grep" >/dev/null
echo $?
Review这个脚本时,我感觉这个脚本的逻辑有问题(我认为这个脚本存在一个逻辑"bug"),主要是{up_flag}不为0时则表示数据库实例异常了
if [ ${up_flag} -eq 0 ]; then
.......
exit
else
.......
fi
在Linux shell脚本中,$?一般表示上一个命令的返回值(执行情况),执行成功,返回0,其他任何数值表示上条命令执行有错误。我认为数据库实例OPEN或关闭或crash的时候,chkdbup.sh这个脚本都会返回0,而不会返回值1,为了验证我的想法,于是我找了台测试环境验证测试一下。当前测试环境下ORACLE_SID为kerry
[oracle@mytestdb ~]$ ps -ef | grep -i smon_kerry | grep -v "grep"
oracle 1338965 1 0 Jul05 ? 00:00:14 ora_smon_kerry
[oracle@mytestdb ~]$ echo $?
0
换一个ORACLE_SID,此时因为Oracle实例不存在,就可以模拟实例Crash的情况(懒得关闭Oracle实例了,这个跟关闭Oracle实例测试效果一致)
[oracle@mytestdb ~]$ ps -ef | grep -i smon_gsp | grep -v "grep"
[oracle@mytestdb ~]$ echo $?
1
按照我的想法/认知,不管这个数据库实例存在或不存在,ps命令总是会执行成功,它就会返回0,而且是永远返回0,但是测试验证结果跟我的想法/认知不符合,Why?查了一些资料,然后和同事讨论后,终于搞清楚了其中的原因,主要是因为$?命令获取的上一条命令的返回结果,而上一条命令中使用了grep命令,而grep命令的返回结果是这样的:如果找到了匹配的相关记录则返回0,如果没有找到匹配的相关记录则返回1,如果执行过程中出错,就返回2,你可以使用man grep查看相关说明,具体如下所示:
EXIT STATUS
Normally the exit status is 0 if a line is selected, 1 if no lines were selected, and 2 if an error occurred. However,
if the -q or --quiet or --silent is used and a line is selected, the exit status is 0 even if an error occurred.
其实,grep命令在HP-UX下也是同样的返回值,如下所示:
RETURN VALUE
Upon completion, grep returns one of the following values:
Hewlett-Packard Company - 3 - HP-UX 11i Version 3 Feb 2007
grep(1) grep(1)
0 One or more matches found.
1 No match found.
2 Syntax error or inaccessible file (even if matches were
found).
所以,我的想法/认知是错误的,而前同事也是在shell脚本中借助grep这个特性和$?来判断Oracle实例是否处于OPEN状态。这个也是一个shell脚本中的一个技巧,只是我很少用这种技巧,另外,由于对grep命令返回的值不清楚(具体来说,不清楚grep没有匹配到相关记录时返回1)。因此闹了一个乌龙事件。