shell中使用正则表达式

    xiaoxiao2023-10-28  165

    亮哥:我们有个需求,在升级版本时,我们是以jar的方式升级的,jar包版本号是会升级的,现在你写一个脚本在升级之前先删除原来jar包,然后把新包放上去。 小编:好的,我来实现一下

    于是乎,颠颠的去做了

    我们要删除的包有这几种形式

    slf4j-api-1.7.25.jar spring-boot-starter-logging-1.5.9.RELEASE.jar spring-boot-starter-log4j2-1.5.9.RELEASE.jar spring-boot-starter-jdbc-1.5.9.RELEASE.jar service-core-0.0.1-SNAPSHOT.jar log4j-core-2.7.jar log4j-1.2-api-2.7.jar

    jar包的类型大概是分为这几种,怎么实现不误删除,也要真正的把jar包能删除呢?

    小编技术不咋滴,想了很久,才找到其中的规律 要找到jar包中唯一的名字,忽略版本号后面多余的信息,如".jar"、"-SNAPSHOT.jar"、".RELEASE.jar"等各种冗余信息,然后截取版本号,获取jar包中唯一名字,在删除时,删除jar包名加后面是数字开头的jar文件,这样就能实现删除包的效果了。 规则想清楚了,但怎么实现呢? 这么复杂的规则用正则表达式那是肯定的了,shell中使用正则表达式怎么用呢? 找这个表达式浪费了一点时间

    看下演示效果吧

    #截取文件 [base@DBASAPP01 lib]$ expr log4j-1.2-api-2.7.jar : '\(.*[0-9]\)' log4j-1.2-api-2.7 [base@DBASAPP01 lib]$ expr service-core-0.0.1-SNAPSHOT.jar : '\(.*[0-9]\)' service-core-0.0.1 [base@DBASAPP01 lib]$ expr spring-boot-starter-jdbc-1.5.9.RELEASE.jar : '\(.*[0-9]\)' spring-boot-starter-jdbc-1.5.9 #再根据-截取,获取最后一组 [base@DBASAPP01 lib]$ echo log4j-1.2-api-2.7| awk -F '-' '{print $NF}' 2.7 #根据最后一组,作为分割符获取jar包名 [base@DBASAPP01 lib]$ echo log4j-1.2-api-2.7| awk -F 2.7 '{print $1}' log4j-1.2-api- 根据获取的jar包名查找对应的jar包,并删除 #[base@DBASAPP01 lib]$ find . -name log4j-1.2-api-'[0-9]*'.jar -exec rm -rvf {} \; [base@DBASAPP01 lib]$ find . -name log4j-1.2-api-'[0-9]*'.jar ./log4j-1.2-api-2.7.jar [base@DBASAPP01 lib]$

    对应的shell脚本则是

    #删除安装包,匹配规则是文件名的第一个. function read_dir(){ #循环文件夹下的文件 for file in `ls $1` do #注意此处之间一定要加上空格,否则会报错 if [[ -d $1"/"$file ]] then #使用递归的思想,自己调用自己 read_dir $1"/"$file else #截取带有版本号信息的文件名,只针对jar包进行处理,否则会报错 if [[ $file =~ .jar$ ]] then #截取文件 file=`expr $file : '\(.*[0-9]\)'` fi #指定目录层次下进行循环 APPPATH=`echo $1/ |cut -d "/" -f7-40 ` #根据"-"截取,获取最后一组 FRISTSUB=`echo $file| awk -F '-' '{print $NF}'` #根据最后一组,作为分割符获取jar包名 FILENAMEPRE=`echo $file| awk -F $FRISTSUB '{print $1}'` if [ "$APPPATH" = "" ] then debug "do not delete this dir $CMV3BASEDIR" else # 查找并删除,debug是函数调用 debug `find $CMV3BASEDIR/$APPPATH -name $FILENAMEPRE'[0-9]*'.jar -exec rm -rf {} \;` fi fi done }

    大工告成,实现了,我们想要的功能。

    划重点,正则表达式在shell中的应用

    正则表达式在各个编程语言体系中都有使用,其各个规则大概是相同的,但某些语法是根据各个语言体系自己来实现的,比如在java中判断匹配规则是通过“matches”来实现判断,则在shell中则是使用“=~” 什么是正则表达式呢?正则表达式就是能用某种模式去匹配一类字符串的公式,它是由一串字符和元字符构成字符串。所谓元字符,就是用以阐述字符表达式的内容、转换和描述各种操作信息字符。 正则表达式中的元字符表示

    “.”(一个点)符号,用于匹配除换行符以外的任意字符。 [root@localhost ~]# grep 'r..t' /etc/passwd [root@localhost ~]# grep 'r.t' /etc/passwd “* ”符号,用于前一个字符0次或者多次。 [root@localhost ~]# grep 'r*t' /etc/passwd “{n,m}”符号,可用于重复匹配前一个字符,但却不能精确地控制的重复次数 “{n}” 匹配前面的字符n次 [root@localhost ~]# grep 'ro\{2\}' /etc/passwd

    “{n,}” 匹配前面的字符至少n次以上(含n次)

    [root@localhost ~]# grep 'ro\{2,\}' /etc/passwd

    “{n,m}” 匹配前面的字符n到m次

    [root@localhost ~]# grep 'ro\{1,2\}' /etc/passwd "^"符号 匹配的是以字符开头的行 [root@localhost ~]# grep ^root /etc/passwd “$”符号 用于匹配尾部 [root@localhost ~]# grep 'r.*h$' /etc/passwd [root@localhost ~]# grep 'r.*h' /etc/passwd "[]"符号 用于匹配方括号内出现的任意字符“\”符号 用于转义字符“<”符号和“>”符号 用于界定单词的左边界和右边界“\d”符号 匹配一个数字,等价于[0-9] 使用grep匹配这种正则表达式时可能会遇到无法匹配的问题 #成功匹配 [root@localhost ~]# echo 123|grep [0-9] 123 #并未匹配 [root@localhost ~]# echo 123|grep "\d" #匹配成功 这是因为“\d”是一种Perl兼容模式的表达式,又称作 PCRE,要想使用这种模式的匹配符,需要加上-P参数 [root@localhost ~]# echo 123|grep -P "\d" 123 “\b”符号 匹配单词的边界“\B”符号 匹配非单词的边界“\w”符号 匹配字母、数字和下划线,等价于[A-Za-z0-9]“\w”符号 匹配非字母、非数字和非下划线,等价于[^A-Za-z0-9]“\n” 符号 匹配一个换行符“\r”符号 匹配一个回车符“\t”匹配一个制表符“\f”匹配一个换页符“\s”匹配任何空白字符“\S”匹配任何非空白字符 正则表达式还能表示电话号码,身份证号码,域名格式,邮箱格式等等,都是根据元字符进行拼装组装,就如英语单词千千万都是用字母组成的一样,用的时候要根据各个规则进行灵活处置。 利用正则表达式怎么截取字符串呢?

    expr - 求一个表达式的值 可以运算加减乘除,俨然是个多功能计算器,字符串表达式的优先级高于数值表达式和逻辑关系表达式。 运算有很多,本次只针对字符串截取来几个小demo ‘STRING : REGEX’ 执行模式匹配。两端参数会转换为字符格式,且第二个参数被视为正则表达式(GNU基本正则),它默认会隐含前缀"^"。随后将第一个参数和正则模式做匹配。 如果匹配成功,且REGEX使用了’(‘和’)’,则此表达式返回匹配到的,如果未使用’(‘和’)’,则返回匹配的字符数。 如果匹配失败,如果REGEX中使用了’(‘和’)’,则此表达式返回空字符串,否则返回为0。 只有第一个’(…)‘会引用返回的值;其余的’(…)‘只在正则表达式分组时有意义。 在正则表达式中,’+’,’?‘和’|'分表代表匹配一个或多个,0个或1个以及两端任选其一的意思。

    #返回匹配的个数 [root@localhost ~]# expr aaa : 'a\+' 3 #返回匹配的内容 [root@localhost ~]# expr abc : 'a\(.\)c' b #返回匹配的内容 [root@localhost ~]# expr service-core-0.0.1-SNAPSHOT.jar : '\(.*[0-9]\)' #返回长度 [root@localhost ~]# expr length 'length test is length' 21 #返回截取的长度 [root@localhost ~]# expr substr abcde 2 4 bcde #加分运算 记得要有空格,不然会原样输出 [root@localhost ~]# expr 1 + 2 3 #除发运算 [root@localhost ~]# expr 12 / 2 6 #求模运算 [root@localhost ~]# expr 12 % 5 2 #乘法运算 *作为特殊字符要进行转译 [root@localhost ~]# expr 12 \* 5 60

    对于怎么判断这个值是否符合正则表达式则用

    #注意不能添加符号,只写表达式即可,添加符号会产生错误 if [[ $file =~ .jar$ ]] then echo "true" else echo false fi

    以上是shell中使用正则表达式所引出来的,不会的多去查,Linux命令就是那么多,使用多了也就记住了,有人说Linux是积沙成塔的过程,慢慢积累,多看帮助文档, info、man用起来。

    参考:书籍《Linux系统命令及shell脚本实践指南》 大神博客:https://www.cnblogs.com/f-ck-need-u/p/7231832.html

    最新回复(0)