本节书摘来自华章出版社《构建高可用Linux服务器 第3版》一 书中的第3章,第3.2节,作者:余洪春 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
Sed是Linux/UNIX平台下的轻量级流编辑器,日常一般用于处理文本文件。Sed有许多很好的特性。首先,它相当小巧;其次,Sed可以配合强大的Shell来完成许多复杂的功能。在我看来,Sed完全可以被看成是一个脚本解释器,它用类似于编程的手段完成许多事情。我们完全可以用Vim+Sed的方式来处理日常工作中的大多数文档。
Sed的格式如下所示:
sed [-nefr] [n1,n2] action其中:
-n:是安静模式,只有经过Sed处理的行才显示出来,其他不显示。
-e:表示直接在命令行模式上进行Sed的操作,是默认选项,不用写。
-f:将Sed的操作写在一个文件里,用的时候“-f filename”就可以按照内容进行Sed操作了。
-r:表示使Sed支持扩展正则表达式。
n1,n2:不一定需要,选择要进行处理的行。如10,20表示在10~20行之间处理。
Sed的action(动作)支持如下参数。
a:表示添加,后接字符串,添加到当前行的下一行。
c:表示替换,后接字符串,用它替换n1到n2之间的行。
d:表示删除符合模式的行,它的语法为sed '/regexp/d',斜杠之间是正则表达式,模式在d前面,d后面一般不接任何内容。
i:表示插入,后接字符串,添加到当前行的上一行。
p:表示打印,打印某个选择的数据,通常与-n安静模式一起使用。
s:表示搜索,还可以替换,类似于Vim里的搜索替换功能。例如:1,20s/old/new/g表示替换1~20行的old为new,g在这里表示处理这一行所有匹配的内容。
注意 动作最好用''括起来,防止因空格导致错误。
Sed实例如下所示(下面所有实例在CentOS 5.8_x64下已通过):
1)显示passwd内容,将2~5行删除后显示。
cat -n /etc/passwd |sed '2,5d'
1 root:x:0:0:root:/root:/bin/bash
6 games:x:5:60:games:/usr/games:/bin/sh
7 man:x:6:12:man:/var/cache/man:/bin/sh
8 lp:x:7:7:lp:/var/spool/lpd:/bin/sh
...2)在第2行后面的一行加上“Hello China!”字符串。
cat -n /etc/passwd |sed '2a Hello China!'
1 root:x:0:0:root:/root:/bin/bash
2 daemon:x:1:1:daemon:/usr/sbin:/bin/sh
Hello China!
...3)在第2行后面一行加上两行字,例如:“this is first line!”和“this is second line!”。
cat -n /etc/passwd |sed '2a This is first line! \ //使用续航符\后按回车输入后续行
This is second line!'// 以' 结尾再按回车键结束
1 root:x:0:0:root:/root:/bin/bash
2 daemon:x:1:1:daemon:/usr/sbin:/bin/sh
This is first line!
This is second line!
3 bin:x:2:2:bin:/bin:/bin/sh4)将第2~5行的内容替换成“我是大好人!”。
cat -n /etc/passwd | sed '2,5c 我是大好人!'
1 root:x:0:0:root:/root:/bin/bash
我是大好人!
6 games:x:5:60:games:/usr/games:/bin/sh
7 man:x:6:12:man:/var/cache/man:/bin/sh
8 lp:x:7:7:lp:/var/spool/lpd:/bin/sh5)只显示第5~7行,注意p与-n的配合使用!
cat -n /etc/passwd |sed -n '5,7p'
5 sync:x:4:65534:sync:/bin:/bin/sync
6 games:x:5:60:games:/usr/games:/bin/sh
7 man:x:6:12:man:/var/cache/man:/bin/sh6)使用ifconfig列出IP,我们只想要eth0的IP地址。可以先用grep取出有IP的那一行,然后用Sed去掉(替换成空)IP前面和后面的内容,如下所示:
#ifconfig eth0 eth0 Link encap:Ethernet HWaddr 00:16:36:02:41:aa inet addr:172.30.171.35 Bcast:172.30.171.255 Mask:255.255.255.0 UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:1221198 errors:0 dropped:0 overruns:0 frame:0 TX packets:1125085 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:1000 RX bytes:1477365271 (1.3 GB) TX bytes:141539593 (134.9 MB) Interrupt:20 ifconfig eth0 | grep 'inet addr' |sed 's/^.*addr://g' | sed 's/Bcast.*$//g' 172.30.171.35 ``` '^.*addr:'表示从开头到addr:的字符串,将它替换为空,'Bcast.*$'表示从Bcast到结尾的串,也将它替换为空,然后就只剩下IP了。 另外一种更简便的方法如下: ifconfig eth0 | grep "inet addr:"|awk -F[:" "]+ '{print $4}' 192.168.21.41 awk -F[:" "]的意思就是以:或空格符作为分隔符,然后打印出第4列。这里有些朋友会有疑惑,问那为什么不直接以如下方法获取IP呢? ifconfig eth0 | grep "inet addr:" | awk -F: '{print $2}' 得出的结果如下: 192.168.21.41 Bcast 所以还需要进行一步,如下: ifconfig eth0 | grep "inet addr:" | awk -F: '{print $2}' | awk '{print $1}' 我希望大家以这个例子好好总结一下Sed的经典用法。下面的方法其实是Awk的方法,它也是一种优秀的编辑器,现多用于对文本字段的列的截取。 7)在/etc/manpath.config中,将有MAN的设置取出,但不要说明内容。代码如下所示: cat /etc/manpath.config |grep 'MAN'|sed 's/#.*$//g'|sed '/^$/d' MANDATORY_MANPATH /usr/man MANDATORY_MANPATH /usr/share/man MANDATORY_MANPATH /usr/local/man MANPATH_MAP /bin /usr/share/man MANPATH_MAP /usr/bin /usr/share/man MANPATH_MAP /sbin /usr/share/man MANPATH_MAP /usr/sbin /usr/share/man ... 注意,#不一定出现在行首。因此,/#.*$/表示#和后面的数据(直到行尾)是一行注释,将它们替换成空。/^$/表示空行,后接d表示删除空行。注意,删除空行不能用替换方法,因为空行替换成空后,那一行中还是有换行符的。 以上就是Sed的几种常见的语法命令,希望大家结合下面的实例,多在自己的机器上演示,尽快熟练掌握其用法。 ####3.2.2 Sed的用法举例说明 1.Sed的基础用法 1)删除行首空格,代码如下: sed 's/^[ ]*//g' filename sed 's/^ *//g' filename sed 's/^[[:space:]]*//g' filename 2)在行后和行前添加新行。 行后的命令如下: sed 's/pattern/&\ n/g' filename 行前的命令如下: sed 's/pattern/\ n&/g' filename 其中,&代表pattern。 3)使用变量替换(使用双引号),代码如下: sed -e "s/$var1/$var2/g" filename 4)在第一行前插入文本,代码如下: sed -i '1 i\ 插入字符串' filename 5)在最后一行插入,代码如下: sed -i '$ a\ 插入字符串' filename 6)在匹配行前插入,代码如下: sed -i '/pattern/ i "插入字符串"' filename 7)在匹配行后插入,代码如下: sed -i '/pattern/ a "插入字符串"' filename 8)删除文本中空行和空格组成的行及#号注释的行,代码如下: grep -v ^# filename | sed /^[[:space:]]*$/d | sed /^$/d 9)要将目录/modules下面所有文件中的zhangsan都修改成list,可用如下命令(注意备份原文件),代码如下: sed -i 's/zhangsan/list/g' 'grep zhangsan -rl /modules' 2.巧用Vim+Sed整理nginxd.sh脚本文件 我在工作中遇到了问题,于是到Google搜索后下载了Nginx配置脚本,在复制粘贴到服务器中运行时,发现前面的001~100行都有行标识符,外带空格,影响运行和美观。本来想一行行地删除,后来觉得过于麻烦,于是想到可以用Sed来解决问题,解决方法如下。 1)在Vim里删除所有行的首数字,命令如下: :%s/^[0-9][0-9]* // 2)再删除所有行的首空字符,如下所示: sed -i 's/^[[:space:]]*//' nginxd.sh 整个nginxd.sh演示脚本如下,有兴趣的朋友也可以拿来练练手。 001 #!/bin/sh 002 003 # source function library 004 . /etc/rc.d/init.d/functions 005 006 # Source networking configuration. 007 . /etc/sysconfig/network 008 009 # Check that networking is up. 010 [${NETWORKING} = "no" ] && exit 0 011 012 RETVAL=0 013 prog="nginx" 014 015 nginxDir=/usr/local/nginx 016 nginxd=$nginxDir/sbin/nginx 017 nginxConf=$nginxDir/conf/nginx.conf 018 nginxPid=$nginxDir/nginx.pid 019 020 nginx_check() 021 { 022 if [[ -e $nginxPid ]]; then 023 ps aux |grep -v grep |grep -q nginx 024 if(( $? == 0 )); then 025 echo "$prog already running..." 026 exit 1 027 else 028 rm -rf $nginxPid &> /dev/null 029 fi 030 fi 031 } 032 033 start() 034 { 035 nginx_check 036 if (( $? != 0 )); then 037 true 038 else 039 echo -n $"Starting $prog:" 040 daemon $nginxd -c $nginxConf 041 RETVAL=$? 042 echo 043 [$RETVAL = 0 ] && touch /var/lock/subsys/nginx 044 return $RETVAL 045 fi 046 } 047 048 stop() 049 { 050 echo -n $"Stopping $prog:" 051 killproc $nginxd 052 RETVAL=$? 053 echo 054 [$RETVAL = 0 ] && rm -f /var/lock/subsys/nginx $nginxPid 055 } 056 057 reload() 058 { 059 echo -n $"Reloading $prog:" 060 killproc $nginxd -HUP 061 RETVAL=$? 062 echo 063 } 064 065 monitor() 066 { 067 status $prog &> /dev/null 068 if (( $? == 0 )); then 069 RETVAL=0 070 else 071 RETVAL=7 072 fi 073 } 074 075 case "$1" in 076 start) 077 start 078 ;; 079 stop) 080 stop 081 ;; 082 restart) 083 stop 084 start 085 ;; 086 reload) 087 reload 088 ;; 089 status) 090 status $prog 091 RETVAL=$? 092 ;; 093 monitor) 094 monitor 095 ;; 096 *) 097 echo $"Usage: $0 {start|stop|restart|reload|status|monitor}" 098 RETVAL=1 099 esac 100 exit $RETVA 此文件还有很多变化,比如空格在开头,序列号在中间,这也可以用Sed来解决,只是这时又应该写出怎样的Sed命令呢?这就留给大家思考吧! 3.Sed结合正则表达式批量修改文件名 注意 Sed是完全支持正则表达式的,在正则表达式里,[^.]表示为非.的所有字符,换成[^/]也可。另外,@是Sed的分隔符,我们也可以用其他符号,比如/,但是如果要用到/的话就得\/了,所以经常用的是@。 4.在配置.conf文件时,经常要为相邻的几行添加#号以注释掉 例如,我们要将test.txt文件中的第31~36行加上#号,这该如何实现呢? 在Vim中,我们可以执行如下代码: :31,36 s/^/#/ 而用Sed的话则执行起来更方便,如下所示: sed -i '31,36s/^/#/' test.txt 反之,如果要将第31~36行带#号的全删除,用Sed该如何实现呢?方法如下: sed –i '31,36s/^#//' test.txt 许多人习惯在这个方法后面带个g,事实上,如果没有g,则表示从行的左端开始匹配,每一行第一个与之匹配的会被换掉;如果有g,则表示每一行所有与之匹配的都会被换掉。 5.利用Sed很方便地分析日志 利用Sed还可以很方便地分析日志。例如,在以下的secure日志文件中,我想用Sed抓取12∶48∶48至12∶48∶55的日志。 Apr 17 05:01:20 localhost sshd[16375]: pam_unix(sshd:auth): authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=222.186.37.226 user=root Apr 17 05:01:22 localhost sshd[16375]: Failed password for root from 222.186.37.226 port 60700 ssh2 Apr 17 05:01:22 localhost sshd[16376]: Received disconnect from 222.186.37.226: 11: Bye Bye Apr 17 05:01:22 localhost sshd[16377]: pam_unix(sshd:auth): authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=222.186.37.226 user=root Apr 17 05:01:24 localhost sshd[16377]: Failed password for root from 222.186.37.226 port 60933 ssh2 Apr 17 05:01:24 localhost sshd[16378]: Received disconnect from 222.186.37.226: 11: Bye Bye Apr 17 05:01:24 localhost sshd[16379]: pam_unix(sshd:auth): authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=222.186.37.226 user=root Apr 17 05:01:26 localhost sshd[16379]: Failed password for root from 222.186.37.226 port 32944 ssh2 Apr 17 05:01:26 localhost sshd[16380]: Received disconnect from 222.186.37.226: 11: Bye Bye Apr 17 05:01:27 localhost sshd[16381]: pam_unix(sshd:auth): authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=222.186.37.226 user=root Apr 17 05:01:29 localhost sshd[16381]: Failed password for root from 222.186.37.226 port 33174 ssh2 Apr 17 05:01:29 localhost sshd[16382]: Received disconnect from 222.186.37.226: 11: Bye Bye Apr 17 05:01:29 localhost sshd[16383]: pam_unix(sshd:auth): authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=222.186.37.226 user=root Apr 17 05:01:31 localhost sshd[16383]: Failed password for root from 222.186.37.226 port 33474 ssh2 Apr 17 05:01:31 localhost sshd[16384]: Received disconnect from 222.186.37.226: 11: Bye Bye Apr 17 05:01:32 localhost sshd[16385]: pam_unix(sshd:auth): authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=222.186.37.226 user=root 我们可以用tail看到下面的日志最终时间是05∶01∶32,那么如何用Sed抓取呢?利用Sed成功截取日志命令,如下所示: cat /var/log/secure | sed -n '/12:48:48/,/12:48:55/p' Apr 23 12:48:48 localhost sshd[20570]: Accepted password for root from 220.249.72.138 port 27177 ssh2 Apr 23 12:48:48 localhost sshd[20570]: pam_unix(sshd:session): session opened for user root by (uid=0) Apr 23 12:48:55 localhost sshd[20601]: Accepted password for root from 220.249.72.138 port 59754 ssh2