感谢支持
我们一直在努力

Unix文本处理工具之sed

和上文提到的awk一样(见 http://www.linuxidc.com/Linux/2013-08/89316.htm ),sed也是Unix的文本处理工具。sed是Stream Editor(流式编辑器)的缩写,它能够基于模式匹配过滤(所谓过滤就是在文件中找到符合某些条件的行)修改文本(就是对找到的符合条件的内容进行一些修改操作)。

1、sed命令格式

1.1 sed命令的基本格式

sed命令主要有三种使用形式:

  • sed ‘编辑指令’ 文件1 文件2 ……:用于将处理后的结果输出
  • sed -n ‘编辑指令’ 文件1 文件2 ……:用于只输出编辑指令影响的行
  • sed -i ‘编辑指令’ 文件1 文件2 ……:用于直接在文本文件上修改文本内容(在物理磁盘上修改文件)

1.2 编辑指令

编辑指令主要由两部分组成:前面是逗号隔开的两个地址(或者没有逗号,只有一个地址),代表要处理文本的起始位置到结束位置;后面是要进行的操作类型。格式如下:

[起始地址[,结束地址]]操作类型

如果在一条sed命令中要用到多条编辑指令,那么各个编辑指令之间要用;隔开,也可以将多条编辑指令放在多个单引号中,但是这样的话,要在每个单引号的前面加一个-e。下面是一个简单的例子:

$cat sed_test.txt
1 apple a,b,d,f
2 boy alsdjf,apple,kdjf
3 cat 163.2.201.1
4 dog www.linuxidc.com
5 eat http://www.linuxidc.com/Linuxitit/linux

$sed -n ‘2,5p’ sed_test.txt
2 boy alsdjf,apple,kdjf
3 cat 163.2.201.1
4 dog www.linuxidc.com
5 eat http://www.linuxidc.com/Linuxitit/linux

$sed -n ‘5p’ sed_test.txt
5 eat http://www.linuxidc.com/Linuxitit/linux

$sed -n -e ‘2p’ -e’5p’ sed_test.txt
2 boy alsdjf,apple,kdjf
5 eat http://www.linuxidc.com/Linuxitit/linux

1.3 操作类型

sed常用的操作类型如下:

操作 作用
p 打印文本行(print)
n 取下一行(next)
d 删除(delete)
s 字符串替换(substitude)
a 追加新的文本(append)

2、例子

 

下面的例子都是对文提到的文件sed_test.txt的操作:

使用正则表达式:
(1)输出从第一个包含kdjf的行到最后一行($代表最后一行)
$sed -n ‘/kdjf/,$p’ sed_test.txt
2 boy alsdjf,appleapple,kdjf
3 cat 163.2.201.1
4 dog www.linuxidc.com
5 eat http://www.linuxidc.com/Linuxitit
(2)输出包含单词apple的行
(shell中单词是指一个字符串前后有空格或其它标点符号。正则表达式中用一个<>来界定一个单词,在sed中用该符号要进行转义。)
$sed -n ‘/\<apple\>/p’ sed_test.txt
1 apple a,b,d,f

删除指定行(这里没有-i,不对原文件进行操作,只是将处理后的结果输出。):
(1)删除第2到4行
$sed ‘2,4d’ sed_test.txt
1 apple a,b,d,f
5 eat http://www.linuxidc.com/Linuxitit
(2)删除包含appleapple的行和最后一行($)
$sed ‘/appleapple/d;$d’ sed_test.txt
1 apple a,b,d,f
3 cat 163.2.201.1
4 dog www.linuxidc.com
(3)删除不包含(!表示反选,选中不符合条件的行)apple的行(这样就只剩下了包含apple的行了)
$sed ‘/apple/!d’ sed_test.txt
1 apple a,b,d,f
2 boy alsdjf,appleapple,kdjf

替换指定文本:
(1)将1-4行的apple换成AMAZON。s代表替换,g代表如果一行出现两个apple则全部替换。
$sed ‘1,4s/apple/AMAZON/g’ sed_test.txt
1 AMAZON a,b,d,f
2 boy alsdjf,AMAZONAMAZON,kdjf
3 cat 163.2.201.1
4 dog www.linuxidc.com
5 eat http://www.linuxidc.com/Linuxitit
(2)注释shell脚本(在行首插入#)
$sed ‘1,3s/^/#/g’ sed_test.txt
#1 apple a,b,d,f
#2 boy alsdjf,appleapple,kdjf
#3 cat 163.2.201.1
4 dog www.linuxidc.com
5 eat http://www.linuxidc.com/Linuxitit
(3)删除字符串apple(如果不写起始地址和结束地址,则默认为所有行。)
$sed ‘s/apple//g’ sed_test.txt
1  a,b,d,f
2 boy alsdjf,,kdjf
3 cat 163.2.201.1
4 dog www.linuxidc.com
5 eat http://www.linuxidc.com/Linuxitit

以上两篇文章介绍了Unix两个文本处理工具awk和sed,希望对大家有所帮助。

相关阅读

Linux下Shell编程——awk编程 http://www.linuxidc.com/Linux/2013-06/85527.htm

Linux下Shell编程——sed命令基本用法 http://www.linuxidc.com/Linux/2013-06/85526.htm

Linux下Shell编程——grep命令的基本运用 http://www.linuxidc.com/Linux/2013-06/85525.htm

Linux下Shell编程——正则表达式基础与扩展 http://www.linuxidc.com/Linux/2013-06/85523.htm

3、初步体会sed的威力

比如你有一个文件内容如下:

test.txt:
{‘books/daglib/0015113’: ‘<title>Scale-isometric polytopal graphs in hypercubes and Z<sub>n</sub>.</title>\n’,
‘books/daglib/0097705’: ‘<title>Discrete total l<sub>p</sub>-norm approximation problem for the function.</title>\n’,
‘books/daglib/p/AveneauCFM11’: ‘<title>A Framework for <i>n</i>-Dimensional Visibility Computations.</title>\n’,
‘books/daglib/p/Carter11’: ‘<title>Using <i>Dungeons and Dragons</i> to Integrate Curricula in Classroom.</title>\n’,
‘books/daglib/p/CasolaLRV11’: ‘<title>Access Control in Cloud-on-Grid Systems: The <i>PerfCloud</i> Case Study.</title>\n’,
‘books/daglib/p/ChunKZDMZ11’: ‘<title>Reverse Engineer of Gene Networks with Application <i>in silico</i> Network.</title>\n’,
‘books/daglib/p/ChungK11’: ‘<title>eQTL Mapping for Functional Classes of <i>Saccharomyces cerevisiae</i> Genes wssion.</title>\n’,
‘books/daglib/p/Goldman11’: ‘<title>A Model for Computer Graphics Based on Algebra for \xe2\x84\x9d<sup>3</sup>.</title>\n’,
‘books/daglib/p/LiZ11’: ‘<title>Line Geometry over \xe2\x84\x9d<sup>3, 3</sup>, and Stewart Platforms.</title>\n’,
‘books/daglib/p/Liestol11’: ‘<title><i>Situated Simulations</i> Between Reality and Designing a Narrative Space.</title>\n’}

现在你要将其中的各行中的类似于标签之类的东西去掉,只需用一条sed命令:

$sed -e ‘s/<title>//g;s/<\/title>//g’ -e ‘s/<i>//g;s/<\/i>//g’ -e ‘s/<sub>//g;s/<\/sub>//g’ -e ‘s/<sup>//g;s/<\/sup>//g’ test.txt
{‘books/daglib/0015113’: ‘Scale-isometric polytopal graphs in hypercubes and Zn.\n’,
‘books/daglib/0097705’: ‘Discrete total lp-norm approximation problem for the function.\n’,
‘books/daglib/p/AveneauCFM11’: ‘A Framework for n-Dimensional Visibility Computations.\n’,
‘books/daglib/p/Carter11’: ‘Using Dungeons and Dragons to Integrate Curricula in Classroom.\n’,
‘books/daglib/p/CasolaLRV11’: ‘Access Control in Cloud-on-Grid Systems: The PerfCloud Case Study.\n’,
‘books/daglib/p/ChunKZDMZ11’: ‘Reverse Engineer of Gene Networks with Application in silico Network.\n’,
‘books/daglib/p/ChungK11’: ‘eQTL Mapping for Functional Classes of Saccharomyces cerevisiae Genes wssion.\n’,
‘books/daglib/p/Goldman11’: ‘A Model for Computer Graphics Based on Algebra for \xe2\x84\x9d3.\n’,
‘books/daglib/p/LiZ11’: ‘Line Geometry over \xe2\x84\x9d3, 3, and Stewart Platforms.\n’,
‘books/daglib/p/Liestol11’: ‘Situated Simulations Between Reality and Designing a Narrative Space.\n’}

如果要在原文件中修改,只需加-i参数。

赞(0) 打赏
转载请注明出处:服务器评测 » Unix文本处理工具之sed
分享到: 更多 (0)

听说打赏我的人,都进福布斯排行榜啦!

支付宝扫一扫打赏

微信扫一扫打赏