当前位置:   article > 正文

linux之sed命令n,N,d,D,p,P,h,H,g,G,x解析_n 命令

n 命令

前言

sed执行模板 = sed ‘模式{命令1;命令2}’ 文件,即逐行读入模式空间,执行命令,最后输出打印出来。

sed的语法格式:

sed [option] 'pattern{sed-command1;sed-command2}' {input-file}

sed在正常情况下,将处理的行读入模式空间(pattern space),脚本中的“sed-command(sed命令)”就一条接着一条进行处理,直到脚本执行完毕,然后该行被输出,模式(pattern space)被清空。接着,在重复执行刚才的动作,文件中的新的一行被读入,直到文件处理完毕。

但是,由于种种原因,如用户希望在某个条件下,脚本中的某个命令被执行或希望模式空间(pattern space)保留,以便下一次使用,这都有可能使sed在处理文件的时候,不按照正常的流程来进行处理,这时候就需要用sed高级命令来满足需求。

p和P命令

p打印当前模式空间所有内容,追加到默认输出之后;P打印当前模式空间开端至\n的内容,并追加到默认输出之前。
Sed并不对每行末尾\n进行处理,但是对N命令追加的行间\n进行处理,因为此时sed将两行看做一行。

n和N命令

命令n:读取下一行到pattern space。由于pattern space中有按照正常流程读取的内容,使用n命令后,pattern space中又有了一行,此时,pattern space中有2行内容,但是先读取的那一行不会被删除;当n命令后,还有其他命令p的时候,此时打印出的结果是n命令读取的那一行的内容。

看下图,你就明白了。

新建文件,其内容如下

cat 1.txt

1

2

正常sed流程

使用n命令后,

N命令:将下一行添加到pattern space中。将当前读入行和用N命令添加的下一行看成“一行”。

新建文件1.txt

cat 1.txt

1

2

正常sed流程

使用N命令后

=========================================================

n命令简单来说就是提前读取下一行,覆盖模型空间前一行(并没有删除,因此依然打印至标准输出),执行后续命令。然后再读取新行,对新读取的内容重头执行sed。如果命令未执行成功(并非跳过:前端条件不匹配),则放弃之后的任何命令,并对新读取的内容,重头执行sed。

例子:从aaa文件中取出偶数行

  1. [root@localhost ~]# cat a.txt
  2. This is 1   
  3. This is 2   
  4. This is 3   
  5. This is 4   
  6. This is 5
  7. [root@localhost ~]# sed –n ‘n;p’ a.txt
  8. This is 2   
  9. This is 4   

读取This is 1,执行n命令,此时模式空间为This is 2,执行p,打印模式空间内容This is 2,之后读取This is 3,执行n命令,此时模式空间为This is 4,执行p,打印模式空间内容This is 4,之后读取This is 5,执行n命令,因为没有了,所以退出,并放弃p命令。因此,最终打印出来的就是偶数行。

N 追加下一行到当前行,把两行看作一行,但是\n换行符还在。如果命令未执行成功,则放弃后面的命令,读取下一行再执行sed。
sed命令n,N,d,D,p,P,h,H,g,G,x解析

使用N命令后
sed命令n,N,d,D,p,P,h,H,g,G,x解析

N命令简单来说就是追加下一行到模式空间,同时将两行看做一行,但是两行之间依然含有\n换行符,然后执行后续命令,然后再读取新行,对新读取的内容重头执行sed。此时,新读取的行会覆盖之前的行(之前的两行已经合并为一行)。如果命令未执行成功(并非跳过:前端条件不匹配),则放弃之后任何命令,并对新读取的内容,重头执行sed。

  1. #例子:从aaa文件中读取奇数行
  2. [root@localhost ~]# sed –n ‘N;P’ a.txt   -----因为读取第5行时,执行N,发现没有第6行,不满足,就退出,放弃P命令
  3. This is 1   
  4. This is 3   
  5. [root@localhost ~]# sed –n ‘$!N;P’ a.txt   
  6. This is 1   
  7. This is 3   
  8. This is 5
  9. [root@localhost ~]#

注释中1代表This is 1 ,2代表This is 2 以此类推
注释:读取1,$!条件满足(不是尾行),执行N命令,得出1\n2,执>行P,打印得1,读取3,$!条件满足(不是尾行),执行N命令,得出>3\n4,执行P,打印得3,读取5,$!条件不满足,跳过N,执行P,打印得5

d和D命令

d命令是删除当前模式空间内容(不再传至标准输出),并放弃之后的命令,并对新读取的内容,重头执行sed。

  1. [root@localhost ~]# sed ‘n;d’ a.txt 
  2. This is 1   
  3. This is 3   
  4. This is 5
  5. [root@localhost ~]#

注释:读取1,执行n,得出2,执行d,删除2,得空,以此类推,读取3,执行n,得出4,执行d,删除4,得空,但是读取5时,因为n无法执行,所以d不执行。因无-n参数,故输出1\n3\n5

D命令是删除当前模式空间开端至\n的内容(不在传至标准输出),放弃之后的命令,但是对剩余模式空间重新执行sed。

  1. Sed 'N;D' aaa           
  2. This is 5   

注释:读取1,执行N,得出1\n2,执行D,得出2,执行N,得出2\n3,执行D,得出3,依此类推,得出5,执行N,条件失败退出,因无-n参数,故输出5

y命令:对之前匹配的字符逐个替换

  1. [root@localhost ~]# awk '{print $0"h"}' a.txt | sed ‘y/his/HIS/
  2. THIS IS 1H
  3. THIS IS 2H
  4. THIS IS 3H
  5. THIS IS 4H
  6. THIS IS 5H
  7. [root@localhost ~]#sed 's/\b[a-z]\b/\u&/g' ddd   
  8. This is A and A is 1   
  9. This is B and B is 2   
  10. This is C and C is 3   
  11. This is D and D is 4   
  12. This is E and E is 5    
  13. #此外,如果需要对某个字符串进行大小写转换,则可使用如下方法    

h命令,H命令,g命令,G命令

h命令是将当前模式空间中内容覆盖至缓存区,H命令是将当前模式空间中的内容追加至缓存区
g命令是将当前缓存区中内容覆盖至模式空间,G命令是将当前缓存区中的内容追加至模式空间

  1. [root@wmsvmpc ~]# sed –e ‘/101/h’ –e ‘$G’ cs1.txt 
  2. PBCSPOFT0101    6
  3. PBCSPOFT0102    0
  4. PBCSPOFT0103    8
  5. PB\CSPOFT0104   0
  6. PBCSPOFT0101    6
  7. [root@wmsvmpc ~]#

在sed处理文件的时候,每一行都被保存在一个叫模式空间的临时缓冲区中,除非行被删除或者输出被取消,否则所有被处理的行都将打印在屏幕上。接着模式空间被清空,并存入新的一行等待处理。
在上面的例子里,匹配test的行被找到后,将存入模式空间,h命令将其复制并存入一个称为保持缓存区的特殊缓冲区内。第二条语句的意思是,当到达最后一行后,G命令取出保持缓冲区的行,然后把它放回模式空间中,然后被打印(也就末尾)。

  1. [root@wmsvmpc ~]# sed –e ‘/101/h’ –e ‘/102/G’ cs1.txt   
  2. PBCSPOFT0101    6
  3. PBCSPOFT0102    0
  4. PBCSPOFT0101    6
  5. PBCSPOFT0103    8
  6. PB\CSPOFT0104    0
  7. #追加到包含102的行的下一行

将ddd文件中数字和字母互换,并将字母大写

  1. cat ddd.sed
  2. h  
  3. {  
  4. s/.*is \(.*\) and .*/\1/  
  5. y/abcde/ABCDE/
  6. G  
  7. s/\(.*\)\n\(.*is \).*\(and \).*\(is \)\(.*\)/\2\5 \3\5 \4\1/  
  8. }  
  9. sed –f ddd.sed ddd  
  10. This is 1 and 1 is A  
  11. This is 2 and 2 is B  
  12. This is 3 and 3 is C  
  13. This is 4 and 4 is D  
  14. This is 5 and 5 is E    

注释:读取1,执行h,复制到缓存区,执行s,模式空间得到匹配到的字母a,然后执行y,将a转成A,执行G,追加缓存区内容到模式空间,得
A\nThis is a and a is 1;执行s,重新排列,得出This is 1 and 1 is A;以此类推,得出结果。
这里需要注意的是匹配的内容中,空格一定要处理好,空格处理不对,会造成第二次s匹配错误,无法执行重新排列或排列错误

x命令

x命令是将当前缓存区和模式空间内容互换

  1. [root@wmsvmpc ~]# sed –e ‘/101/h’ –e ‘/102/x’ cs1.txt   
  2. PBCSPOFT0101    6
  3. PBCSPOFT0101    6
  4. PBCSPOFT0103    8
  5. PB\CSPOFT0104   0
  6. #互换模式空间和保持缓冲区的内容。也就是把包含101102的行互换。应该是替换.
  7. [root@wmsvmpc ~]#  echo –e "a\nb\nc\nd\n"|sed –nr 'H;${x;s/\n//g;p}'
  8. abcd

r:use extended regular expressions in the script,使用功能更强大的正则表达式。
${} 表示处理到文件最后一行时执行{}中的命令,x把之前存入缓存区的数据按先入先出的顺序放入模式空间,然后做替换,最后打印

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/322844
推荐阅读
相关标签
  

闽ICP备14008679号