Linux文本處理命令grep及正則表達式

Linux文本處理命令grep及正則表達式

一、grep

1、grep概述

(1)作用:grep是一文本搜索工具,根據用戶指定的“模式”對目標文本逐行進行匹配檢查;打印匹配到的行

(2)模式:由正則表達式字符及文本字符所編寫的過濾條件

2、命令格式

grep [選項] 模式 [文件…]

案例:打印passwd文件中root用戶的信息

1

3、grep選項

選項 功能
–color=auto 對匹配到的文本著色顯示
-v 顯示不被pattern匹配到的行
-i 忽略字符大小寫
-n 顯示匹配的行號,此處的行號時該內容在原文件中的行號
-c 統計匹配的行數
-o 僅顯示匹配到的字符串
-q 靜默模式,不輸出任何信息
-A 輸出滿足條件的前幾行,比如grep –B 3 “aa” file表示在file中輸出有aa的行,同時還要輸出aa的前三行
-B 輸出滿足條件的后幾行
-C # 相當于同時用-A –B,即前后都輸出
-e 實現多個選項間的邏輯or關系grep?–e?‘cat?’?-e?‘dog’?file
-w 匹配整個單詞
-E 相當于egrep?支持擴展的正則表達式
-F 相當于fgrep,不支持正則表達式

?

二、正則表達式

1、正則表達式及概述

(1)概述:由一類特殊字符及文本字符所編寫的模式,用來在文件中匹配符合條件的字符串,其中有些字符(元字符)不表示字符字面意義,而表示控制或通配的功能。

(2)正則表達式Linux中支持的程序

grep,sed,awk,vim, less,nginx,varnish等

2、基本的正則表達式

(1)字符匹配:

字符 功能 字符 功能
. 匹配任意單個字符 [] 匹配指定范圍內的任意單個字符
[^] 匹配指定范圍外的任意單個字符 [:alpha:] 代表任何英文大小寫字符,亦即 A-Z, a-z
[:alnum:] 字母和數字 [:alpha:] 代表任何英文大小寫字符,亦即 A-Z, a-z
[:lower:] 小寫字母 [:upper:] 大寫字母
[:blank:] 空白字符(空格和制表符) [:space:] 水平和垂直的空白字符
[:cntrl:] 不可打印的控制字符(退格、刪除、警鈴…) [:digit:] 十進制數字 [:xdigit:]十六進制數字
[:graph:] 可打印的非空白字符 [:print:] 可打印字符
[:punct:] 標點符號

(2)匹配次數:用在要指定次數的字符后面,用于指定前面的字符要出現的次數

符號 功能
* 匹配前面的字符任意次,包括0次貪婪模式:盡可能長的匹配
.* 任意長度的任意字符
\? 匹配其前面的字符0或1次
\+ 匹配其前面的字符至少1次
\{n\} 匹配前面的字符n次
\{m,n\} 匹配前面的字符至少m次,至多n次
\{,n\} 匹配前面的字符至多n次
\{n,\} 匹配前面的字符至少n次

(3)位置錨定:定位出現的位置

符號 功能
^ 行首錨定,用于模式的最左側
$ 行尾錨定,用于模式的最右側
^PATTERN$ 用于模式匹配整行
^$ 空行
^[[:space:]]*$ 空白行
\<?或 \b 詞首錨定,用于單詞模式的左側
\>?或 \b 詞尾錨定;用于單詞模式的右側
\<PATTERN\> 匹配整個單詞

(4)分組:將一個或多個字符捆綁在一起,當作一個整體進行處理分組括號中的模式匹配到的內容會被正則表達式引擎記錄于內部的變量中,這些變量的命名方式為: \1, \2, \3,

\1 :表示從左側起第一個左括號以及與之匹配右括號之間的模式所匹配到的字符

示例:\(string1\+\(string2\)*\)

\1?:string1\+(string2\)*

\2?:string2

后向引用:引用前面的分組括號中的模式所匹配字符,而非模式本身

三、正則表達式及grep的使用案例

1、顯示/proc/meminfo文件中以大小s開頭的行

2

SwapCached:?????????? 12 kB

SwapTotal:?????? 2097148 kB

或者grep -E “^(s|S)” /proc/meminfo

grep “^[Ss]”? /proc/meminfo

2、顯示/etc/passwd文件中不以/bin/bash結尾的行

3

3、顯示用戶lp默認的shell程序

4

或者cat /etc/passwd | grep “\<lp\>” | cut -d”:” -f7

4、找出/etc/passwd中的兩位或三位數

5

或者:cat /etc/passwd | grep -o “\<[0-9]\{2,3\}\>”

5、顯示CentOS7的/etc/grub2.cfg文件中,至少以一個空白字符開頭的且后面存非空白字符的行

6

6、找出“netstat -tan”命令的結果中以‘LISTEN’后跟任意多個空白字符結尾的行

7

7、顯示CentOS7上所有系統用戶的用戶名和UID

8

8、找出/etc/passwd用戶名同shell名的行

9

或者 grep “^\([[:alnum:]]\+\):.*\1$” /etc/passwd

9、利用df和grep,取出磁盤各分區利用率,并從大到小排序

10

?

四、egrep及擴展正則表達式及使用案例

1、egrep的正則表達式及元字符

元字符 功能 元字符 功能
^ 行首定位符 $ 行尾定位符
. 匹配出換行外的單個字符 * 匹配0個或多個前導字符
[] 匹配指定字符組內任一字符 [^] 匹配不在組內任一字符
+ 匹配一次或多次 匹配0此或1次
a|b 匹配a或者b {m} 匹配m次
{m,n} 至少m,至多n次 \<, \b 語首
\>, \b 語尾 () 分組

2、egrep使用案例

(1)顯示三個用戶root、mage、wang的UID和默認shell

11

(2)找出/etc/rc.d/init.d/functions文件中行首為某單詞(包括下劃線)后面跟一個小括號的行

12

(3)使用egrep取出/etc/rc.d/init.d/functions中其基名

13

(4)使用egrep取出/etc/rc.d/init.d/functions的目錄名

14

(5)顯示ifconfig命令結果中所有IPv4地址

15

(6)將此字符串:welcome to magedu linux 中的每個字符去重并排序,重復次數多的排到前面

16

本文來自投稿,不代表Linux運維部落立場,如若轉載,請注明出處:http://www.www58058.com/95314

(0)
ponypony
上一篇 2018-04-07
下一篇 2018-04-07

相關推薦

欧美性久久久久