Linux文本處理命令grep及正則表達式

一、grep

1、grep概述

（1）作用：grep是一文本搜索工具，根據用戶指定的“模式”對目標文本逐行進行匹配檢查；打印匹配到的行

（2）模式：由正則表達式字符及文本字符所編寫的過濾條件

2、命令格式

grep [選項] 模式 [文件…]

案例:打印passwd文件中root用戶的信息

3、grep選項

選項	功能
–color=auto	對匹配到的文本著色顯示
-v	顯示不被pattern匹配到的行
-i	忽略字符大小寫
-n	顯示匹配的行號，此處的行號時該內容在原文件中的行號
-c	統計匹配的行數
-o	僅顯示匹配到的字符串
-q	靜默模式，不輸出任何信息
-A	輸出滿足條件的前幾行，比如grep –B 3 “aa” file表示在file中輸出有aa的行，同時還要輸出aa的前三行
-B	輸出滿足條件的后幾行
-C #	相當于同時用-A –B，即前后都輸出
-e	實現多個選項間的邏輯or關系grep?–e?‘cat?’?-e?‘dog’?file
-w	匹配整個單詞
-E	相當于egrep?支持擴展的正則表達式
-F	相當于fgrep，不支持正則表達式

二、正則表達式

1、正則表達式及概述

（1）概述：由一類特殊字符及文本字符所編寫的模式，用來在文件中匹配符合條件的字符串，其中有些字符（元字符）不表示字符字面意義，而表示控制或通配的功能。

（2）正則表達式Linux中支持的程序

grep,sed,awk,vim, less,nginx,varnish等

2、基本的正則表達式

（1）字符匹配:

（2）匹配次數：用在要指定次數的字符后面，用于指定前面的字符要出現的次數

（3）位置錨定：定位出現的位置

（4）分組：將一個或多個字符捆綁在一起，當作一個整體進行處理分組括號中的模式匹配到的內容會被正則表達式引擎記錄于內部的變量中，這些變量的命名方式為: \1, \2, \3,

\1 :表示從左側起第一個左括號以及與之匹配右括號之間的模式所匹配到的字符

示例：$string1\+\(string2$*\)

\1?：string1\+(string2\)*

\2?：string2

后向引用：引用前面的分組括號中的模式所匹配字符，而非模式本身

三、正則表達式及grep的使用案例

1、顯示/proc/meminfo文件中以大小s開頭的行

SwapCached:?????????? 12 kB

SwapTotal:?????? 2097148 kB

或者grep -E “^(s|S)” /proc/meminfo

grep “^[Ss]”? /proc/meminfo

2、顯示/etc/passwd文件中不以/bin/bash結尾的行

3、顯示用戶lp默認的shell程序

或者cat /etc/passwd | grep “\<lp\>” | cut -d”:” -f7

4、找出/etc/passwd中的兩位或三位數

或者：cat /etc/passwd | grep -o “\<[0-9]\{2,3\}\>”

5、顯示CentOS7的/etc/grub2.cfg文件中，至少以一個空白字符開頭的且后面存非空白字符的行

6、找出“netstat -tan”命令的結果中以‘LISTEN’后跟任意多個空白字符結尾的行

7、顯示CentOS7上所有系統用戶的用戶名和UID

8、找出/etc/passwd用戶名同shell名的行

或者 grep “^$[[:alnum:]]\+$:.*\1$” /etc/passwd

9、利用df和grep，取出磁盤各分區利用率，并從大到小排序

四、egrep及擴展正則表達式及使用案例

1、egrep的正則表達式及元字符