文本處理三劍客
grep:文本過濾
grep,egrep(支持擴展正則表達式),fgrep(不支持正則表達式)
grep ?需要查找的字符串 查找的目標文件
-v #取反
-i #忽略大小寫
-n #顯示目標字符串的行號
-c #顯示匹配到的次數
-p #靜默模式
-o #僅顯示匹配到的字符串
-A# #顯示包含關鍵字的后續幾行
-B# #顯示包含關鍵字的前幾行
-C# #顯示包含關鍵字的前后幾行
-e #實現多個選項間的邏輯or關系(或)
-w #匹配整個單詞
-E #匹配擴展正則表達式,等價于egrep
-F #不支持正則表達式,等價于fgrep
nmap -v -sP 172.20.0.0/16 #查看該網段中開機的機器有幾個
正則表達式:
REGEXP:由一類特殊字符及文本字符所編寫的模式,其中有些字符(元字符)
不表示字符字面意義,而表示控制或通配的功能
基本正則表達式:BRE
擴展正則表達式:ERE
程序支持:grep、sed、awk、vim、less、nginx等
元字符分類:
字符匹配
. 匹配任意單個字符
[] 匹配指定范圍內的任意單個字符
[^] 匹配指定范圍外的任意單個字符
[:alnum:] 字母和數字
[:alpha:] 代表任何英文大小寫字符,亦即 A-Z, a-z
[:lower:] 小寫字母 [:upper:] 大寫字母
[:blank:] 空白字符(空格和制表符)
[:space:] 水平和垂直的空白字符(比[:blank:]包含的范圍廣)
[:cntrl:] 不可打印的控制字符(退格、刪除、警鈴…)
[:digit:] 十進制數字 [:xdigit:]十六進制數字
[:graph:] 可打印的非空白字符
[:print:] 可打印字符
[:punct:] 標點符號
匹配次數
*:匹配前面的字符任意次數;貪婪模式
例:grep “x*y”
.*:任意長度的任意字符;
\?:匹配其前面的字符0或1次;即前面的可有可無
\+:匹配其前面的字符至少1次;
\{m\}:匹配前面的字符m次;
\{m,n\};匹配前面的字符至少m次,至多n次;
\{0,n\}:匹配前面的字符至多n次;
\{m,\}:匹配前面的字符至少m次;
寫正則表達式最好用引號引起來
位置錨定
^:行首錨定:用于模式的最左側;
$:行尾錨定:用于模式的最右行;
^PATTERN$:用于模式整行;
^$:空行;
\<或\b:詞首錨定:用于單詞模式的左側;
\>或\b:詞尾錨定:用于單詞模式的右側;
\<PATTERN\>:匹配整個單詞;
分組
\(\);將一個或多個字符捆綁在一起當做一個整體進行處理;
例: \(xy\)*ab
Note: 分組括號中的模式匹配到的內容會被正則表達式引擎記錄與內部的變量中,這些變量的命名方式為:\1,\2,\3…
\1: 從左側起,第一個左括號以及與之匹配右括號之間的模式所匹配到的字符;
\(ab\+\(xy\)*\):
\1:ab\+\(xy\)*
\2;xy
后向引用:引用前面的分組括號中的模式所匹配字符,(而非模式本身)
egrep及擴展的正則表達式
egrep = grep -E #匹配擴展正則的元字符
字符匹配:
.任意單個字符
[]指定范圍的字符
[^]不在指定范圍的字符
擴展正則表達式
次數匹配:
*:匹配前面字符任意次
?: 0或1次
+:1次或多次
{m}:匹配m次
{m,n}:至少m,至多n次
位置錨定:
^ :行首
$ :行尾
\<, \b :語首
\>, \b :語尾
分組:
()
后向引用:\1, \2, …
或者:
a|b: a或b
C|cat: C或cat
(C|c)at:Cat或cat
本文來自投稿,不代表Linux運維部落立場,如若轉載,請注明出處:http://www.www58058.com/95056