文本處理grep

grep:文本過濾(模式:pattern)工具grep, egrep, fgrep【適合處理比較大的文本】(不支持正則表達式搜索) sed:stream editor,文本編輯工具 awk:Linux上的實現gawk,文本報告生成器

grep(Global search 全局搜索 Regular expression 正則表達式 and Print out the line打印行):支持正則表達式 作用:文本搜索工具,根據用戶指定的“模式”對目標文本逐行進行匹配檢查;打印匹配到的行 模式:由正則表達式字符及文本字符所編寫的過濾條件

grep [OPTIONS] PATTERN(正則表達式) [FILE…]

grep root /etc/passwd grep “$USER” 

/etc/passwd grep ‘$USER’ 

/etc/passwd grep whoami /etc/passwd

命令選項:

–color=auto: 對匹配到的文本著色顯示

-v: 顯示不被pattern匹配到的行 (顯示不包含關鍵字得行) -i: 忽略字符大小寫

-n:顯示匹配的行號(與cat –n file|grep root的功能相符)

-c: 統計匹配的行數

-o: 僅顯示匹配到的字符串(通常用來與正則表達式的表達式來進行匹配)     

-q: 靜默模式,不輸出任何信息(與 grep root p &> /dev/null相同)

 -A #: after, 后#行(顯示匹配到的行和其后#行)

-B #: before, 前#行(顯示匹配到的行和其前#行)

-C #:context, 前后各#行(顯示匹配到的前后各#行)

-e:實現多個選項間的邏輯or關系grep –e ‘cat ’ -e ‘dog’ file

-w:匹配整個單詞(帶有整個單詞的行)

-E:使用ERE(擴展的正則表達式 與egrep) -F:相當于fgrep,不支持

            擴展:利用grep來取IP Ifconfig eth0 |grep mask |cut -d: -f 2| cut -d “ ” –f1 正則表達式 REGEXP:由一類特殊字符及文本字符所編寫的模式,其中有些字符(元字符)不表示字符字面意義,而表示控制或通配的功能

程序支持:grep, vim, less,nginx等

    分兩類: 基本正則表達式:BRE (B=basic 基本的) 擴展正則表達式:ERE (E=extend 擴展的) grep -E, egrep 正則表達式引擎: 采用不同算法,檢查處理正則表達式的軟件模塊PCRE(Perl Compatible Regular Expressions)

元字符分類:字符匹配、匹配次數、位置錨定、分組

man 7 regex(查看其幫助說明)

基本正則表達式元字符:

字符匹配:

. 匹配任意單個字符

[] 匹配指定范圍內的任意單個字符

 [^] 匹配指定范圍外的任意單個字符

 [:alnum:] 字母和數字 

[:alpha:] 代表任何英文大小寫字符,亦即A-Z, a-z

 [:lower:] 小寫字母[:upper:] 大寫字母

 [:blank:] 空白字符(空格和制表符)

 [:space:]水平和垂直的空白字符(比[:blank:]包含的范圍廣)

 [:cntrl:] 不可打印的控制字符(退格、刪除、警鈴…)

 [:digit:] 十進制數字           [:xdigit:]十六進制數字

 [:graph:] 可打印的非空白字符 

[:print:] 可打印字符

 [:punct:] 標點符號

匹配次數:用在要指定次數的字符后面,用于指定前面的字符要出現的次數

  • 匹配前面的字符任意次,包括0次

貪婪模式:盡可能長的匹配(懶惰模式為當尋找到相應的條件時將終止操作 ) .*任意長度的任意字符

\?匹配其前面的字符0或1次

+匹配其前面的字符至少1次

{n}匹配前面的字符n次

{m,n}匹配前面的字符至少m次,至多n次 {,n}匹配前面的字符至多n次

{n,}匹配前面的字符至少n次

位置錨定:定位出現的位置

^ 行首錨定,用于模式的最左側

$ 行尾錨定,用于模式的最右側

^PATTERN$ 用于模式匹配整行 ^$ 空行 ^[[:space:]]*$ 空白行 \< 或\b詞首錨定,用于單詞模式的左側 > 或\b詞尾錨定;用于單詞模式的右側 \匹配整個單詞 擴展: 單詞邊界:除了字母,數字,下劃線

分組:() 將一個或多個字符捆綁在一起,當作一個整體進行處理,如:(root)+

分組括號中的模式匹配到的內容會被正則表達式引擎記錄于內部的變量中,這些變量的命名方式為: \1, \2, \3, …

\1表示從左側起第一個左括號以及與之匹配右括號之間的模式所匹配到的字符

示例:(string1+(string2)) \1 :string1+(string2) \2 :string2

后向引用:引用前面的分組括號中的模式所匹配字符,而非模式本身

egrep及擴展的正則表達式: egrep= grep –E

egrep[OPTIONS] PATTERN [FILE…]

擴展正則表達式的元字符:

字符匹配:

. 任意單個字符 [] 指定范圍的字符 [^] 不在指定范圍的字符

次數匹配:

*:匹配前面字符任意次 ?: 0或1次 +:1次或多次 {m}:匹配m次 {m,n}:至少m,至多n次

位置錨定:

^ :行首 $ :行尾 \<, \b :語首 >, \b :語尾

分組:

() 后向引用:\1, \2, …

或者:

a|b: a或b C|cat: C或cat (C|c)at:Cat或cat

原創文章,作者:GYF,如若轉載,請注明出處:http://www.www58058.com/75147

(0)
GYFGYF
上一篇 2017-05-09 22:21
下一篇 2017-05-09 22:47

相關推薦

  • Nginx淺談(一)

    淺談nginx(一) 此文主要介紹nginx的基礎知識及其基本配置,一為鞏固,二為記錄 知識點: nginx的作用 nginx的基本配置框架 nginx一些常用模塊介紹 1、什么是nginx     nginx是一款免費的,開源的,高性能的HTTP服務軟件,它不僅能     夠支…

    Linux干貨 2017-01-15
  • N24期linux之學習宣言

        學習linux時間已經過去了一周之余,每天下班后拖著疲憊的身體回家。雖然很累,但也覺得這次選擇很值得,但愿以后自己發展的會越來越好!     我的學習宣言是:     刻苦學習,努力超越自己。     明天的我一定會感謝今天努力的自己!     努力 …

    Linux干貨 2016-10-29
  • 網絡管理

    網絡管理 本章內容 網絡概念 OSI模型 網絡設備 TCP/IP IP地址 配置網絡 實現網絡組 測試網絡 網絡工具 為linux網卡配置ip地址,不是給網卡配置地址,是給內核的網絡功能配置,地址是屬于內核。為內核配置即時生效,修改配置文件,是永久生效。ifconfig 配置信息,會立即生效,但是重啟網絡服務或主機,都失效。網絡服務/etc/init.d/n…

    Linux干貨 2016-09-05
  • 掛載

    掛載的相關介紹

    Linux干貨 2017-12-10
  • N25-第二周博客作業

    第二周博客作業 1.Linux上的文件管理類命令都有哪些,其常用的使用方法和演示 2.bash的工作特性之命令執行狀態返回值和命令行展開所涉及內容演示及其實例 3.請使用命令行展開功能完成以下練習;    (1)創建/tmp的目錄下a_c,a_d,b_c,b_d     (2) 創建/tmp/mylinux目錄下的 4…

    Linux干貨 2016-12-11
  • LVS詳解

    LVS詳解 LVS(Linux Virtual Server),意即Linux虛擬服務器,是一個虛擬的服務器集群系統。本項目在1998年5月由章文嵩博士成立,是中國國內最早出現的自由軟件項目之一。 LVS 是一個工作在四層的負載均衡器,實現和 iptables/netfilter 類似,工作在內核空間的 TCP/IP 協議棧上,LVS 工作在 INPUT H…

    Linux干貨 2016-11-11
欧美性久久久久