grep和正則表達式

grep

      作用:文本搜索工具,根據用戶指定的“模式(過濾條件)”對目標文件逐行進行匹配檢查;打印匹配到的行;

      模式:由正則表達式的元字符及文本所編寫出的過濾條件

   語法:【選項】【文件】

   參數:

    –color=auto 高亮顯示匹配到的字符串

         -v 反向匹配(即不顯示選項內的內容)

         -i 忽略大小寫

         -n 顯示的結果前增加行號

         -c 僅顯示匹配到結果的行數

         -o 僅顯示匹配到的字符串

         -q 靜默模式,不輸出任何信息

                  (或者 &>
/dev/null)

         -A# 顯示關鍵字行及向后#

         -B# 顯示關鍵字行及向前#

         -C# 顯示關鍵字向前#行,當前行,及向后#

         -e 關鍵字1 -e 關鍵字2  實現多個選項間的邏輯or關系

         -w 匹配整個單詞

         -E 使用擴展正則表達式 egrep

         -F 不使用正則表達式 fgrep

基本正則表達式元字符

作用:由一類特殊字符及文本字符所編寫的模式,其中有些字符不表示其字面意義,而是用于表示控制或通配的功能。

字符匹配:

        
          
 .   
匹配任意單個字符

                   [ ]   匹配指定范圍內的任意單個字符

      
         
  [^]   
匹配指定范圍外的任意單個字符

                   [:alnum:] [0-9a-zA-Z] 字母和數字

                   [:alpha:] [a-zA-Z]    所有大小寫字母

  [:upper:] [A-Z]       大寫字母

                   [:lower:] [a-z]       小寫字母

                   [:blank:] 空白字符(空格和制表符)

                   [:space:] 水平和垂直的空白字符(比[:blank:]包含的范圍廣)

                   [:cntrl:] 不可打印的控制字符(退格、刪除、警鈴

                   [:digit:] 十進制數字 [0-9]

                  [:xdigit:]十六進制數字

                  [:graph:] 可打印的非空白字符

                  [:print:] 可打印字符

                  [:punct:] 標點符號

匹配次數:

                  *  匹配前面的字符任意次,包括0

                 .* 任意長度的任意字符

                 \? 匹配其前面的字符01

                 \+ 匹配其前面的字符至少1

                 \{n\} 匹配前面的字符n

                 \{m,n\} 匹配前面的字符至少m次,最多n

                 \{,n\}  匹配前面的字符最多n

                 \{n,\}  匹配前面的字符至少n

位置錨定:定位出現的位置

                 ^  行首錨定,用于模式的最左側

        $  行尾錨定,用于模式的最右側

                ^PATTERN$ 用于模式匹配整行

                ^$  空行 

                ^[[:space:]]*$  空白行

                ^#  #開頭

                \<\b 詞首錨定,用于單詞模式的左側

        \>\b 詞尾錨定,用于單詞模式的右側

        \<PATTERN\> 匹配整個單詞

      分組:\(\) 將一個或多個字符捆綁在一起,當作一個整體進行處理,如:\(xy\)*ab表示xy這個整體可以被匹配任意次

      注意:分組括號中的模式匹配到的內容會被正則表達式引擎記錄于內部的變量中,這些變量的命名方式為: \1, \2, \3, …

              \1  表示從左側起第一個左括號以及與之匹配右括號之間的模式所匹配到的字符

              \2  表示從左側起第二個左括號以及與之匹配右括號之間的模式所匹配到的字符

   后向引用:引用前面的分組括號中的模式所匹配到的字符,而非模式本身。

 

實例:

1、  顯示/etc/passwd文件中不以/bin/bash結尾的行

  grep -v “/bin/bash$”
/etc/passwd
-v忽略匹配到的字符串)

grep和正則表達式

2、顯示/proc/meminfo文件中以大寫或小寫S開頭的行

此題有好幾種解法:

  grep  “^[Ss]”  /proc/meminfo “^[Ss]”表示匹配以大寫S或小寫s開頭的行)

  grep  -I  “^s”  /proc/meminfo -I 表示忽略大小寫)

  grep  -e ^s -e ^S  /proc/meminfo -e表示實現多個選項間的邏輯or關系)

  grep  “^s\|^S”  /proc/meminfo \|表示“或”)

grep和正則表達式

3、顯示用戶rpc默認的shell程序

       grep -w
“^rpc”   /etc/passwd  | cut -d : -f7
-w匹配整個單詞)

grep和正則表達式

4、找出“netstat -tan”命令的結果中以‘LISTEN’后跟任意多個空白字符結尾的行

   netstat -tan|grep
“\<LISTEN\>[[:space:]]*$”
*表示匹配前面的字符任意次)

grep和正則表達式

egrep

擴展正則表達式的元字符:

        字符匹配:

                  . 任意單個字符

                [ ] 指定范圍的字符

               [^] 不在指定范圍的字符

次數匹配:

                *:匹配前面字符任意次

                ?01

                +1次或多次

            {m}:匹配m

            {,n}:匹配至多n

 {m,n}:至少m,至多n

      位置錨定:

            ^ :行首

            $ :行尾

           \<, \b :語首

           \>,
\b
:語尾

 分組:

         ():用括號括起來表示要引用的內容,不需要轉義

           后向引用:\1,\2, \3…

  或者:

          a|b ab

        C|cat Ccat

       (C|c)atCatcat

實例:

1、  利用擴展正則表達式分別表示0-910-99、100-199、200-249、250-255

echo {0..300}|egrep -o “\<[0-9]\>”(行首錨定\<;行尾錨定\>

echo {0..300}|egrep -o “\<[1-9][0-9]\>”

echo {0..300}|egrep -o “\<1[0-9][0-9]\>”

echo {0..300}|egrep -o “\<2[0-4][0-9]\>”

echo {0..300}|egrep -o “\<25[0-5]\>”

grep和正則表達式

 

grep和正則表達式

因為中間顯示的數字較長,所以開頭和結尾為代表示意。

2、將此字符串:welcome to magedu linux 中的每個字符去重并排序,重復次數多的排到前面

echo “welcome to magedu linux”|grep -o . |sort|uniq -c
|sort –nr
. 表示匹配任意單個字符)

grep和正則表達式

3、使用egrep取出/etc/rc.d/init.d/functions中其基名

echo /etc/rc.d/init.d/functions |egrep -o “[^/]+/?$”

grep和正則表達式

fgrep:不支持正則表達式元字符

       當無需用到元字符去編寫模式時,使用fgrep更好

 

   今天要說的就這么多了,see you !

原創文章,作者:吼吼哈嘿,如若轉載,請注明出處:http://www.www58058.com/83681

(0)
吼吼哈嘿吼吼哈嘿
上一篇 2017-08-04 21:43
下一篇 2017-08-04 22:25

相關推薦

  • LVM 邏輯卷管理器

    1、什么是LVM:PV、PE、VG、LV的意義    LVM:Logical Volume Manager(邏輯卷管理器),可以將多個物理分區整合成看起來像一個磁盤一樣,并可隨意增加或減少邏輯卷大小 dm:device mapper,將一個或多個底層塊設備組織成一個邏輯設備的模塊; /dev/mapper/VG_NAME-LV_NAME …

    Linux干貨 2016-09-19
  • 信息論的熵

    1.  前言    熵的概念最早起源于物理學,用于度量一個熱力學系統的無序程度。    在信息論里則叫信息量,即熵是對不確定性的度量。從控制論的角度來看,應叫不確定性。信息論的創始人香農在其著作《通信的數學理論》中提出了建立在概率統計模型上的信息度量。他把信息定義為“用來消除不確定性的東西”。在信息世界,熵越…

    Linux干貨 2016-03-27
  • Keepalives+lvs實現高可用httpd的雙主模型

    基礎環境:Centos 7.3 最小化安裝四臺 關閉防火墻及selinux 簡單原理: keepalived是以VRRP協議為實現基礎的,VRRP全稱VirtualRouter Redundancy Protocol,即虛擬路由冗余協議。 虛擬路由冗余協議,可以認為是實現路由器高可用的協議,即將N臺提供相同功能的路由器組成一個路由器組,這個組里面有一個mas…

    2017-05-15
  • Linux yum客戶端的配置及yum命令

    一、什么是yum我們在Linux系統上安裝處理軟件,一般是使用RPM,它是通過預先編譯完成并且把軟件打包為RPM文件格式后,再加以安裝的一種方式,使用者只要拿到這個打包好的軟件,然后將里頭的文件放置到應該擺放的目錄,這樣就完成了安裝。但是,由于有些軟件是有依賴于其他軟件的,當你要安裝某個RPM類型的軟件時,RPM會檢驗RPM軟件數據庫,它所依賴的相關軟件包是…

    2017-06-11
  • echo顯示閃爍,screen用法及顯示時間的前后

    我們這門今天學習的一些主要內容 標準的命令的格式 命令(COMMAND)  [選項(OPTIONS)….[參數(ARGUMENTS…)] 選項:啟用或者關閉命令的某個或某些功能 參數:命令作用的對象,比如文件名,用戶名等 首先我們來統計一下學習到的linux的一些基礎的命令 who  查詢當前用戶 hostname 顯…

    Linux干貨 2016-08-04
  • Tomcat性能優化-2

    修改Connector運行模式 啟用NIO 或 APR bio介紹 bio(blocking I/O,阻塞式I/O操作),表示Tomcat使用的是傳統的Java I/O操作 默認模式,性能最差,沒有經過任何優化處理和支持 nio模式 nio(non-blocking I/O),Java SE 1.4…

    Linux干貨 2016-09-19
欧美性久久久久