GNU awk

kang ? 2015-12-03 16:52 ? Linux干貨

文本處理三工具：grep, sed, awk

grep, egrep, fgrep：文本過濾工具；pattern

sed: 行編輯器

模式空間、保持空間

awk：報告生成器，格式化文本輸出；

AWK: Aho, Weinberger, Kernighan –> New AWK, NAWK

GNU awk, gawk

gawk – pattern scanning and processing language

基本用法：gawk [options] ‘program’ FILE …

program: PATTERN{ACTION STATEMENTS}

語句之間用分號分隔

print, printf

選項：

-F：指明輸入時用到的字段分隔符；

-v var=value: 自定義變量；

1、print

print item1, item2, …

要點：

(1) 逗號分隔符；

(2) 輸出的各item可以字符串，也可以是數值；當前記錄的字段、變量或awk的表達式；

(3) 如省略item，相當于print $0;

例一：顯示文件倒數5行，顯示第2，4，個字符

[root@MiWiFi-R3L-srv ~]# tail -5 /etc/fstab | awk '{print $2,$4}'

例二：省略item顯示整行

[root@MiWiFi-R3L-srv ~]# tail -5 /etc/fstab | awk '{print}'
/dev/mapper/VolGroup-lv_swap swap                    swap    defaults        0 0
tmpfs                   /dev/shm                tmpfs   defaults        0 0
devpts                  /dev/pts                devpts  gid=5,mode=620  0 0

2、變量

2.1 內建變量

FS：input field seperator，默認為空白字符；

例一：定義FS變量為：

[root@MiWiFi-R3L-srv ~]# awk -v FS=':' '{print $1}' /etc/passwd

OFS：output field seperator，默認為空白字符；

例一：定義變量

[root@MiWiFi-R3L-srv ~]# awk -v FS=':' -v OFS=':' '{print $1,$3,$7}' /etc/passwd

RS：input record seperator，輸入時的換行符；

ORS：output record seperator，輸出時的換行符；

NF：number of field，字段數量

{print NF}, {print $NF}

例一：查看字符個數

[root@MiWiFi-R3L-srv ~]# awk '{print NF}' /etc/fstab

NR：number of record, 行數；

例一：顯示行數

[root@MiWiFi-R3L-srv ~]# awk '{print NR}' /etc/fstab
1
2
3
4

FNR：各文件分別計數；行數；

FILENAME：當前文件名；

例一：顯示當前文件名

[root@localhost ~]# awk '{print FILENAME}' /etc/fstab
/etc/fstab
/etc/fstab

ARGC：命令行參數的個數；

[root@localhost ~]# awk '{print ARGC}' /etc/fstab

ARGV：數組，保存的是命令行所給定的各參數；

2.2 自定義變量

(1) -v var=value

變量名區分字符大小寫；

例一： -v定義變量

[root@localhost ~]# awk -v test='hello gawk' '{print test}' /etc/fstab
hello gawk
hello gawk

(2) 在program中直接定義

[root@localhost ~]# awk 'BEGIN{test="hello gawk ";print test}'
hello gawk

3、printf命令

格式化輸出：printf FORMAT, item1, item2, …

(1) FORMAT必須給出;

(2) 不會自動換行，需要顯式給出換行控制符，\n

(3) FORMAT中需要分別為后面的每個item指定一個格式化符號；

格式符：

%c: 顯示字符的ASCII碼；

%d, %i: 顯示十進制整數；

%e, %E: 科學計數法數值顯示；

%f：顯示為浮點數；

%g, %G：以科學計數法或浮點形式顯示數值；

%s：顯示字符串；

%u：無符號整數；

%%: 顯示%自身；

例一：顯示每一行命令的第一個字符，以字符串顯示

[root@localhost ~]# awk -F: '{printf "%s",$1}' /etc/passwd

例二：顯示每一行命令的用戶名

[root@localhost ~]# awk -F: '{printf "Username: %s\n",$1}' /etc/passwd

修飾符：

#[.#]：第一個數字控制顯示的寬度；第二個#表示小數點后的精度；

%3.1f

-: 左對齊

+：顯示數值的符號

例一：顯示控制寬度15

[root@localhost ~]# awk -F: '{printf "Username: %s\n",$1}' /etc/passwd

4、操作符

算術操作符：

x+y, x-y, x*y, x/y, x^y, x%y

-x

+x: 轉換為數值；

字符串操作符：沒有符號的操作符，字符串連接

賦值操作符：

=, +=, -=, *=, /=, %=, ^=

++, —

比較操作符：

>, >=, <, <=, !=, ==

模式匹配符：

~：是否匹配

!~：是否不匹配

邏輯操作符：

&&

||

!

函數調用：

function_name(argu1, argu2, …)

條件表達式：

selector?if-true-expression:if-false-expression

例一：條件表達式

[root@localhost ~]# awk -F: '{$3>=1000?usertype="Common User":usertype="Sysadmin or SysUser";printf "%15s:%-s\n",$1,usertype}' /etc/passwd

5、PATTERN

(1) empty：空模式，匹配每一行；

(2) /regular expression/：僅處理能夠被此處的模式匹配到的行；

regular expression 正責表達式

例一：輸出能匹配的行

[root@localhost ~]# awk  '/^UUID/{print $1}' /etc/fstab

(3) relational expression: 關系表達式；結果有“真”有“假”；結果為“真”才會被處理；

真：結果為非0值，非空字符串；

例一：為“真”才處理

[root@localhost ~]# awk -F: '$3>=1000 {print $1,$3}' /etc/passwd
nfsnobody 65534

(4) line ranges：行范圍，

startline,endline：/pat1/,/pat2/

例一：以h開關u結局的字符

[root@localhost ~]# awk -F: '/^h/,/^u/{print $1}' /etc/passwd

例一：大于等于2行小于等于10行

[root@localhost ~]# awk -F: '(NR>=2&&NR<=10){print $1}' /etc/passwd

注意：不支持直接給出數字的格式

~]# awk -F: ‘(NR>=2&&NR<=10){print $1}’ /etc/passwd

(5) BEGIN/END模式

BEGIN{}: 僅在開始處理文件中的文本之前執行一次；

END{}：僅在文本處理完成之后執行一次；

6、常用的action

(1) Expressions

(2) Control statements：if, while等；

(3) Compound statements：組合語句；

(4) input statements

(5) output statements

7、控制語句

if(condition) {statments}

if(condition) {statments} else {statements}

while(conditon) {statments}

do {statements} while(condition)

for(expr1;expr2;expr3) {statements}

break

continue

delete array[index]

delete array

exit

{ statements }

7.1 if-else

語法：if(condition) statement [else statement]

例一：查看大等于100的用戶名稱

[root@localhost ~]# awk -F: '{if ($3>=100) {printf "Common user: %s\n",$1} else {printf "root or Sysuser: %s\n",$1}}' /etc/passwd
root or Sysuser: root
root or Sysuser: bin
root or Sysuser: daemon
root or Sysuser: adm
root or Sysuser: lp

例二：if語句判斷

[root@localhost ~]# awk -F: '{if ($3>=100) print $1,$3}' /etc/passwd

例三：顯示字符數大于5個的

[root@localhost ~]# awk -F: '{if ($NF>5) print $0}' /etc/fstab
UUID=d928b19c-a5b3-4b6d-918c-2952b6353c69 /boot                   ext4    defaults        1 2
tmpfs                   /dev/shm                tmpfs   defaults        0 0
devpts                  /dev/pts                devpts  gid=5,mode=620  0 0

使用場景：對awk取得的整行或某個字段做條件判斷；

7.2 while循環

語法：while(condition) statement

條件“真”，進入循環；條件“假”，退出循環；

使用場景：對一行內的多個字段逐一類似處理時使用；對數組中的各元素逐一處理時使用；

例一：while循環顯示每一行個數

[root@localhost ~]# awk '/^[[:space:]]*kernel/{i=1;while(i<=NF) {print $i,length($i); i++}}' /etc/grub.conf
kernel 6
/vmlinuz-2.6.32-71.el6.x86_64 29
ro 2
root=/dev/mapper/VolGroup-lv_root 33
rd_LVM_LV=VolGroup/lv_root 26
rd_LVM_LV=VolGroup/lv_swap 26

~]# awk ‘/^[[:space:]]*linux16/{i=1;while(i<=NF) {print $i,length($i); i++}}’ /etc/grub2.cfg

~]# awk ‘/^[[:space:]]*linux16/{i=1;while(i<=NF) {if(length($i)>=7) {print $i,length($i)}; i++}}’ /etc/grub2.cfg

7.3 do-while循環

語法：do statement while(condition)

意義：至少執行一次循環體

7.4 for循環

語法：for(expr1;expr2;expr3) statement

for(variable assignment;condition;iteration process) {for-body}

例一：歷用for循環顯示個行的字符數

[root@localhost ~]# awk '/^[[:space:]]*kernel/{for(i=1;i<=NF;i++) {print $i,length($i)}}' /etc/grub.conf
kernel 6
/vmlinuz-2.6.32-71.el6.x86_64 29
ro 2
root=/dev/mapper/VolGroup-lv_root 33

特殊用法：

能夠遍歷數組中的元素；

語法：for(var in array) {for-body}

7.5 switch語句

語法：switch(expression) {case VALUE1 or /REGEXP/: statement; case VALUE2 or /REGEXP2/: statement; …; default: statement}

7.6 break和continue

break [n]

continue

7.7 next

提前結束對本行的處理而直接進入下一行；

例一：不符合條件就直接進入下一行

~]# awk -F: '{if($3%2!=0) next; print $1,$3}' /etc/passwd

8、array

關聯數組：array[index-expression]

index-expression:

(1) 可使用任意字符串；字符串要使用雙引號；

(2) 如果某數組元素事先不存在，在引用時，awk會自動創建此元素，并將其值初始化為“空串”；

若要判斷數組中是否存在某元素，要使用“index in array”格式進行；

weekdays[mon]=”Monday”

若要遍歷數組中的每個元素，要使用for循環；

for(var in array) {for-body}

~]# awk ‘BEGIN{weekdays[“mon”]=”Monday”;weekdays[“tue”]=”Tuesday”;for(i in weekdays) {print weekdays[i]}}’

注意：var會遍歷array的每個索引；

state[“LISTEN”]++

state[“ESTABLISHED”]++

~]# netstat -tan | awk ‘/^tcp\>/{state[$NF]++}END{for(i in state) { print i,state[i]}}’

~]# awk ‘{ip[$1]++}END{for(i in ip) {print i,ip[i]}}’ /var/log/httpd/access_log

練習1：統計/etc/fstab文件中每個文件系統類型出現的次數；

[root@localhost ~]# awk '/^UUID/{fs[$3]++}END{for(i in fs){print i,fs[i]}}' /etc/fstab
ext4 1

9、函數

9.1 內置函數

數值處理：

rand()：返回0和1之間一個隨機數；

字符串處理：

length([s])：返回指定字符串的長度；

sub(r,s,[t])：以r表示的模式來查找t所表示的字符中的匹配的內容，并將其第一次出現替換為s所表示的內容；

gsub(r,s,[t])：以r表示的模式來查找t所表示的字符中的匹配的內容，并將其所有出現均替換為s所表示的內容；

split(s,a[,r])：以r為分隔符切割字符s，并將切割后的結果保存至a所表示的數組中；

~]# netstat -tan | awk ‘/^tcp\>/{split($5,ip,”:”);count[ip[1]]++}END{for (i in count) {print i,count[i]}}’

9.2 自定義函數

《sed和awk》

原創文章，作者：kang，如若轉載，請注明出處：http://www.www58058.com/77632

贊 (0)

0

【招聘】天津/贊普科技股份有限公司/Linux系統運維工程師/6-7k/五險一金

上一篇 2015-12-03 11:29

Linux下的LVM管理命令

下一篇 2015-12-06 20:23

純文本配置還是注冊表

我們知道Unix/Linux下的程序配置文件從來都是純文本的，你可以自由地修改和查看，他們也沒有什么什么XML之類的玩意（參看XML的這兩篇文章：一，二），這個最重要的Unix文化（參看Unix傳奇下篇）40多年來就這么沿續下來了。我很佩服Microsoft的創新能力，一會兒用INI，一會兒用注冊表，一會又是用XML，這就是Windows的編程中那“強大”的…

Linux干貨 2016-08-15
Linux干貨

linux 網絡管理命令 SS的使用詳則

SS命令 ss命令用來顯示處于活動狀態的套接字信息，ss迷路可以用來獲取socket統計信息，它可以顯示和netstat類似的內容。但ss的優勢在于它能夠顯示更多更詳細的有關TCO和連接狀態信息，而且比netstat更快速更高效。當服務器的socket連接數量變得非常大時，無論是使用netest命令還是直接 cat/proc/net/tcp 。…

2017-08-19
B-樹和B+樹的應用：數據搜索和數據庫索引

B-樹 1 .B-樹定義 B-樹是一種平衡的多路查找樹，它在文件系統中很有用。定義：一棵m 階的B-樹，或者為空樹，或為滿足下列特性的m 叉樹：⑴樹中每個結點至多有m 棵子樹；⑵若根結點不是葉子結點，則至少有兩棵子樹； ⑶除根結點之外的所有非終端結點至少有[m/2] 棵子樹；⑷所有的非終端結點中包含以下信息數據： &nb…

Linux干貨 2015-07-30
Bash1

做語法測試，沒有消息就是最好的消息加權限單個語句的錯誤并不妨礙之后的語句，但是邏輯錯誤會導致后續語句執行不了 bash： -n：語法測試 -x:模擬單步執行變量類別：本地變量 &nbs…

Linux干貨 2016-09-17
包管理及源碼安裝Apache

一,概述 yum 倉庫的安裝在/etc/yum.repos.d/目錄下創建后綴名為repo的配置文件 [CentOS7] name= baseurl= gpgcheck= enabled= 配置文件基本包含的四個要求安裝及升級本地程序包： * localinstall rpmfile1 [rpmfile2] […] (用install替代) …

Linux干貨 2016-09-01
學習宣言

不妥協，不氣餒，朝著自己的目標前進。

Linux干貨 2016-10-24

欧美性久久久久