Linux三劍客awk命令

1 .awk是一個強大的文本分析工具,相對于grep的查找,sed的編輯,awk在其對數據分析并生成報告時,顯得尤為強大。簡單來說awk就是把文件逐行的讀入,以空格為默認分隔符將每行切片,切開的部分再進行各種分析處理。 awk有3個不同版本: awk、nawk和gawk,未作特別說明,一般指gawk,gawk 是 AWK 的 GNU 版本。 awk其名稱得自于它的創始人 Alfred Aho 、Peter Weinberger 和 Brian Kernighan 姓氏的首個字母。實際上 AWK 的確擁有自己的語言: AWK 程序設計語言 , 三位創建者已將它正式定義為“樣式掃描和處理語言”。它允許您創建簡短的程序,這些程序讀取輸入文件、為數據排序、處理數據、對輸入執行計算以及生成報表,還有無數其他的功能。 2.

 awk '{pattern + action}' {filenames}

盡管操作可能會很復雜,但語法總是這樣,其中 pattern 表示 AWK 在數據中查找的內容,而 action 是在找到匹配內容時所執行的一系列命令?;ɡㄌ枺▄})不需要在程序中始終出現,但它們用于根據特定的模式對一系列指令進行分組。 pattern就是要表示的正則表達式,用斜杠括起來。 awk語言的最基本功能是在文件或者字符串中基于指定規則瀏覽和抽取信息,awk抽取信息后,才能進行其他文本操作。完整的awk腳本通常用來格式化文本文件中的信息。 通常,awk是以文件的一行為處理單位的。awk每接收文件的一行,然后執行相應的命令,來處理文本。 3.   有三種方式調用awk  

 3.1.命令行方式 awk [-F  field-separator] 'commands' input-file(s)
其中,commands 是真正awk命令,[-F域分隔符]是可選的。 input-file(s) 是待處理的文件。
在awk中,文件的每一行中,由域分隔符分開的每一項稱為一個域。通常,在不指名-F域分隔符的情況下,默認的域分隔符是空格。
 3.2.shell腳本方式
將所有的awk命令插入一個文件,并使awk程序可執行,然后awk命令解釋器作為腳本的首行,一遍通過鍵入腳本名稱來調用。
相當于shell腳本首行的:#!/bin/sh 可以換成:#!/bin/awk
 3.3.將所有的awk命令插入一個單獨文件,然后調用: awk -f awk-script-file input-file(s)
其中,-f選項加載awk-script-file中的awk腳本,input-file(s)跟上面的是一樣的。

 
  4. print 和 printf awk中同時提供了print和printf兩種打印輸出的函數。   其中print函數的參數可以是變量、數值或者字符串。字符串必須用雙引號引用,參數用逗號分隔。如果沒有逗號,參數就串聯在一起而無法區分。這里,逗號的作用與輸出文件的分隔符的作用是一樣的,只是后者是空格而已。 printf函數,其用法和c語言中printf基本相似,可以格式化字符串,輸出復雜時,printf更加好用,代碼更易懂。 5.循環 awk中的循環語句同樣借鑒于C語言,支持while、do/while、for、break、continue,這些關鍵字的語義和C語言中的語義完全相同。 6.數組 因為awk中數組的下標可以是數字和字母,數組的下標通常被稱為關鍵字(key)。值和關鍵字都存儲在內部的一張針對key/value應用hash的表格里。由于hash不是順序存儲,因此在顯示數組內容時會發現,它們并不是按照你預料的順序顯示出來的。數組和變量一樣,都是在使用時自動創建的,awk也同樣會自動判斷其存儲的是數字還是字符串。一般而言,awk中的數組用來從記錄中收集信息,可以用于計算總和、統計單詞以及跟蹤模板被匹配的次數等等。   顯示/etc/passwd的賬戶  

awk -F ':' 'BEGIN {count=0;} {name[count] = $1;count++;}; END{for (i = 0; i < NR; i++) print i, name[i]}' /etc/passwd 0 root 1 daemon 2 bin 3 sys 4 sync 5 games
......

7.列出一些常見的awk命令:
 

  1. #刪除temp文件的重復行
  2. awk ‘!($0 in array) { array[$0]; print }’ temp
  3. #查看最長使用的10個unix命令
  4. awk ‘{print $1}’ ~/.bash_history | sort | uniq -c | sort -rn | head -n 10
  5. #查看機器的ip列表
  6. ifconfig -a | awk ‘/Bcast/{print $2}’ | cut -c 5-19
  7. #查看機器的每個遠程鏈接機器的連接數
  8. netstat -antu | awk ‘$5 ~ /[0-9]:/{split($5, a, “:”); ips[a[1]]++} END {for (ip in ips) print ips[ip], ip | “sort -k1 -nr”}’
  9. #查看某個進程打開的socket數量
  10. ps aux | grep [process] | awk ‘{print $2}’ | xargs -I % ls /proc/%/fd | wc -l
  11. #查看無線網絡的ip
  12. sudo ifconfig wlan0 | grep inet | awk ‘NR==1 {print $2}’ | cut -c 6-
  13. #批量重命名文件
  14. find . -name ‘*.jpg’ | awk ‘BEGIN{ a=0 }{ printf “mv %s name%01d.jpg\n”, $0, a++ }’ | bash
  15. #查看某個用戶打開的文件句柄列表
  16. for x in `ps -u 500 u | grep java | awk ‘{ print $2 }’`;do ls /proc/$x/fd|wc -l;done
  17. #計算文件temp的第一列的值的和
  18. awk ‘{s+=$1}END{print s}’ temp
  19. #查看最常用的命令和使用次數
  20. history | awk ‘{if ($2 == “sudo”) a[$3]++; else a[$2]++}END{for(i in a){print a[i] ” ” i}}’ |  sort -rn | head
  21. #查找某個時間戳的文件列表
  22. cp -p `ls -l | awk ‘/Apr 14/ {print $NF}’` /usr/users/backup_dir
  23. #格式化輸出當前的進程信息
  24. ps -ef | awk -v OFS=“\n” ‘{ for (i=8;i<=NF;i++) line = (line ? line FS : “”) $i; print NR “:”, $1, $2, $7, line, “”; line = “” }’
  25. #查看輸入數據的特定位置的單個字符
  26. echo “abcdefg”|awk ‘BEGIN {FS=“””} {print $2}’
  27. #打印行號
  28. ls | awk ‘{print NR “\t” $0}’
  29. #打印當前的ssh 客戶端
  30. netstat -tn | awk ‘($4 ~ /:22\s*/) && ($6 ~ /^EST/) {print substr($5, 0, index($5,”:”))}’
  31. #打印文件第一列不同值的行
  32. awk ‘!array[$1]++’ file.txt
  33. #打印第二列唯一值
  34. awk ‘{ a[$2]++ } END { for (b in a) { print b } }’ file
  35. #查看系統所有分區
  36. awk ‘{if ($NF ~ “^[a-zA-Z].*[0-9]$” && $NF !~ “c[0-9]+d[0-9]+$” && $NF !~ “^loop.*”) print “/dev/”$NF}’  /proc/partitions
  37. #查看2到100所有質數
  38. for num in `seq 2 100`;do if [ `factor $num|awk ‘{print $2}’` == $num ];then echo -n “$num “;fi done;echo
  39. #查看第3到第6行
  40. awk ‘NR >= 3 && NR <= 6′ /path/to/file
  41. #逆序查看文件
  42. awk ‘{a[i++]=$0} END {for (j=i-1; j>=0;) print a[j–] }’
  43. #打印99乘法表
  44. seq 9 | sed ‘H;g’ | awk -v RS= ‘{for(i=1;i<=NF;i++)printf(“%dx%d=%d%s”, i, NR, i*NR, i==NR?”\n”:”\t”)}’

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

原創文章,作者:oranix,如若轉載,請注明出處:http://www.www58058.com/86407

(2)
oranixoranix
上一篇 2017-09-07 21:06
下一篇 2017-09-08 17:27

相關推薦

  • linux文件權限

    一、前言 在linux中,每個目錄或者文件都有相對應的權限,linux通過文件屬主(user),文件屬組(group),其它人(order)對一個文件或者目錄控制讀寫執行權限,當然在這些基本權限之外還有特殊權限,facl(file access control list)等。 二、文件基本權限    2.1:屬主、屬組、order概念 &…

    Linux干貨 2015-08-17
  • Cacti整合Zabbix監控

    前言: 由于公司現在很多業務都是使用cacti進行監控流量的,并且還有一些使用zabbix監控的項目,正好又有一個項目需要搭建Cacti+Zabbix進行綜合監控,搭建完畢之后發現,Cacti較之以前有了不小的改進,所以就來寫一寫Cacti和Zabbix監控整合的文章,順便說一下Cacti下的一些好用的插件。 環境: Centos 6.4 X86_64 Ca…

    Linux干貨 2015-03-19
  • yum命令的使用及磁盤管理中命令的使用方法(mkfs ,blkid,e2label等)

    yum      #cd /etc/yum.repos.d          #yum repolist(在 #cd下)其他命令在 #cd /etc/yum.repos.d運行          #yum-config-manag…

    2017-08-19
  • linux文件權限詳解

    基本命令 1.cut :?cat /etc/passwd | cut -d’:’ -f7| uniq -c| sort -nr 2.authconfig 修改加密方式 –passalgo=sha256 — update 3.scp 上傳文件 -r dir ip:path 傳目錄 file ip:path傳文件 …

    Linux干貨 2017-04-03
  • Python基礎—內置數據類型

    一、簡介              如果你用過C或者C++,你該知道你的許多工作集中在實現數據結構上面。你需要管理內存分配,部署內存結構等等。這些東西比較乏味,通常會讓你無法集中在真正想實現的目標上面。    …

    Linux干貨 2015-11-10
  • MAN 手冊各章節功能介紹及快捷鍵鍵位整理

    man手冊各章節功能介紹及快捷鍵鍵位整理 Linux系統提供了相對比較豐富的幫助手冊(man),man是manual的縮寫,是系統中提供相關條目參考信息的命令。 Ⅰ、man手冊分為多個section 使用手冊:壓縮格式的文件,有章節之分; 存儲位置/usr/share/man    man1,man2,man3,man4,man5,man…

    Linux干貨 2016-10-16

評論列表(2條)

  • eedsxb
    eedsxb 2017-09-08 19:52

    小胖子。

  • eedsxb
    eedsxb 2017-09-08 19:52

    有用!

欧美性久久久久