文本處理工具

文本處理工具

文件查看命令:cat  cat [OPTION]… [FILE]… 

-E: 顯示行結束符$ 

-n: 對顯示出的每一行進行編號 

-A:顯示所有控制符 

-b:非空行編號 

-s:壓縮連續的空行成一行

[root@centous1 soft]# echo "1 2 3 4 5 6" >> f1
[root@centous1 soft]# cat f1
1 2 3 4 5 6

more: 分頁查看文件 more [OPTIONS…] FILE… 

-d: 顯示翻頁及退出提示 

less:一頁一頁地查看文件或STDIN輸出 查看時有用的命令包括: /文本 搜索 文本 

n/N 跳到下一個 或 上一個匹配 

less 命令是man命令使用的分頁器

注;平時的用法就是,cat FILE | more/less

head head [OPTION]… [FILE]… 

-c #: 指定獲取前#字節 

-n #: 指定獲取前#行 

-#: 指定行數 ?

tail tail [OPTION]… [FILE]… 

-c #: 指定獲取后#字節 

-n #: 指定獲取后#行 

-#:指定行數

-f: 跟蹤顯示文件新追加的內容,常用日志監控

[root@centous1 soft]# cat f1
1 2 3 4
1 2 3 4 5
1 2 3 4 5 6
1 2 3 4 5 6 7
1 2 3 4 5 6 7 8
1 2 3 4 5 6 7 8 9
[root@centous1 soft]# cat f1 | head -n 3
1 2 3 4
1 2 3 4 5
1 2 3 4 5 6
[root@centous1 soft]# cat f1 | tail -n 3
1 2 3 4 5 6 7
1 2 3 4 5 6 7 8
1 2 3 4 5 6 7 8 9
[root@centous1 soft]# cat f1 | head -n 4 | tail -n 1
1 2 3 4 5 6 7

cut [OPTION]… [FILE]… 

-d DELIMITER: 指明分隔符,默認tab -f FILEDS: 

#: 第#個字段 #,#[,#]:離散的多個字段,例如1,3,6 #-#:連續的多個字段, 例如1-6 混合使用:1-3,7 

-c 按字符切割 –output-delimiter=STRING指定輸出分隔符

[root@centous1 soft]# cat f1 | cut -d " " -f 1
1
1
1
1
1
1
[root@centous1 soft]# cat f1 | cut -d " " -f 1,4,7
1 4
1 4
1 4
1 4 7
1 4 7
1 4 7

注;這里的意思是,cut -d 以空格為分隔符進行切割,-f則是顯示第幾行,以逗號隔開

wc 計數單詞總數、行總數、字節總數和字符總數 ?可以對文件或STDIN中的數據運行 

使用 -l 來只計數行數 ?

使用 -w 來只計數單詞總數 ?

使用 -c 來只計數字節總數 ?

使用 -m 來只計數字符總數

[root@centous1 soft]# cat f1
1 2 3 4
1 2 3 4 5
1 2 3 4 5 6
1 2 3 4 5 6 7
1 2 3 4 5 6 7 8
1 2 3 4 5 6 7 8 9
[root@centous1 soft]# wc -l f1
6 f1
[root@centous1 soft]# wc -w f1
39 f1
[root@centous1 soft]# wc -m f1
79 f1
[root@centous1 soft]# wc -c f1
79 f1

sort [options] file(s) ?

常用選項 ? 

-r 執行反方向(由上至下)整理 ?

-n 執行按數字大小整理 ? 

-f 選項忽略(fold)字符串中的字符大小寫 ? 

-u 選項(獨特,unique)刪除輸出中的重復行 ? 

-t  c 選項使用c做為字段界定符 ? 

-k  X 選項按照使用c字符分隔的X列來整理能夠使用多次

[root@centous1 soft]# cat f1 | sort -r
1 2 3 4 5 6 7 8 9
1 2 3 4 5 6 7 8
1 2 3 4 5 6 7
1 2 3 4 5 6
1 2 3 4 5
1 2 3 4
[root@centous1 soft]# cat f1 | sort -n
1 2 3 4
1 2 3 4 5
1 2 3 4 5 6
1 2 3 4 5 6 7
1 2 3 4 5 6 7 8
1 2 3 4 5 6 7 8 9
[root@centous1 soft]# echo "1 2 3 4" >> f1
[root@centous1 soft]# cat f1
1 2 3 4
1 2 3 4 5
1 2 3 4 5 6
1 2 3 4 5 6 7
1 2 3 4 5 6 7 8
1 2 3 4 5 6 7 8 9
1 2 3 4
[root@centous1 soft]# sort -u f1
1 2 3 4
1 2 3 4 5
1 2 3 4 5 6
1 2 3 4 5 6 7
1 2 3 4 5 6 7 8
1 2 3 4 5 6 7 8 9
[root@centous1 soft]# cat /etc/passwd | sort -t ":" -k 3n | tail -n 10
abrt:x:173:173::/etc/abrt:/sbin/nologin
saslauth:x:499:76:Saslauthd user:/var/empty/saslauth:/sbin/nologin
zabbix:x:500:500::/home/zabbix:/bin/bash
testuser:x:4321:0::/home/test:/bin/csh
text:x:4322:4322::/home/text:/bin/bash
user1:x:4323:4323::/home/user1:/bin/bash
user2:x:4324:4324::/home/user2:/bin/bash
testbash:x:4326:4326::/home/testbash:/bin/bash
basher:x:4327:4327::/home/basher:/bin/bash
nfsnobody:x:65534:65534:Anonymous NFS User:/var/lib/nfs:/sbin/nologin

uniq命令:從輸入中刪除重復的前后相接的行 ?

uniq [OPTION]… [FILE]… 

-c: 顯示每行重復出現的次數 

-d: 僅顯示重復過的行 

-u: 僅顯示不曾重復的行 連續且完全相同方為重復 ? 

常和sort 命令一起配合使用: sort  userlist.txt  |  uniq -c

列:

統計當前連接本機的每個遠程主機IP的連接數,并按從大 到小排序

netstat -nt | tr -s " " ";" | cut -d ";" -f5 | uniq -c | sort -n | head -n -2

diff

?比較兩個文件之間的區別 $ diff foo.conf-broken foo.conf-works 

5c5

 < use_widgets = no — >

 use_widgets = yes 

?注明第5行有區別(改變)

diff 命令的輸出被保存在一種叫做“補丁”的文件中 ? 

使用 -u 選項來輸出“統一的(unified)”diff格式文 件,最適用于補丁文件

原創文章,作者:forest,如若轉載,請注明出處:http://www.www58058.com/30467

(0)
forestforest
上一篇 2016-08-08 16:16
下一篇 2016-08-08 16:16

相關推薦

  • 20160801作業-用戶和組

    http://note.youdao.com/yws/public/redirect/share?id=ba6a68550cd5c0ba5fd1cbfb66651916&type=false

    Linux干貨 2016-08-08
  • 上海2016全球運維大會 美女辣妹吸引眼球!

    國內第一個運維行業大會 GOPS 2016全球運維大會(上海站)在2016年9月23-24日在上海雅悅新天地大酒店舉辦,面向IT及傳統行業、廣大運維技術人員,傳播先進技術思想和理念,分享業內最佳實踐。 參會兩日,雖然大會主角是運維技術交流學習,不過卻意料之外的邂逅了另一道靚麗的風景,瞬間燃了… 在會場,站立著一群高挑美女,我的…

    2016-12-05
  • AWK

    GNU awk 全稱:Aho,Weiberger,Kernighan,是三個作者的名字,所以簡稱為awk awk:報告生成器,主要用來格式化文本輸出的,它能夠實現在處理文本文件時對文檔中的字段有條件的顯示,而且將顯示的結果用非常美觀的文本形式給予輸出。我們所用的awk其實就是gawk,他是一個符號鏈接指向gawk的。 gawk – pattern…

    Linux干貨 2016-09-23
  • 條件選擇if 條件判斷case 文件查找 find locate 以及壓縮和解壓縮工具

    1 shell腳本編程之 條件選擇if 條件判斷case  2 文件查找 find locate 以及壓縮和解壓縮工具 過程式編程語言:  順序執行  選擇執行  循環執行 條件選擇之 if語句 選擇執行: ?  注意:if語句可嵌套 ?   單分支 if 判斷條件:then 條件為真的分…

    Linux干貨 2016-08-15
  • Java中的CopyOnWrite容器

    Copy-On-Write簡稱COW,是一種用于程序設計中的優化策略。其基本思路是,從一開始大家都在共享同一個內容,當某個人想要修改這個內容的時候,才會真正把內容Copy出去形成一個新的內容然后再改,這是一種延時懶惰策略。從JDK1.5開始Java并發包里提供了兩個使用CopyOnWrite機制實現的并發容器,它們是CopyOnWriteArrayList和…

    Linux干貨 2016-08-15
  • N22-妙手 第4天視頻課程練習

    一、Globbing文件名通配練習 練習1:顯示/var目錄下所有以l開頭,以一個小寫字母結尾,且中間出現任意一位字符的目錄 [root@localhost ~]# ls -d /var/l?[[:lower:]] /var/lib  /var/log 練習2:顯示/etc目錄下,以任意一位數字開頭…

    Linux干貨 2016-08-22
欧美性久久久久