文本三劍客grep爵士與手下的血淚奮戰

文件查看命令： cat, tac,rev
cat [OPTION]… [FILE]…

-E: 顯示行結束符$
-n: 對顯示出的每一行進行編號
-A：顯示所有控制符
-b：非空行編號
-s：壓縮連續的空行成一行

文件查看

分頁查看文件內容
more: 分頁查看文件
more [OPTIONS…] FILE…
-d: 顯示翻頁及退出提示
less：一頁一頁地查看文件或STDIN輸出
查看時有用的命令包括：
/文本搜索文本
n/N 跳到下一個 or 上一個匹配

less 命令是man命令使用的分頁器

顯示文本前或后行內容
head
head [OPTION]… [FILE]…

-c #: 指定獲取前#字節
-n #: 指定獲取前#行
-#：指定行數

tail
tail [OPTION]… [FILE]…

-c #: 指定獲取后#字節
-n #: 指定獲取后#行
-#：
-f: 跟蹤顯示文件新追加的內容,常用日志監控

在后臺監控文件更新，使用命令：tail -0 file &
(&：是能讓程序在后臺運行的命令)

按列抽取文本cut和合并文件paste
cut [OPTION]… [FILE]…

-d DELIMITER: 指明分隔符，默認tab
-f FILEDS:
#: 第#個字段
#,#[,#]：離散的多個字段，例如1,3,6
#-#：連續的多個字段, 例如1-6
混合使用： 1-3,7
-c 按字符切割 –output-delimiter=STRING指定輸出分隔符

cut和paste
顯示文件或STDIN數據的指定列

cut -d: -f1 /etc/passwd
cat /etc/passwd | cut -d: -f7
cut -c2-5 /usr/share/dict/words

paste 合并兩個文件同行號的列到一行
paste [OPTION]… [FILE]…
-d 分隔符:指定分隔符，默認用TAB
-s : 所有行合成一行顯示
paste f1 f2
paste -s f1 f2

分析文本的工具

文本數據統計： wc
整理文本： sort
比較文件： diff和patch

收集文本統計數據wc

計數單詞總數、行總數、字節總數和字符總數
可以對文件或STDIN中的數據運行

行數字數字符數

使用 -l 來只計數行數
使用 -w 來只計數單詞總數
使用 -c 來只計數字節總數
使用 -m 來只計數字符總數

文本排序sort

把整理過的文本顯示在STDOUT，不改變原始文件
$ sort [options] file(s)
常用選項

-r 執行反方向（由上至下）整理
-n 執行按數字大小整理
-f 選項忽略（ fold）字符串中的字符大小寫
-u 選項（獨特， unique）刪除輸出中的重復行
-t c 選項使用c做為字段界定符
-k X 選項按照使用c字符分隔的X列來整理能夠使用多次

uniq

uniq命令：從輸入中刪除重復的前后相接的行
uniq [OPTION]… [FILE]…

-c: 顯示每行重復出現的次數；
-d: 僅顯示重復過的行；
-u: 僅顯示不曾重復的行；

連續且完全相同方為重復
常和sort 命令一起配合使用：
sort userlist.txt | uniq -c

比較文件
比較兩個文件之間的區別
$ diff foo.conf-broken foo.conf-works
5c5
< use_widgets = no
—
> use_widgets = yes
注明第5行有區別（改變）

復制對文件改變patch
diff 命令的輸出被保存在一種叫做“補丁”的文件中
使用 -u 選項來輸出“統一的（ unified）” diff格式文
件，最適用于補丁文件。
patch 命令復制在其它文件中進行的改變（要謹慎使用
?。?br />適用 -b 選項來自動備份改變了的文件
$ diff -u foo.conf-broken foo.conf-works > foo.patch
$ patch -b foo.conf-broken foo.patch

練習
1、找出ifconfig命令結果中本機的所有IPv4地址
2、查出分區空間使用率的最大百分比值
3、查出用戶UID最大值的用戶名、 UID及shell類型
4、查出/tmp的權限，以數字方式顯示
5、統計當前連接本機的每個遠程主機IP的連接數，并按從大
到小排序

Linux上文本處理三劍客
grep：文本過濾(模式： pattern)工具;
grep, egrep, fgrep（不支持正則表達式搜索）
sed： stream editor，文本編輯工具；
awk： Linux上的實現gawk，文本報告生成器；

grep
grep: Global search REgular expression and Print out
the line.
作用：文本搜索工具，根據用戶指定的“模式”對目標文
本逐行進行匹配檢查；打印匹配到的行；
模式：由正則表達式字符及文本字符所編寫的過濾條件
grep [OPTIONS] PATTERN [FILE…]

grep命令選項