Linux中分析文本工具

一、收集文本統計數據wc

wc命令用來計算數字。利用wc指令我們可以計算文件的Byte數、字數或是列數,若不指定文件名稱,或是所給予的文件名為“-”,則wc指令會從標準輸入設備讀取數據,且不改變原始數據。

例如;

可以對文件或STDIN中的數據運行

$wcstory.txt

39   237   1901 story.txt

行數 字數  字符數

格式:cut [OPTION]… [FILE]…

選項:

使用-l來只計數行數

使用-w來只計數單詞總數

使用-c來只計數字節總數

使用-m來只計數字符總數

ctrl –d 終止輸入,把文本數據統計出來

二、文本排序sort

sort命令是在Linux里非常有用,它將文件進行排序,并將排序結果標準輸出。sort命令既可以從特定的文件,也可以從stdin中獲取輸入,不改變原始文件。

格式:sort[options]file(s)

選項:

-r執行反方向(由上至下)整理

-n執行按數字大小整理

-f選項忽略(fold)字符串中的字符大小寫

-u選項(獨特,unique)刪除輸出中的重復行

-t c選項使用c做為字段界定符

-k X選項按照使用c字符分隔的X列來整理能夠使用多次

指定:作為分隔符第三列按照從大到小排列

3.png

三、文本排序uniq

uniq命令:從輸入中刪除重復的前后相接的行

格式:uniq[OPTION]… [FILE]…

選項:

-c: 顯示每行重復出現的次數;

-d: 僅顯示重復過的行;

-u: 僅顯示不曾重復的行;

連續且完全相同方為重復

常和sort 命令一起配合使用:

sort userlist.txt | uniq-c

例如:

4.png

四、比較文件diff

diff命令在最簡單的情況下,比較給定的兩個文件的不同


表示file1和file2第三行file2文件中多了546hfbjhf

1.png


diff命令的輸出被保存在一種叫做“補丁”的文件中

使用-u選項來輸出“統一的(unified)”diff格式文件,最適用于補丁文件。


五、復制對文件改變patch

patch命令被用于為開放源代碼軟件安裝補丁程序。讓用戶利用設置修補文件的方式,修改,更新原始文件。如果一次僅修改一個文件,可直接在命令列中下達指令依序執行。如果配合修補文件的方式則能一次修補大批文件,這也是Linux系統核心的升級方法之一。


patch命令復制在其它文件中進行的改變(要謹慎使用?。?/strong>

適用-b選項來自動備份改變了的文件

$diff-ufoo.conf-brokenfoo.conf-works>foo.patch

$patch-bfoo.conf-brokenfoo.patch


例如:用patch來恢復文件

恢復f2文件的時候文件名變成f1,原有的f1文件自動備份命名為.orig結尾的文件

2.png

六、練習

1、找出ifconfig命令結果中本機的所有IPv4地址

3.png

2、查出分區空間使用率的最大百分比值

4.png

3、查出用戶UID最大值的用戶名、UIDshell類型

5.png

4、查出/tmp的權限,以數字方式顯示

6.png

5、統計當前連接本機的每個遠程主機IP的連接數,并按從大到小排序

7.png

6、統計/etc/init.d/functions每個單詞出現的字數

8.png





原創文章,作者:xiaoqing,如若轉載,請注明出處:http://www.www58058.com/30535

(1)
xiaoqingxiaoqing
上一篇 2016-08-07 23:33
下一篇 2016-08-08 09:22

相關推薦

  • N25-第五周作業

    第五周 1、顯示/boot/grub/grub.conf中以至少一個空白字符開頭的行; [root@zf ~]# grep -E "^[[:space:]]+[[:alnum:]]+" /boot/grub/grub.conf     &n…

    Linux干貨 2016-12-26
  • Nginx+Apache+Tomcat實現LANMT動靜分離

    Nginx+Apache+Tomcat實現LANMT動靜分離          目的:    本次實驗主要目的為實現以Nginx作為反向代理,并實現分別訪問動靜態服務的效果。   拓撲結構:     &nbsp…

    Linux干貨 2016-12-05
  • vim編輯器

    vim編輯器 vi:Vistual Interface,是一種文本編輯器,所謂文本編輯器就是基于字符編碼的文件,常見的編碼有ASCLL編碼,UNICODE編碼。 vim:即vi IMproved:vi的增強版,可以使用顏色或者底線等方式來顯示一些特殊信息,是模式化的編輯。 文本編輯器的種類 行編輯器:所謂行編輯器就是一行一行來編輯處理的工具,如sed 全屏編…

    Linux干貨 2016-08-15
  • 在Centos7上源碼編譯httpd

    在Centos7上源碼編譯httpd 安裝源碼包 首先在http://httpd.apache.org下載所需要的安裝包 小編在這里下載的是httpd-2.4.27.tar apr-1.6.2.tar apr-util-1.6.0.tar 首先編譯安裝apr-1.6.2.tar.gz #1 tar -zxf apr-1.6.2.tar.gz #先解壓安裝包 …

    2017-08-21
  • 第10周作業(上)

    第10周作業 1、請詳細描述CentOS系統的啟動流程(詳細到每個過程系統做了哪些事情)。CentOS系統啟動詳細的過程如下(以CentOS7為例): 加電自檢(POST)按下電源開關,BIOS系統隨即開始加電自檢,檢查CPU、內存、主板及各接口、硬盤、鍵盤、光驅等,檢測它們的好壞。 讀取啟動順序檢查完成后,BIOS會根據預先設定好的啟動順序去挨個尋找可引導…

    Linux干貨 2017-01-03
  • 證書及加解密原理圖解

    證書管理 現在上網大多數網站都是使用https的協議,https是一個安全的訪問方式,數據在傳輸過程中是加密的,這時候在服務器端就需要使用證書。 科普加解密流程 服務器端客戶端 服務器在和客戶端通信前必須先建立SSL會話,下圖解析SSL會話過程

    Linux干貨 2016-09-25
欧美性久久久久