理解Inode

inode是一個重要概念,是理解Unix/Linux文件系統和硬盤儲存的基礎。

我覺得,理解inode,不僅有助于提高系統操作水平,還有助于體會Unix設計哲學,即如何把底層的復雜性抽象成一個簡單概念,從而大大簡化用戶接口。

下面就是我的inode學習筆記,盡量保持簡單。

理解Inode

一、inode是什么?

理解inode,要從文件儲存說起。

文件儲存在硬盤上,硬盤的最小存儲單位叫做”扇區”(Sector)。每個扇區儲存512字節(相當于0.5KB)。

操作系統讀取硬盤的時候,不會一個個扇區地讀取,這樣效率太低,而是一次性連續讀取多個扇區,即一次性讀取一個”塊”(block)。這種由多個扇區組成的”塊”,是文件存取的最小單位。”塊”的大小,最常見的是4KB,即連續八個 sector組成一個 block。

文件數據都儲存在”塊”中,那么很顯然,我們還必須找到一個地方儲存文件的元信息,比如文件的創建者、文件的創建日期、文件的大小等等。這種儲存文件元信息的區域就叫做inode,中文譯名為”索引節點”。

每一個文件對應一個inode,硬盤上有多少文件,就有多少個inode。

二、inode的內容

inode包含文件的元信息,具體來說有以下內容:

* 文件的字節數

* 文件擁有者的User ID

* 文件的Group ID

* 文件的讀、寫、執行權限

* 文件的時間戳,共有三個:ctime指inode上一次變動的時間,mtime指文件內容上一次變動的時間,atime指文件上一次打開的時間。

* 鏈接數,即有多少文件名指向這個inode

* 文件數據block的位置

可以用stat命令,查看某個文件的inode信息:

stat example.txt

理解Inode

總之,除了文件名以外的所有文件信息,都存在inode之中。至于為什么沒有文件名,下文會有詳細解釋。

三、inode的大小

inode也會消耗硬盤空間,所以硬盤格式化的時候,操作系統自動將硬盤分成兩個區域。一個是數據區,存放文件數據;另一個是inode區(inode table),存放inode所包含的信息。

每個inode節點的大小,一般是128字節或256字節。inode節點的總數,在格式化時就給定,一般是每1KB或每2KB就設置一個inode。假定在一塊1GB的硬盤中,每個inode節點的大小為128字節,每1KB就設置一個inode,那么inode table的大小就會達到128MB,占整塊硬盤的12.8%。

查看每個硬盤分區的inode總數和已經使用的數量,可以使用df命令。

df -i

理解Inode

查看每個inode節點的大小,可以用如下命令:

sudo dumpe2fs -h /dev/hda | grep “Inode size”

理解Inode

由于每個文件都必須有一個inode,因此有可能發生inode已經用光,但是硬盤還未存滿的情況。這時,就無法在硬盤上創建新文件。

四、inode號碼

每個inode都有一個號碼,操作系統用inode號碼來識別不同的文件。

這里值得重復一遍,Unix/Linux系統內部不使用文件名,而使用inode號碼來識別文件。對于系統來說,文件名只是inode號碼便于識別的別稱或者綽號。

表面上,用戶通過文件名,打開文件。實際上,系統內部這個過程分成三步:首先,系統找到這個文件名對應的inode號碼;其次,通過inode號碼,獲取inode信息;最后,根據inode信息,找到文件數據所在的block,讀出數據。

使用ls -i命令,可以看到文件名對應的inode號碼:

ls -i example.txt

理解Inode

五、目錄文件

Unix/Linux系統中,目錄(directory)也是一種文件。打開目錄,實際上就是打開目錄文件。

目錄文件的結構非常簡單,就是一系列目錄項(dirent)的列表。每個目錄項,由兩部分組成:所包含文件的文件名,以及該文件名對應的inode號碼。

ls命令只列出目錄文件中的所有文件名:

ls /etc

理解Inode

ls -i命令列出整個目錄文件,即文件名和inode號碼:

ls -i /etc

理解Inode

如果要查看文件的詳細信息,就必須根據inode號碼,訪問inode節點,讀取信息。ls -l命令列出文件的詳細信息。

ls -l /etc

理解Inode

六、硬鏈接

一般情況下,文件名和inode號碼是”一一對應”關系,每個inode號碼對應一個文件名。但是,Unix/Linux系統允許,多個文件名指向同一個inode號碼。

這意味著,可以用不同的文件名訪問同樣的內容;對文件內容進行修改,會影響到所有文件名;但是,刪除一個文件名,不影響另一個文件名的訪問。這種情況就被稱為”硬鏈接”(hard link)。

ln命令可以創建硬鏈接:

ln 源文件 目標文件

理解Inode

運行上面這條命令以后,源文件與目標文件的inode號碼相同,都指向同一個inode。inode信息中有一項叫做”鏈接數”,記錄指向該inode的文件名總數,這時就會增加1。

反過來,刪除一個文件名,就會使得inode節點中的”鏈接數”減1。當這個值減到0,表明沒有文件名指向這個inode,系統就會回收這個inode號碼,以及其所對應block區域。

這里順便說一下目錄文件的”鏈接數”。創建目錄時,默認會生成兩個目錄項:”.”和”..”。前者的inode號碼就是當前目錄的inode號碼,等同于當前目錄的”硬鏈接”;后者的inode號碼就是當前目錄的父目錄的inode號碼,等同于父目錄的”硬鏈接”。所以,任何一個目錄的”硬鏈接”總數,總是等于2加上它的子目錄總數(含隱藏目錄)。

七、軟鏈接

除了硬鏈接以外,還有一種特殊情況。

文件A和文件B的inode號碼雖然不一樣,但是文件A的內容是文件B的路徑。讀取文件A時,系統會自動將訪問者導向文件B。因此,無論打開哪一個文件,最終讀取的都是文件B。這時,文件A就稱為文件B的”軟鏈接”(soft link)或者”符號鏈接(symbolic link)。

這意味著,文件A依賴于文件B而存在,如果刪除了文件B,打開文件A就會報錯:”No such file or directory”。這是軟鏈接與硬鏈接最大的不同:文件A指向文件B的文件名,而不是文件B的inode號碼,文件B的inode”鏈接數”不會因此發生變化。

ln -s命令可以創建軟鏈接。

ln -s 源文文件或目錄 目標文件或目錄

理解Inode

八、inode的特殊作用

由于inode號碼與文件名分離,這種機制導致了一些Unix/Linux系統特有的現象。

1. 有時,文件名包含特殊字符,無法正常刪除。這時,直接刪除inode節點,就能起到刪除文件的作用。

2. 移動文件或重命名文件,只是改變文件名,不影響inode號碼。

3. 打開一個文件以后,系統就以inode號碼來識別這個文件,不再考慮文件名。因此,通常來說,系統無法從inode號碼得知文件名。

第3點使得軟件更新變得簡單,可以在不關閉軟件的情況下進行更新,不需要重啟。因為系統通過inode號碼,識別運行中的文件,不通過文件名。更新的時候,新版文件以同樣的文件名,生成一個新的inode,不會影響到運行中的文件。等到下一次運行這個軟件的時候,文件名就自動指向新版文件,舊版文件的inode則被回收。

(完)

文章鏈接:http://www.ruanyifeng.com/blog/2011/12/inode.html

原創文章,作者:追馬,如若轉載,請注明出處:http://www.www58058.com/1257

(0)
追馬追馬
上一篇 2015-03-20
下一篇 2015-03-21

相關推薦

  • Linux進程及管理(1)

    Linux進程及管理(1) 內核的功用:進程管理、文件系統、網絡功能、內存管理、驅動程序、安全功能 Process: 運行中的程序的一個副本; 存在生命周期Linux內核存儲進程信息的固定格式:task struct 多個任務的的task struct組件的鏈表:task list 進程創建: init 父子關系 進程:都由其父進程創建 fork(), cl…

    Linux干貨 2015-05-28
  • 邏輯卷實例

    1、創建一個至少有兩個PV組成的大小為20G的名為testvg的VG;要求PE大小為16MB, 而后在卷組中創建大小為5G的邏輯卷testlv;掛載至/users目錄 2、新建用戶archlinux,要求其家目錄為/users/archlinux,而后su切換至archlinux用戶,復制/etc/pam.d目錄至自己的家目錄 3、擴展testlv至7G,要…

    Linux干貨 2016-09-01
  • Linux防火墻之基本原理

    本系列文章主要講述Linux防火墻的基本原理和基礎使用方法: 1.什么是防火墻: 當我們把計算機連入互聯網與其他計算機進行通信時,這無疑也將自己的信息暴露了,那就意味著可能會有一些心懷不軌的人會利用這些信息來攻擊自己的主機,尤其是作為一臺服務器向互聯網用戶提供服務時,就迫切需要一種隔離和保護機制,來隔離外部網絡,達到保護自我的目的。而這種隔離機制就叫做防火墻…

    Linux干貨 2016-12-27
  • LVS介紹

    LVS介紹     LVS是linux virtual server的簡寫,是服務器集群的一種負載均衡解決方案,作為netfilter的補充套件,工作于內核空間。     常見的術語 CIP:客戶端ip地址 RIP:后端服務器ip地址 VIP:lvs面向客戶端的ip地址 DIP:lvs面向…

    Linux干貨 2017-08-04
  • God進程監控框架

    監控重啟進程的方案有很多種: 最簡單的方法,寫個腳本fork進程運行,然后waitpid,如果獲pid后就再次啟動 最土的方法,配置cron任務,固定時間運行腳本檢查進程是否存在,不存在則啟動 百度使用qmail里的supervised程序,通過supervised監管進程。 優點:supervised可以啟動daemon程序,對于非daemon需要采用no…

    Linux干貨 2015-02-13
  • 2016全球運維大會,優云蔣君偉演講“CMDB+自動化的管理融合”成一大亮點

    2016全球運維大會于9月23日-24日在上海盛大開幕。作為國內運維行業的重量級大會,優云產品總監蔣君偉在自動化專場與來自全國各地的運維同行一起探討、分享業內自動化運維的最佳實踐。現場情緒熱烈,氣氛高漲,成為了本屆全球運維大會的一大亮點。 全新梳理自動化與CMDB的融合之道 全球運維大會當天,運維自動化專場很多大牛針對自動化運維管理中的CMDB進行了激烈的討…

    Linux資訊 2016-12-05

評論列表(2條)

  • Linux_love
    Linux_love 2015-03-23 09:34

    非常好!

  • Linux_love
    Linux_love 2015-03-28 17:45

    mark

欧美性久久久久