前言
一個技術要知其然還要知其所以然
RAID
獨立硬盤冗余陣列(RAID, Redundant Array of Independent Disks),舊稱廉價磁盤冗余陣列(Redundant Array of Inexpensive Disks),簡稱磁盤陣列
RAID的基本思想
其基本思想就是把多個相對便宜的硬盤組合起來,成為一個硬盤陣列組,使性能達到甚至超過一個價格昂貴、容量巨大的硬盤。 簡單來說,RAID把多個硬盤組合成為一個邏輯扇區,因此,操作系統只會把它當作一個硬盤。RAID常被用在服務器電腦上,并且常使用完全相同的硬盤作為組合。
磁盤陣列比較表
引用的源地址https://zh.wikipedia.org/wiki/RAID#.E7.A3.81.E7.A2.9F.E9.99.A3.E5.88.97.E6.AF.94.E8.BC.83.E8.A1.A8
標準RAID
RAID 0
RAID 0亦稱為帶區集。它將兩個以上的磁盤并聯起來,成為一個大容量的磁盤。在存放數據時,分段后分散存儲在這些磁盤中,因為讀寫時都可以并行處理,所以在所有的級別中,RAID 0的速度是最快的。但是RAID 0既沒有冗余功能,也不具備容錯能力,如果一個磁盤(物理)損壞,所有數據都會丟失,危險程度與JBOD相當。
簡單的說:2個磁盤并聯起來成一個大容量的磁盤,讀寫能力提高,無容錯能力,沒有冗余能力,一旦一塊硬盤出錯就會導致所有數據丟失。
RAID 1
兩組以上的N個磁盤相互作鏡像,在一些多線程操作系統中能有很好的讀取速度,理論上讀取速度等于硬盤數量的倍數,另外寫入速度有微小的降低。只要一個磁盤正常即可維持運作,可靠性最高。其原理為在主硬盤上存放數據的同時也在鏡像硬盤上寫一樣的數據。當主硬盤(物理)損壞時,鏡像硬盤則代替主硬盤的工作。因為有鏡像硬盤做數據備份,所以RAID 1的數據安全性在所有的RAID級別上來說是最好的。但無論用多少磁盤做RAID 1,僅算一個磁盤的容量,是所有RAID中磁盤利用率最低的一個級別。 如果用兩個不同大小的磁盤建RAID 1,可用空間為較小的那個磁盤,較大的磁盤多出來的空間也可以分區成一個區來使用,不會造成浪費。
簡單的說:2個磁盤都做成一模一樣的鏡像,一個改動了另一個也會改動。讀能力上去了,寫能力下降了。有冗余能力,主硬盤壞了,副硬盤會頂上。無論用多少磁盤做RAID 1,僅算一個磁盤的容量,是所有RAID中磁盤利用率最低的一個級別。
RAID 2
這是RAID 0的改良版,以漢明碼(Hamming Code)的方式將數據進行編碼后分區為獨立的比特,并將數據分別寫入硬盤中。因為在數據中加入了錯誤修正碼(ECC,Error Correction Code),所以數據整體的容量會比原始數據大一些,RAID2最少要三臺磁盤驅動器方能運作。
簡單的說:跟RAID 0 一樣,只不過是改良版。
RAID 3
采用Bit-interleaving(數據交錯存儲)技術,它需要通過編碼再將數據比特分割后分別存在硬盤中,而將同比特檢查后單獨存在一個硬盤中,但由于數據內的比特分散在不同的硬盤上,因此就算要讀取一小段數據資料都可能需要所有的硬盤進行工作,所以這種規格比較適于讀取大量數據時使用。
簡單的說:采用數據交錯存儲技術,通過編碼將數據比特分割分別存儲。同比特檢查放在一個硬盤,不同比特放在不同的硬盤。適用讀取大量數據時使用。
RAID 4
它與RAID 3不同的是它在分區時是以區塊為單位分別存在硬盤中,但每次的數據訪問都必須從同比特檢查的那個硬盤中取出對應的同比特數據進行核對,由于過于頻繁的使用,所以對硬盤的損耗可能會提高。(塊交織技術,Block interleaving)
簡單的說: 1101 0110 校驗碼1011 通過對比生成校驗碼,也可通過校驗碼來還原。(1+0,1+1,0+1,0+1)=1011 不常用
RAID 5
RAID Level 5是一種儲存性能、數據安全和存儲成本兼顧的存儲解決方案。它使用的是Disk Striping(硬盤分區)技術。RAID 5至少需要三塊硬盤,RAID 5不是對存儲的數據進行備份,而是把數據和相對應的奇偶校驗信息存儲到組成RAID5的各個磁盤上,并且奇偶校驗信息和相對應的數據分別存儲于不同的磁盤上。當RAID5的一個磁盤數據發生損壞后,可以利用剩下的數據和相應的奇偶校驗信息去恢復被損壞的數據。RAID 5可以理解為是RAID 0和RAID 1的折衷方案。RAID 5可以為系統提供數據安全保障,但保障程度要比鏡像低而磁盤空間利用率要比鏡像高。RAID 5具有和RAID 0相近似的數據讀取速度,只是因為多了一個奇偶校驗信息,寫入數據的速度相對單獨寫入一塊硬盤的速度略慢,若使用“回寫緩存”可以讓性能改善不少。同時由于多個數據對應一個奇偶校驗信息,RAID 5的磁盤空間利用率要比RAID 1高,存儲成本相對較便宜。
簡單的說:就是采用輪流做校驗機制,并且奇偶校驗信息和相對應的數據分別存儲于不同的磁盤上。讀寫能力上升了,有容錯能力,最少磁盤數為3.
RAID 6
與RAID 5相比,RAID 6增加第二個獨立的奇偶校驗信息塊。兩個獨立的奇偶系統使用不同的算法,數據的可靠性非常高,任意兩塊磁盤同時失效時不會影響數據完整性。RAID 6需要分配給奇偶校驗信息更大的磁盤空間和額外的校驗計算,相對于RAID 5有更大的IO操作量和計算量,其“寫性能”強烈取決于具體的實現方案,因此RAID6通常不會通過軟件方式來實現,而更可能通過硬件/固件方式實現。
同一數組中最多容許兩個磁盤損壞。更換新磁盤后,數據將會重新算出并寫入新的磁盤中。依照設計理論,RAID 6必須具備四個以上的磁盤才能生效。
可使用的容量為硬盤總數減去2的差,乘以最小容量,公式為:
同理,數據保護區域容量則為最小容量乘以2。
RAID 6在硬件磁盤陣列卡的功能中,也是最常見的磁盤陣列檔次。
JBOD
JBOD( Just a Bunch Of Disks)在分類上,JBOD并不是RAID的檔次。由于并沒有規范,市場上有兩類主流的做法
使用單獨的鏈接端口如SATA、USB或1394同時控制多個各別獨立的硬盤,使用這種模式通常是較高級的設備,還具備有RAID的功能,不需要依靠JBOD達到合并邏輯扇區的目的。 只是將多個硬盤空間合并成一個大的邏輯硬盤,沒有錯誤備援機制。 數據的存放機制是由第一顆硬盤開始依序往后存放,即操作系統看到的是一個大硬盤(由許多小硬盤組成的)。但如果硬盤損毀,則該顆硬盤上的所有數據將無法救回。若第一顆硬盤損壞,通常無法作救援(因為大部分文件系統將磁盤分區表(partition table)存在磁盤前端,即第一顆),失去磁盤分區表即失去一切數據,若遭遇磁盤陣列數據或硬盤出錯的狀況,危險程度較RAID 0更劇。它的好處是不會像RAID,每次訪問都要讀寫全部硬盤。
RAID 7
RAID 7并非公開的RAID標準,而是Storage Computer Corporation的專利硬件產品名稱,RAID 7是以RAID 3及RAID 4為基礎所發展,但是經過強化以解決原來的一些限制。另外,在實現中使用大量的高速緩存以及用以實現異步數組管理的專用即時處理器,使得RAID 7可以同時處理大量的IO要求,所以性能甚至超越了許多其他RAID標準的實做產品。但也因為如此,在價格方面非常的高昂。[3] 簡單的說:這是一款專利硬件,很貴,一般很少用
RAID 10/01
RAID 10是先鏡射再分區數據,再將所有硬盤分為兩組,視為是RAID 0的最低組合,然后將這兩組各自視為RAID 1運作。
RAID 01則是跟RAID 10的程序相反,是先分區再將數據鏡射到兩組硬盤。它將所有的硬盤分為兩組,變成RAID 1的最低組合,而將兩組硬盤各自視為RAID 0運作。
當RAID 10有一個硬盤受損,其余硬盤會繼續運作。RAID 01只要有一個硬盤受損,同組RAID 0的所有硬盤都會停止運作,只剩下其他組的硬盤運作,可靠性較低。如果以六個硬盤建RAID 01,鏡射再用三個建RAID 0,那么壞一個硬盤便會有三個硬盤脫機。因此,RAID 10遠較RAID 01常用,零售主板絕大部分支持RAID 0/1/5/10,但不支持RAID 01。
RAID 50
RAID 50 RAID 5與RAID 0的組合,先作RAID 5,再作RAID 0,也就是對多組RAID 5彼此構成Stripe訪問。由于RAID 50是以RAID 5為基礎,而RAID 5至少需要3顆硬盤,因此要以多組RAID 5構成RAID 50,至少需要6顆硬盤。以RAID 50最小的6顆硬盤配置為例,先把6顆硬盤分為2組,每組3顆構成RAID 5,如此就得到兩組RAID 5,然后再把兩組RAID 5構成RAID 0。
RAID 50在底層的任一組或多組RAID 5中出現1顆硬盤損壞時,仍能維持運作,不過如果任一組RAID 5中出現2顆或2顆以上硬盤損毀,整組RAID 50就會失效。
RAID 50由于在上層把多組RAID 5構成Stripe,性能比起單純的RAID 5高,容量利用率比RAID5要低。比如同樣使用9顆硬盤,由各3顆RAID 5再組成RAID 0的RAID 50,每組RAID 5浪費一顆硬盤,利用率為(1-3/9),RAID 5則為(1-1/9)。
RAID 53
它擁有一個鏡射條帶數組,硬盤里其中一個條帶就是一個是由3組以上的RAID 5組成RAID 3硬盤陣列。
RAID 60
RAID 6與RAID 0的組合:先作RAID 6,再作RAID 0。換句話說,就是對兩組以上的RAID 6作Stripe訪問。RAID 6至少需具備4顆硬盤,所以RAID 60的最小需求是8顆硬盤。
由于底層是以RAID 6組成,所以RAID 60可以容許任一組RAID 6中損毀最多2顆硬盤,而系統仍能維持運作;不過只要底層任一組RAID 6中損毀3顆硬盤,整組RAID 60就會失效,當然這種情況的概率相當低。
比起單純的RAID 6,RAID 60的上層通過結合多組RAID 6構成Stripe訪問,因此性能較高。不過使用門檻高,而且容量利用率低是較大的問題。
實現方式
根據實現模式,分為軟件和硬件兩種:[4][5]
軟件磁盤陣列(Software RAID)
主要由電腦主板CPU處理數組存儲作業,缺點為耗損較多CPU資源運算RAID,優點則是價格偏低。分類有二種:純軟件磁盤陣列(Pure Software RAID):只需要主板支持即可,不需要任何磁盤陣列卡。若主板損壞,可能難以購買同款主板重建RAID。 硬件輔助磁盤陣列(Hardware-Assisted RAID):需要一張RAID卡,以及廠商所提供的驅動程序。這款RAID較易遷移到其他電腦。
硬件磁盤陣列(Hardware RAID)
RAID卡上自帶處理器,不需要服務器的CPU運算。優點是讀寫性能最快,不占用服務器資源,可用于任何操作系統,也能在系統斷電后,通過備份電池模塊(BBU, Backup Battery Unit)以及非易失性內存 (NVRAM)將硬盤讀寫日志檔(Journal)包含的剩余讀寫作業先紀錄在內存中,等待電力供應撤消后,再由NVRAM取回日志檔數據,接著再完成讀寫作業,將剩余讀寫作業安全完成以確保讀寫完整性。備份電池模塊通常會配合數組卡的Write-Back緩存模式,借由此內存緩存讀寫作業以得到更高的讀寫性能;但是沒有備份電池模塊的硬件磁盤陣列卡,切勿使用Write-Back緩存模式以免遭遇斷電情形導致讀寫數據流失。此外,因為硬件磁盤陣列卡搭載CPU處理器,所以可以與系統分離出來,對硬盤進行各種作業,還原作業的速度也比軟件磁盤陣列快。缺點是其售價很高,通常只用于RAID 5和RAID 6。
例子
由于實驗器材的原因 硬件磁盤陣列將不做實驗 以下是以軟件進行實驗 nato note:注意不要在生產環境中使用
CentOS 6上的軟件RAID的實現: 結合內核中的md(multi devices)
mdadm:模式化的工具 命令的語法格式:mdadm [mode] <raiddevice> [options] <component-devices> 支持的RAID級別:LINEAR線性方式, RAID0, RAID1, RAID4, RAID5, RAID6, RAID10; 模式: 創建:-C 裝配: -A 監控: -F 管理:-f, -r, -a <raiddevice>: /dev/md# <component-devices>: 任意塊設備 -C: 創建模式 -n #: 使用#個塊設備來創建此RAID; -l #:指明要創建的RAID的級別; -a {yes|no}:自動創建目標RAID設備的設備文件; -c CHUNK_SIZE: 指明塊大??; -x #: 指明空閑盤的個數; 例如:創建一個10G可用空間的RAID5; -D:顯示raid的詳細信息; mdadm -D /dev/md# 管理模式: -f: 標記指定磁盤為損壞; -a: 添加磁盤 -r: 移除磁盤 觀察md的狀態: cat /proc/mdstat 停止md設備: mdadm -S /dev/md# watch命令: -n #: 刷新間隔,單位是秒; watch -n# 'COMMAND'
軟件實現方式,創建一個可用空間為5G的RAID1設備,要求其chunk大小為128k,文件系統為ext4,有一個空閑盤,開機可自動掛載至/backup目錄;
1.創建3個 5G大小的磁盤 2個為鏡像盤 1個為空閑盤
2.指定3個磁盤為linux raid autodetect
3.讓內核識別
4.創建md1
5.查看是否創建
6.格式化 為ext4 并指定卷標
7.開機自動掛載 在/etc/fatab
總結
如果有錯的地方請給我留言 QQ1505222150 有什么建議也可留言 。 O(∩_∩)O謝謝
原創文章,作者:N19_king,如若轉載,請注明出處:http://www.www58058.com/16464