Linux cluster集群全講解

? ? ? ? ? ? ? ? ?Linux cluster集群

Linux cluster(集群):

cluster:計算機組合,為解決某個特定問題組合起來形成的單個系統;

?

Linux Cluster類型:

???LBLoad Balancing,負載均衡;

???HAHigh Availiablity,高可用;

???A=MTBF(平均無故障時長)/MTBF+MTTR(平均修復時間))

(0,1)90%, 95%, 99%, 99.5%, ?99.9%, 99.99%, 99.999%

???????A=(0<=1)

???HPHigh Performance,高性能;

?

全球計算機性能評測網站:www.top500.org??

?

系統擴展方式:

Scale UP:向上擴展

Scale Out:向外擴展Cluster集群

 

LB Cluster負載均衡集群:

???LB Cluster的實現:

?硬件:

???F5 Big-IP

???Citrix Netscaler

???A10 A10

??軟件:

lvsLinux Virtual Server

nginx

haproxy

atsapache traffic server

perlbal

pound

?

基于工作的協議層次劃分:

???傳輸層(通用):(DPORT)主要根據目標端口進行轉發;

lvs:主要工作在傳輸層調度;

nginx:(stream)模擬傳輸層調度;

haproxy:(mode tcp)模擬傳輸層調度;

應用層(專用):(自定義的請求模型分類)

proxy server

???httpnginx, httpd, haproxy(mode http), …

???fastcginginx, httpd, …

???mysqlmysql-proxy, …

????站點指標:

PVPage View 頁面入口的瀏覽量;

UVUnique Vistor 獨立的訪問者;

IP:訪問網站時使用的外網地址;

 

會話保持:

???(1) session sticky:會話粘性;

Source IP

Cookie 追蹤用戶身份;

???(2) session replication;

session cluster

???(3) session server

??主從復制集群;

?

lvsLinux Virtual Server

VS: Virtual Server

RS: Real Server

lvs在不適用的場合使用會帶來的麻煩:

??lvs太原生態,使得很多輔助性的工具可控性極低,因為它只是為了調度而生。

??lvs不適用小型站點。

 

lvs:四層路由器,四層交換機;

VS:根據請求報文的目標IP和目標協議及端口將其調度轉發至某RealServer,根據調度算法來挑選RS;

?

iptables/netfilter

iptables:用戶空間的管理工具;

netfilter:內核空間上的框架;

流入:PREROUTING –> INPUT

流出:OUTPUT –> POSTROUTING

轉發:PREROUTING –> FORWARD –> POSTROUTING

 

DNAT:目標地址轉換; PREROUTING;

 

lvs: ipvsadm/ipvs

ipvsadm:用戶空間的命令行工具,規則管理器,用于管理集群服務及RealServer

ipvs:工作于內核空間的netfilterINPUT鉤子之上的框架;

注意:一般不建議在lvs調度服務器上做太多的iptables過濾規則。

 

lvs集群類型中的術語:

vsVirtual Server, Director, Dispatcher, Balancer

rsReal Server, upstream server, backend server

CIPClient IP, VIP: Virtual serve ip , DIP: Director IPRIP: Real server IP

CIP <–> VIP == DIP <–> RIP

?

OS七層模型:

應用層

表示層

會話層

傳輸層

網絡層

數據鏈路層

物理層

?

lvs集群的類型:

lvs-nat:修改請求報文的目標IP

lvs-dr:重新封裝新的MAC地址,默認使用的類型;

lvs-tun:在原請求IP報文之外新加一個IP首部;

lvs-fullnat:修改請求報文的源和目標IP;

?

lvs-nat

多目標IPDNAT,通過將請求報文中的目標地址和目標端口修改為某挑出的RSRIPPORT實現轉發;

1RIPDIP必須在同一個IP網絡,且應該使用私網地址;RS的網關要指向DIP

2)請求報文和響應報文都必須經由Director轉發;Director易于成為系統瓶頸;

3)支持端口映射,可修改請求報文的目標PORT

4vs必須是Linux系統,rs可以是任意系統;

?

lvs-dr

???Direct Routing,直接路由;

???通過為請求報文重新封裝一個MAC首部進行轉發,源MACDIP所在的接口的MAC,目標MAC是某挑選出的RSRIP所在接口的MAC地址;源IP/PORT,以及目標IP/PORT均保持不變;

???Director和各RS都得配置使用VIP

(1) 確保前端路由器將目標IPVIP的請求報文發往Director

(a) 在前端網關做靜態綁定,此種方案不可行;

(b) RS上使用arptables

????(c) RS上修改內核參數以限制arp通告及應答級別;

arp_announce

arp_ignore

(2) RSRIP可以使用私網地址,也可以是公網地址;RIPDIP在同一IP網絡;RIP的網關不能指向DIP,以確保響應報文不會經由DirectorRSlo別名網卡上配置vip地址;

(3) RSDirector要在同一個物理網絡;

(4) 請求報文要經由Director,但響應不能經由Director,而是由RS直接發往Client;

(5) 不支持端口映射;

?

lvs-tun

???轉發方式:不修改請求報文的IP首部(源IPCIP,目標IPVIP),而在原IP報文之外再封裝一個IP首部(源IPDIP,目標IPRIP),將報文發往挑選出的目標RS;

(1)?DIP, VIP, RIP都應該是公網地址;

(2) RS的網關不能,也不可能指向DIPRSlo別名網卡上配置vip地址;

(3) 請求報文要經由Director,但響應不能經由Director;

(4) 不支持端口映射;

(5) RSOS得支持隧道功能;

客戶端請求:

?client—–CIP VIP——->director——–CIP VIP ?DIP RIP———realserver(在lo別名上配置vip);

服務器響應請求:

?realserver——VIP CIP———client

????

 

lvs-fullnat

通過同時修改請求報文的源IP地址和目標IP地址進行轉發;

CIP –> DIP

VIP –> RIP

(1) VIP是公網地址,RIPDIP是私網地址,且通常不在同一IP網絡;因此,RIP的網關一般不會指向DIP;

(2) RS收到的請求報文源地址是DIP,因此,只需響應給DIP;但Director還要將其發往Client;

(3) 請求和響應報文都經由Director

(4) 支持端口映射;

 

??注意:lvs-fullnatlvs默認不支持;

?

ipvs scheduler(調度):

根據其調度時是否考慮各RS當前的負載狀態,可分為靜態方法和動態方法兩種:

靜態方法:僅根據算法本身進行調度;

RRroundrobin,輪詢;

WRRWeighted RR,加權輪詢;

SHSource Hashing,實現session sticy,源IP地址hash;將來自于同一個IP地址的請求始終發往第一次挑中的RS,從而實現會話綁定;

????DHDestination Hashing;目標地址哈希,將發往同一個目標地址的請求始終轉發至第一次挑中的RS

 

動態方法:主要根據每RS當前的負載狀態及調度算法進行調度;

Overhead=

LCleast connections

Overhead=activeconns*256+inactiveconns

WLCWeighted LC

Overhead=(activeconns*256+inactiveconns)/weight

SEDShortest Expection Delay

Overhead=(activeconns+1)*256/weight

NQNever Queue

 

LBLCLocality-Based LC,動態的DH算法;

LBLCRLBLC with Replication,帶復制功能的LBLC;

?

ipvsadm/ipvs

ipvs

??~]# grep -i -C 10 “ipvs” /boot/config-3.10.0-327.el7.x86_64

??支持的協議:TCPUDP, AHESP, AH_ESP, SCTP

ipvs集群:

集群服務

服務上的RS

?

ipvsadm命令:

ipvsadm -A|E -t|u|f service-address [-s scheduler] [-p [timeout]] [-M netmask] [–pe persistence_engine] [-b sched-flags]

ipvsadm -D -t|u|f service-address

ipvsadm -C

ipvsadm -R

ipvsadm -S [-n]

ipvsadm -a|e -t|u|f service-address -r server-address [options]

ipvsadm -d -t|u|f service-address -r server-address

ipvsadm -L|l [options]

ipvsadm -Z [-t|u|f service-address]

?

?管理集群服務:增、改、刪;

增、改:

ipvsadm -A|E -t|u|f service-address [-s scheduler] [-p [timeout]]

 

刪:

ipvsadm -D -t|u|f service-address

 

service-address

-t|u|f

-t: TCP協議的端口,VIP:TCP_PORT

-u: TCP協議的端口,VIP:UDP_PORT

-ffirewall MARK,是一個數字;

 

[-s scheduler]:指定集群的調度算法,默認為wlc

 

管理集群上的RS:增、改、刪;

增、改:

???ipvsadm -a|e -t|u|f service-address -r server-address [-g|i|m] [-w weight]

 

?刪:

ipvsadm -d -t|u|f service-address -r server-address

 

server-address

rip[:port]

 

選項:

lvs類型:

-g: gateway, dr類型

-i: ipip, tun類型

-m: masquerade, nat類型

-w weight:權重;

 

清空定義的所有內容:

ipvsadm -C

 

查看:

ipvsadm -L|l [options]

?–numeric, -nnumeric output of addresses and ports

?–exactexpand numbers (display exact values)

?–connection-coutput of current IPVS connections

?–statsoutput of statistics information

–rate output of rate information

 

保存和重載:

ipvsadm -S = ipvsadm-save

ipvsadm -R = ipvsadm-restore

?

實驗測試lvs集群:

??實驗環境:準備4臺虛擬機,配置一個lvs-natlvs集群;

???client客戶機IP192.168.3.7

???director調度服務器準備兩塊網卡,network 1 vip:192.168.3.5 ?network 2Dip:192.168.22.1

???realserver1 httpd服務器rip192.168.22.2 gateway192.168.22.1

????????realserver1 httpd配置訪問主頁realserver 1

???realserver2 httpd服務器rip192.168.22.3gateway192.168.22.1

????????realserver2 httpd配置訪問主頁realserver 2

?

?1)以上實驗測試環境準備好之后,我們就可以配置lvs director調度服務器了。

director調度服務器上開啟路由轉發功能;

blob.png

2)director調度服務器上配置調度服務,使用rr輪循調配:

blob.png

3)測試lvsrr輪循功能:

blob.png

4)修改director調度服務器調度方式為wrr加權輪循:

blob.png

5)測試lvswrr加權輪循功能:

blob.png

6)修改director調度服務器調度方式為SH源地址哈希:

blob.png

7)測試lvsSH源地址哈希功能,將客戶端IP第一次訪問的realserver始終綁定在固定的第一次訪問的realserver上。

blob.png

負載均衡集群的設計要點:

(1) 是否需要會話保持;

(2) 是否需要共享存儲;

共享存儲:NAS, SANDS(分布式存儲)

數據同步:

課外作業:rsync+inotify實現數據同步,一般不建議使用。

 

lvs-nat

???設計要點:

(1) RIPDIP在同一IP網絡, RIP的網關要指向DIP;

(2) 支持端口映射;

實踐作業(博客):負載均衡一個php應用;

測試:(1) 是否需要會話保持;(2) 是否需要共享存儲;

?

lvs-dr

???dr模型中,各主機上均需要配置VIP,解決地址沖突的方式有三種:

?(1) 在前端網關做靜態綁定;不可用;

?(2) 在各RS使用arptables;比較麻煩;

?(3) 在各RS修改內核參數,來限制arp響應和通告的級別;可行;

限制響應級別:arp_ignore(響應)

0:默認值,表示可使用本地任意接口上配置的任意地址進行響應;

1: 僅在請求的目標IP配置在本地主機的接收到請求報文接口上時,才給予響應;

限制通告級別:arp_announce(通告)

0:默認值,把本機上的所有接口的所有信息向每個接口上的網絡進行通告;

1:盡量避免向非直接連接網絡進行通告;

2:必須避免向非本網絡通告;

實驗測試lvs集群:

??實驗環境:準備4臺虛擬機,配置一個lvs-natlvs集群;

?

實驗測試lvs集群:

??實驗環境:準備4臺虛擬機,配置一個lvs-drlvs集群;

??client客戶機IP為:192.168.3.7

??director調度服務器配置一塊網卡,在eno16777736上配置dip192.168.3.5,在eno16777736:0別名上配置vip192.168.3.6

?

??realserver1 httpd服務器rip192.168.3.2,在lo網卡上配置別名vip192.168.3.6,配置arp_ignore=1 ,arp_announce=2

?????realserver2 httpd服務器rip192.168.3.8,在lo網卡上配置別名vip192.168.3.6,配置arp_ignore=1 ,arp_announce=2

?

??1)在director調度服務器上配置eno16777736:0別名上配置vip192.168.3.6

blob.png

? 2)在realserver1 lo網卡別名上配置VIP192.168.3.6,配置arp_ignore=1 ,arp_announce=2配置網頁為<h>realserver1</h>為了方便配置,簡化重復操作,提高效率我們可以編寫腳本setlvs.sh

blob.png

blob.png

3)realserver2上同樣執行setlvs.sh腳本文件,配置viplo網卡別名上,配置arp_ignore=1 ,arp_announce=2,配置網頁為:<h>realserver2</h>

blob.png

blob.png

4)配置director調度服務器為wrr加權輪循,lvs類型為lvs-dr

?blob.png

 

5)測試lvs-dr加權輪循:

blob.png

FWMFireWall Mark (防火墻標記)

借助于防火墻標記來分類報文,而后基于標記定義集群服務;可將多個不同的應用使用同一個集群服務進行調度;

 

????打標記方法(在Director主機):

???# iptables -t mangle -A PREROUTING -d $vip -p $proto –dport $port -j MARK –set-mark NUMBER

 

基于標記定義集群服務:

???# ipvsadm -A -f NUMBER [options]

 

lvs persistence:持久連接

??持久連接模板:實現無論使用任何算法,在一段時間內,實現將來自同一個地址的請求始終發往同一個RS;

 

??ipvsadm -A|E -t|u|f service-address [-s scheduler] [-p [timeout]]

 

??port Affinity

每端口持久:每集群服務單獨定義,并定義其持久性;

每防火墻標記持久:基于防火墻標記定義持久的集群服務;可實現將多個端口上的應用統一調度,即所謂的port Affinity

每客戶端持久:基于0端口定義集群服務,即將客戶端對所有應用的請求統統調度至后端主機,而且必須使用持久連接進行綁定;

blob.png

保存及重載規則:

保存:建議保存至/etc/sysconfig/ipvsadm

ipvsadm-save > /PATH/TO/IPVSADM_FILE

ipvsadm -S > /PATH/TO/IPVSADM_FILE

systemctl stop ipvsadm.service

 

重載:

ipvsadm-restore < /PATH/FROM/IPVSADM_FILE

ipvsadm -R < /PATH/FROM/IPVSADM_FILE

systemctl restart ipvsadm.service

考慮:

(1) Director不可用,整個系統將不可用;SPoF

解決方案:高可用

keepalived

heartbeat/corosync

(2) RS不可用時,Director依然會調度請求至此RS;

解決方案:對各RS的健康狀態做檢查,失敗時禁用,成功時啟用;

keepalived

heartbeat/corosync, ldirectord

檢測方式:

(a) 網絡層檢測;

(b) 傳輸層檢測,端口探測;

(c) 應用層檢測,請求某關鍵資源;

 

ok –> failure

failure –> ok

 

實驗測試:

?搭建lvs-dr類型的MySQL集群做防火墻標記:

?client 客戶機IP192.168.3.7

?director調度服務器配置一塊網卡,在eno16777736上配置dip192.168.3.5,在eno16777736:0別名上配置vip192.168.3.6

blob.png

realserver1 mysql服務器rip192.168.3.2,在lo網卡上配置別名vip192.168.3.6,配置arp_ignore=1 ,arp_announce=2

?????realserver2 mysql服務器rip192.168.3.8,在lo網卡上配置別名vip192.168.3.6,配置arp_ignore=1 ,arp_announce=2,創建一個數據庫mydb以表示和realserver的區別;

?

我們就延用以上lvs-dr httpd實驗的配置:

1)在realserver1 服務器上安裝數據庫,授權一個test用戶可以遠程登錄:

blob.png

2)在realserver2服務器上安裝數據庫,授權一個test用戶可以遠程登錄并創建一個mydb的數據庫:

blob.png

創建mydb數據庫:

blob.png

3)配置director調度服務器,添加3306端口的調度和80端口的調度:

blob.png

blob.png

4)測試MySQLlvs-dr類型的調度:

blob.png

5)測試httpdlvs-dr類型的調度:

blob.png

由此可以看出MySQLhttpd是分別進行調度的。

5)使用IPvsadm -C清除調度器上的調度規則。并配置防火墻規則進行調度;

blob.png

blob.png

blob.png

6)測試防火墻標記調度:

blob.png

blob.png

使用ipvsadm -S 保存ipvsadm規則到/etc/sysconig/ipvsadm

????ipvsadm ?-S ?> /etc/sysconfig/ipvsadm

使用ipvsadm -R 重載ipvsadm規則

????ipvsadm -R ?< /etc/sysconfig/ipvsadm?

 

原創文章,作者:zhengyibo,如若轉載,請注明出處:http://www.www58058.com/59607

(3)
zhengyibozhengyibo
上一篇 2016-11-18 18:19
下一篇 2016-11-18 18:43

相關推薦

  • cnetos 6.7 內核編譯

    簡介     Linux內核的體積結構是單內核的,但充分借鑒了微內核設計體系的優點,為內核引入模塊化機制,使得雖然是單內核、但工作在模塊化的方式下、并且這個模塊可以動態裝載或卸載;Linux負責管理系統的進程、內存、設備驅動程序、文件和網絡系統,決定著系統的性能和穩定性。如是我們在了解Linux內核的基礎上根據自己的需…

    Linux干貨 2016-02-27
  • 馬哥教育網絡班21期-第1周課程練習

    1、  描述計算機的組成及其功能。 計算機由硬件系統和軟件系統兩部分組成。硬件系統由運算器,控制器,存儲器,輸入設備和輸出設備組成.     運算器:計算機中進行算術運算和邏輯運算的部件。     控制器:計算機的控制中心。協調和指揮計算機系統的操作。  &n…

    Linux干貨 2016-07-12
  • Linux創建CA和申請認證

    Linux創建CA和申請認證 背景: 在學習Linux運維中,學習到了CA的創建和申請認證,為了加深對CA的理解,這里做一個創建CA和申請認證的實驗并記錄下來供以后回顧。 介紹: 什么是CA認證? 電子商務認證授權機構(CA, Certificate Authority),也稱為電子商務認證中心,是負責發放和管理數字證書的權威機構,并作為電子商務交易中受信任…

    2017-09-09
  • shell腳本編程基礎

    ★ 編程基礎★ 腳本基本格式★ 變量★ 運算★ 條件測試★ 配置用戶環境一.編程基礎  程序:指令+數據  程序編程風格:      過程式:以指令為中心,數據服務于指令      對象式:以數據為中心,指令服務于數據  shell程序:提供了編程能力,解釋執行&nbs…

    Linux干貨 2017-03-28
  • 磁盤管理及shell腳本編程練習

    1、創建一個10G分區,并格式為ext4文件系統 a)?要求其block大小為2048,預留空間百分比為2,卷標為MYDATA,默認掛載屬性包含acl; ~]# mke2fs –t ext4 –b 2048 –m 2 –L MYDATA? /dev/sda3 b)?掛載至/data/madata目錄,要求掛載時禁止程序自動運行,且不更新文件的訪問時間戳; ~…

    2017-11-15
  • 【招聘福利】深圳/系統運維工程師/薪資彈性,可面談

    深圳市鑫順諾科技有限公司 有意向的學員,請聯系magedu-小助手QQ:1522609717 職位職能: 系統運維工程師崗位職責:1、公司日常機房網絡和辦公室網絡管理調優、日常辦公電腦維護。2、管理、維護網站服務器運行狀態,處理系統運行故障;3、負責服務器集群的操作系統安裝、升級、定制、部署與維護工作;4、負責服務器集群的系統監控和自動化腳本的設計與部署;5…

    Linux干貨 2015-11-06
欧美性久久久久