天天看點

跨叢集服務 實作Kubernetes應用的高可用

我們在進行生産環境部署時得到的一個明确的需求,是Kubernetes使用者希望服務部署能夠zone、跨區域、跨叢集甚至跨雲邊界(譯者:如跨雲供應商)。相比單叢集多zone部署,跨叢集服務提供按地域分布,支援混合雲、多雲場景,提升高可用等級。客戶希望服務能夠跨一到多個叢集(可能是本地或者遠端叢集),并希望這些叢集無論内部或外部都有一緻穩定的連接配接。

在Kubernetes 1.3版本,我們希望降低跨叢集跨地區服務部署相關的管理和營運難度。本文 介紹如何實作此目标。

注意:雖然本文示例使用谷歌容器引擎(GKE)來提供Kubernetes叢集,您可以在任何的其他環境部署Kubernetes。

我們正式開始。第一步是在谷歌的四個雲平台地區通過GKE建立Kubernetes叢集。

  • asia-east1-b
  • europe-west1-b
  • us-east1-b
  • us-central1-b

我們通過下面的指令建立叢集:

gcloud container clusters create gce-asia-east1 \
--scopes cloud-platform \
--zone asia-east1-b
gcloud container clusters create gce-europe-west1 \
--scopes cloud-platform \
--zone=europe-west1-b
gcloud container clusters create gce-us-east1 \
--scopes cloud-platform \
--zone=us-east1-b
gcloud container clusters create gce-us-central1 \
--scopes cloud-platform \
--zone=us-central1-b      

驗證建立的叢集:

gcloud container clusters list 
NAME ZONE MASTER_VERSION MASTER_IP NUM_NODES STATUS 
gce-asia-east1 asia-east1-b 1.2.4 104.XXX.XXX.XXX 3 RUNNING
gce-europe-west1 europe-west1-b 1.2.4 130.XXX.XX.XX 3 RUNNING
gce-us-central1 us-central1-b 1.2.4 104.XXX.XXX.XX 3 RUNNING 
gce-us-east1 us-east1-b 1.2.4 104.XXX.XX.XXX 3 RUNNING      

下一步是起動叢集并在建立的其中一個叢集中部署聯邦控制子產品(Control Plane)。您可以參考和依照Kelsey Hightower的示例進行這步配置。

聯邦服務

從聯邦API擷取資訊,是以您可以通過聯邦API制定服務屬性。

當服務建立後,聯邦服務自動進行如下操作:

  1. 在聯邦中注冊的所有Kubernetes叢集中建立服務;
  2. 監控服務碎片(以及它們所在叢集)的健康狀況;
  3. 在公共DNS提供商上面建立 DNS記錄(如谷歌Cloud DNS,或者AWS Route 53),以此确定你的服務用戶端能夠在任何時候無縫的獲得相關的健康服務終端,即使當叢集,可用區或者地區出現服務中斷的情況時。

在注冊到聯邦的Kubernetes叢集中的服務用戶端,當聯邦服務在本地叢集碎片工作正常時,會優先使用本地服務碎片,否則會在最近的其他叢集中選取健康的服務碎片。

Kubernetes叢集聯邦能夠聯合不同的雲供應商(比如GCP、AWS)以及私有雲(如OpenStack)。您隻需在相應的雲供應商和位置建立您的叢集,并且将每個叢集的API Server位址和證書資訊注冊到聯邦叢集中。

在我們的示例中,我們在四個區域建立了叢集,并且在其中的一個叢集中部署了聯邦控制子產品,我們會用這個環境來部署我們的服務。具體請參考下圖。

建立聯邦服務

我們先檢視聯邦中所有注冊好的叢集:

kubectl --context=federation-cluster get clusters
NAME STATUS VERSION AGE
gce-asia-east1 Ready 1m
gce-europe-west1 Ready 57s
gce-us-central1 Ready 47s
gce-us-east1 Ready 34s      

建立聯邦服務:

kubectl --context=federation-cluster create -f services/nginx.yaml      

--context=federation-cluster

參數通知kubectl把帶相關證書資訊的請求送出至聯邦API伺服器。聯邦服務會自動在聯邦中所有叢集建立相應的Kubernetes服務。

你可以通過檢查每一個叢集中的服務進行驗證,比如:

kubectl --context=gce-asia-east1a get svc nginx
NAME CLUSTER-IP EXTERNAL-IP PORT(S) AGE
nginx 10.63.250.98 104.199.136.89 80/TCP 9m      

上面的指令假設你有一個名為

gce-asia-east1a

的kubectl的上下文設定,并且你有叢集部署在這個區(zone)。Kubernetes服務的名字和名空間自動與你上面建立的叢集服務一緻。

聯邦服務狀态會實時展現Kubernetes對應的服務狀态,例如:

kubectl --context=federation-cluster describe services nginx
Name: nginx
Namespace: default Labels: run=nginx
Selector: run=nginx
Type: LoadBalancer
IP: LoadBalancer Ingress: 104.XXX.XX.XXX, 104.XXX.XX.XXX, 104.XXX.XX.XXX, 104.XXX.XXX.XX
Port: http 80/TCP
Endpoints: <none> Session Affinity: None No events.      

聯邦服務的

LoadBalancer Ingress

位址會彙總所有注冊的Kubernetes叢集服務的

LoadBalancer Ingress

位址。為了讓同一聯邦服務在不通叢集之間以及不同雲供應商之間的網絡正确工作,你的服務需要有外部可見的IP位址,比如Loadbalancer是常見的服務類型。

請注意我們還沒有部署任何背景Pod來接收指向這些位址的網絡流量(比如服務終端),是以此時聯邦服務還不會認為這些服務碎片是健康的,是以聯邦服務對應的DNS記錄也尚未建立。

增加背景 Pod

為了渲染底層服務碎片的健康狀況,我們需要為服務增加背景Pod。目前需要通過直接操作底層叢集的API Server來完成(為節省您的時間,未來我們可以通過一條指令在聯邦伺服器中建立)。例如我們在底層叢集中建立背景Pod:

for CLUSTER in asia-east1-a europe-west1-a us-east1-a us-central1-a
do
kubectl --context=$CLUSTER run nginx --image=nginx:1.11.1-alpine --port=80 done      

驗證公共DNS記錄

一旦Pod開始成功啟動并開始監聽連接配接,每個叢集(通過健康檢查)會彙報服務的健康終端至叢集聯邦。叢集聯邦會依次認為這些服務碎片是健康的,并且建立相應的公共DNS記錄。你可以使用你喜歡的DNS供應商的接口來驗證。比如,如果你使用谷歌Cloud DNS配置聯邦, 你的DNS域為 ‘example.com’:

$ gcloud dns managed-zones describe example-dot-com 
creationTime: '2016-06-26T18:18:39.229Z'
description: Example domain for Kubernetes Cluster Federation
dnsName: example.com.
id: '3229332181334243121'
kind: dns#managedZone
name: example-dot-com
nameServers: - ns-cloud-a1.googledomains.com. - ns-cloud-a2.googledomains.com. - ns-cloud-a3.googledomains.com. - ns-cloud-a4.googledomains.com.
$ gcloud dns record-sets list --zone example-dot-com
NAME TYPE TTL DATA
example.com. NS 21600 ns-cloud-e1.googledomains.com., ns-cloud-e2.googledomains.com.
example.com. SOA 21600 ns-cloud-e1.googledomains.com. cloud-dns-hostmaster.google.com. 1 <a dir="ltr" href="tel:21600%203600" x-apple-data-detectors="true" x-apple-data-detectors-type="telephone" x-apple-data-detectors-result="17">21600 3600</a> 1209600 300
nginx.mynamespace.myfederation.svc.example.com. A 180 104.XXX.XXX.XXX, 130.XXX.XX.XXX, 104.XXX.XX.XXX, 104.XXX.XXX.XX
nginx.mynamespace.myfederation.svc.us-central1-a.example.com. A 180 104.XXX.XXX.XXX
nginx.mynamespace.myfederation.svc.us-central1.example.com.
nginx.mynamespace.myfederation.svc.us-central1.example.com. A 180 104.XXX.XXX.XXX, 104.XXX.XXX.XXX, 104.XXX.XXX.XXX
nginx.mynamespace.myfederation.svc.asia-east1-a.example.com. A 180 130.XXX.XX.XXX
nginx.mynamespace.myfederation.svc.asia-east1.example.com.
nginx.mynamespace.myfederation.svc.asia-east1.example.com. A 180 130.XXX.XX.XXX, 130.XXX.XX.XXX
nginx.mynamespace.myfederation.svc.europe-west1.example.com. CNAME 180 nginx.mynamespace.myfederation.svc.example.com. ... etc.       

注意:如果您使用AWS Route53來配置聯邦,你可以使用相應的AWS工具,例如:

$aws route53 list-hosted-zones

$aws route53 list-resource-record-sets --hosted-zone-id Z3ECL0L9QLOVBX      

不管您使用什麼DNS供應商, 您可以使用DNS查詢工具(例如 ‘dig’ 或者 ‘nslookup’)來檢視聯邦為您建立的DNS記錄。

從聯邦叢集内部的pod發現聯邦服務

預設情況下,Kubernetes叢集有内置的本地域名伺服器(KubeDNS),并且有智能的DNS搜尋路徑確定針對“myservice”、“myservice.mynamespace”、”bobsservice.othernamespace”等等被您運作在Pod中的的應用軟體自動擴充和解析至相應的本地叢集中的服務IP。

通過引入聯邦服務以及跨叢集服務發現,這個概念被擴充至全局,覆寫您聯邦中所有的叢集。為了利用這個擴充帶來的便利性,您隻需使用稍微不同的服務名(比如,myservice.mynamespace.myfederation)進行解析。

使用不同的DNS名同時避免了您現有的服務在您沒有做明确的配置和選擇情況下,意外的被解析到不同區(zone)或地域(region)網絡,導緻額外的網絡費用或延遲。

是以,使用我們上面的NGINX 服務,以及剛剛介紹的聯邦服務DNS名,我們構想一個示例:在可用性區域us-central1-a的叢集中的pod需要通路我們的NGINX服務。與其使用傳統的本地叢集DNS名 (“nginx.mynamespace”,自動擴充為“nginx.mynamespace.svc.cluster.local”),現在可以使用聯邦服務名“nginx.mynamespace.myfederation”。此名稱會被自動擴充和解析至我的Nginx服務最近的健康節點,無論它在世界的哪裡。如果本地叢集存在健康服務碎片,那麼本地叢集IP位址(通常是10.x.y.z)會被傳回(被叢集本地KubeDNS)。這與非聯邦服務解析完全一緻。

如果服務在本地叢集不存在(或者服務存在但本地沒有健康的背景pod),DNS查詢會自動擴充至`”nginx.mynamespace.myfederation.svc.us-central1-a.example.com”。實際的行為是查找離目前可用性區域最近的服務碎片的外部IP。該擴充被KubeDNS自動觸發執行,傳回相關的CNAME記錄。這會周遊上面示例中的DNS記錄,直到找到本地us-central1 區域聯邦服務的外部IP。

通過明确指定DNS名,直接指向非本地可用區域(AZ)和地域(region)的服務碎片,而不依賴于自動DNS擴充,是可行的。例如,

“nginx.mynamespace.myfederation.svc.europe-west1.example.com” 會被解析至位于歐洲的所有健康服務碎片,即使通過nslookup解析出的服務位于美國,并無論在美國是否有該服務的健康碎片。這對遠端監控和其它類似應用很有用。

從聯邦叢集外部發現聯邦服務

對于外部用戶端,前文描述的DNS自動擴充已不适用。外部用戶端需要指定聯邦服務的全名(FQDN),可以是區域,地域或全局名。為友善起見,最好為您的服務手工建立CNAME記錄,比如:

eu.nginx.acme.com CNAME nginx.mynamespace.myfederation.svc.europe-west1.example.com.
us.nginx.acme.com CNAME nginx.mynamespace.myfederation.svc.us-central1.example.com.
nginx.acme.com CNAME nginx.mynamespace.myfederation.svc.example.com.      

這樣您的用戶端可以一直使用左側的短名形式,并且會被自動解析到它所在大陸的最近的健康節點上。叢集聯邦會幫您處理服務的failover。

處理背景Pod和整個叢集的失敗情況

标準Kubernetes服務叢集IP已經確定無響應的Pod會被及時從服務中移除。Kubernetes聯邦叢集系統自動監控叢集以及聯邦服務所有碎片對應的終端的健康狀況,并按需增加和删除服務碎片。

因為DNS緩存造成的延遲(緩存逾時,或者聯邦服務DNS記錄TTL預設設定為三分鐘,但可以調節) 可能需要這麼長時間才能在某叢集或服務碎片出現問題時,正确将用戶端,請求failover到可用叢集上。然而,因為每個服務終端可以傳回多個ip位址,(如上面的us-central1,有三個選擇)很多用戶端會傳回其中一個可選位址。

本文轉自中文社群-

跨叢集服務 實作Kubernetes應用的高可用

繼續閱讀