天天看點

雲計算及其支撐技術簡介1 雲計算概述2 雲計算支撐技術

雲計算及其支撐技術簡介

  • 1 雲計算概述
    • 1.1 雲計算定義與關鍵特征
    • 1.2 雲服務的類别
    • 1.3 典型的雲服務部署方式
  • 2 雲計算支撐技術
    • 2.1 系統虛拟化
    • 2.2 虛拟化資料總管
    • 2.3 分布式資料存儲
    • 2.4 并行計算模式
    • 2.5 使用者互動技術
    • 2.6 安全管理
    • 2.7 營運支撐管理

說明:本文摘自中國電子技術标準化研究院于2014年7月釋出的《雲計算标準化白皮書》,感覺寫的挺好,特此轉載。 白皮書連結:這裡

1 雲計算概述

1.1 雲計算定義與關鍵特征

雲計算定義: 雲計算是一種将可伸縮、彈性、共享的實體和虛拟資源池以按需自服務的方式供應和管理,并提供網絡通路的模式。雲計算模式由關鍵特征、雲計算角色和活動、雲能力類型和雲服務分類、雲部署模型、雲計算共同關注點組成。

雲計算的關鍵特征: 包括五個方面,具體如下:

  • 廣泛的網絡接入: 可通過網絡,采用标準機制通路實體和虛拟資源的特性。這裡的标準機制有助于通過異構使用者平台使用資源。這個關鍵特

    性強調雲計算使使用者更友善地通路實體和虛拟資源:使用者可以從任何網絡覆寫的地方,使用各種用戶端裝置,包括行動電話、平闆、筆記本和工作站通路資源。

  • 可測量的服務: 通過可計量的服務傳遞使得服務使用情況可監控、控制、彙報和計費的特性。通過該特性,可優化并驗證已傳遞的雲服務。這個關鍵特性強調客戶隻需對使用的資源付費。從客戶的角度看,雲計算為使用者帶來了價值,将使用者從低效率和低資産使用率的業務模式轉變到高效率模式。
  • 多租戶: 通過對實體或虛拟資源的配置設定保證多個租戶以及他們的計算和資料彼此隔離和不可通路的特性。在典型的多租戶環境下,組成租戶的一組雲服務使用者同時也屬于一個雲服務客戶組織。在某些情況下,尤其在公有雲和社群雲部署模型下,一組雲服務使用者由來自不同客戶的使用者組成。一個雲服務客戶組織和一個雲服務提供者之間也可能存在多個不同的租賃關系。這些不同的租賃關系代表雲服務客戶組織内的不同小組。
  • 按需自服務: 雲服務客戶能根據需要自動,或通過與雲服務提供者的最少互動,配置計算能力的特性。這個關鍵特性強調雲計算為使用者降低了時間成本和操作成本,因為該特性賦予了使用者無需額外的人工互動,就能夠在需要的時候做需要做的事情的能力。
  • 快速的彈性和可擴充性: 實體或虛拟資源能夠快速、彈性,有時是自動化地供應,以達到快速增減資源目的的特性。對雲服務客戶來說,可供應的實體或虛拟資源無限多,可在任何時間購買任何數量的資源,購買量僅僅受服務協定的限制。這個關鍵特性強調雲計算意味着使用者無需再為資源量和容量規劃擔心。對客戶來說,如果需要新資源,新資源就能立刻自動地獲得。資源本身是無限的,資源的供應隻受服務協定的限制。
  • 資源池化: 将雲服務提供者的實體或虛拟資源進行內建,以便服務于一個或多個雲服務客戶的特性。這個關鍵特性強調雲服務提供者既能支援多租戶,又通過抽象對客戶屏蔽了處理複雜性。對客戶來說,他們僅僅知道服務在正常工作,但是他們通常并不知道資源是如何提供或分布的。資源池化将原本屬于客戶的部分工作,例如維護工作,移交給了提供者。需要指出的是,即使存在一定的抽象級别,使用者仍然能夠在某個更高的抽象級别指定資源位置。

1.2 雲服務的類别

雲服務類别是擁有相同品質集的一組雲服務。一種雲服務類别可對應一種或多種雲能力類型。典型的雲服務類别包括:

  • 通訊即服務(CaaS): 為雲服務客戶提供實時互動與協作能力的一種雲服務類别。
  • 計算即服務(CompaaS): 為雲服務客戶提供部署和運作軟體所需的配置和使用計算資源能力的一種雲服務類别。
  • 資料存儲即服務(DSaaS): 為雲服務客戶提供配置和使用資料存儲相關能力的一種雲服務類别。
  • 基礎設施即服務(IaaS): 為雲服務客戶提供雲能力類型中的基礎設施能力類型的一種雲服務類别。
  • 網絡即服務(NaaS): 為雲服務客戶提供傳輸連接配接和相關網絡能力的一種雲服務類别。
  • 平台即服務(PaaS): 為雲服務客戶提供雲能力類型中的平台能力類型的一種雲服務類别。
  • 軟體即服務(SaaS): 為雲服務客戶提供雲能力類型中的應用能力類型的一種雲服務類别。

1.3 典型的雲服務部署方式

雲計算有四類典型的部署模式:“公有雲”、“私有雲”、“社群雲”和“混合雲”。具體描述如下:

  • 公有雲: 雲基礎設施對公衆或某個很大的業界群組提供雲服務。
  • 私有雲: 雲基礎設施特定為某個組織運作服務,可以是該組織或某個第三方負責管理,可以是場内服務(on-premises),也可以是場外服務(off-premises)。
  • 社群雲: 雲基礎設施由若幹個組織分享,以支援某個特定的社群。社群是指有共同訴求和追求的團體(例如使命、安全要求、政策或合規性考慮等)。和私有雲類似,社群雲可以是該組織或某個第三方負責管理,可以是場内服務,也可以是場外服務。
  • 混合雲: 雲基礎設施由兩個或多個雲(私有雲、社群雲或公有雲)組成,獨立存在,但是通過标準的或私有的技術綁定在一起,這些技術可促成資料和應用的可移植性(例如用于雲之間負載分擔的 cloud bursting 技術)。

2 雲計算支撐技術

2.1 系統虛拟化

系統虛拟化是指将一台實體計算機系統虛拟化為一台或多台虛拟計算機系統。

每個虛拟計算機系統(簡稱虛拟機)都擁有自己的虛拟硬體(如 CPU、記憶體和裝置等),來提供一個獨立的虛拟機執行環境。通過虛拟化層的模拟,虛拟機中的作業系統認為自己仍然是獨占一個系統在運作。每個虛拟機中的作業系統可以完全不同,并且它們的執行環境是完全獨立的。這個虛拟化層被稱為虛拟機監控器(Virtual Machine Monitor,簡稱 VMM)。系統虛拟化的體系結構如圖1 所示。

雲計算及其支撐技術簡介1 雲計算概述2 雲計算支撐技術

圖1 系統虛拟化體系結構圖

虛拟機可以看作是實體機的一種高效隔離的複制。

虛拟機具有三個典型特征:同質、高效和資源受控。同質指的是虛拟機運作環境和實體機環境在本質上需求是相同的,但是在表現上有一些差異。高效指的是虛拟機中運作的軟體需要具有接近在實體機上直接運作的性能。資源受控指的是 VMM 需要對系統資源有完全控制能力和管理權限,包括資源的配置設定、監控和回收。

VMM 對實體資源的虛拟可以歸結為三個主要任務:CPU 虛拟化、記憶體虛拟化和 I/O 虛拟化

。CPU 虛拟化是 VMM 中最核心的部分,決定了記憶體虛拟化和 I/O虛拟化的正确實作。CPU 虛拟化包括指令的模拟、中斷和異常的模拟及注入和對稱多處理器技術的模拟。記憶體虛拟化一方面解決了 VMM 和客戶機作業系統對實體記憶體認識上的差異,另一方面在虛拟機之間、虛拟機和 VMM 之間進行隔離,防止某個虛拟機内部的活動影響到其他的虛拟機甚至是 VMM 本身,進而造成安全上的漏洞。I/O 虛拟化主要是為了滿足多個客戶機作業系統對外圍裝置的通路需求,通過通路截獲、裝置模拟和裝置共享等方式複用外設。

按照 VMM 提供的虛拟平台類型可以将 VMM 分為兩類:完全虛拟化和半虛拟化

。完全虛拟化下,VMM 虛拟的是現實存在的平台。在客戶機作業系統看來,虛拟的平台和現實的平台是一樣的,客戶機作業系統覺察不到運作在一個虛拟平台上。這樣的虛拟平台無需對現有的作業系統做任何修改。半虛拟化下,VMM虛拟的平台在現實中是不存在的。這樣的虛拟平台需要對客戶機作業系統進行修改使之适應虛拟環境。作業系統知道自己運作在虛拟平台上,并且會主動去适應。

目前

主流的虛拟化技術實作結構可以分為三類:Hypervisor 模型、宿主模型和混合模型

。在 Hypervisor 模型中,VMM 可以看作是一個擴充了虛拟化功能的作業系統,對底層硬體提供實體資源的管理功能,對上層的客戶機作業系統提供虛拟環境的建立和管理功能。與 Hypervisor 不同,宿主模型中,VMM 作為宿主作業系統獨立的核心子產品。實體資源由主控端作業系統管理,VMM 提供虛拟化管理。宿主模型和 Hypervisor 模型的優缺點恰好相反。宿主模型的最大優點是可以充分利用現有作業系統的裝置驅動程式以及其它功能,缺點是虛拟化效率較低,安全性取決于宿主作業系統。而 Hypervisor 模型虛拟化效率高、安全,但是需要自行開發裝置驅動和其它一些功能。混合模型內建了上述兩類模型的優點。混合模型中,VMM 讓出大部分 I/O 裝置的控制權,将它們交由一個運作在特權虛拟機中的特權作業系統來控制。是以,混合模型下 CPU 和記憶體的虛拟化由 VMM 負責,而 I/O 虛拟化由 VMM 和特權作業系統共同合作完成。

2.2 虛拟化資料總管

虛拟化資源是雲計算中最重要的組成部分之一,對虛拟化資源的管理水準直接影響雲計算的可用性、可靠性和安全性。

虛拟化資源管理主要包括對虛拟化資源的監控、配置設定和排程。

雲資源池中應用的需求不斷改變,線上服務的請求經常不可預測,這種動态的環境要求雲計算的資料中心或計算中心能夠對各類資源進行靈活、快速、動态的按需排程。雲計算中的虛拟化資源與以往的網絡資源相比,有以下特征:(1) 數量更為巨大;(2) 分布更為離散;(3) 排程更為頻繁;(4) 安全性要求更高。

通過對虛拟化資源的特征分析以及目前網絡資源管理的現狀,确定虛拟化資源的管理應該滿足以下準則:(1) 所有虛拟化資源都是可監控和可管理的;(2) 請求的參數是可監控的,監控結果可以被證明;(3) 通過網絡标簽可以對虛拟化資源進行配置設定和排程;(4) 資源能高效地按需提供服務;(5) 資源具有更高的安全性。

2.3 分布式資料存儲

分布式資料存儲技術包含非結構化資料存儲和結構化資料存儲。其中,非結構化資料存儲主要采用檔案存儲和對象存儲技術,而結構化資料存儲主要采用分布式資料庫技術,特别是 NoSQL 資料庫。下面分别闡述這三方面的技術:

(1)分布式檔案系統

為了存儲和管理雲計算中的海量資料,Google 提出分布式檔案系統 GFS(Google File System)。GFS 成為分布式檔案系統的典型案例。Apache Hadoop項目的 HDFS 實作了 GFS 的開源版本。

Google GFS 是一個大規模分布式檔案存儲系統,但是和傳統分布式檔案存儲系統不同的是,

GFS 在設計之初就考慮到雲計算環境的典型特點:結點由廉價不可靠 PC 建構,因而硬體失敗是一種常态而非特例;資料規模很大,因而相應的檔案 I/O 機關要重新設計;大部分資料更新操作為資料追加,如何提高資料追加的性能成為性能優化的關鍵。

相應的 GFS 在設計上有以下特點:

  • 利用多副本自動複制技術,用軟體的可靠性來彌補硬體可靠性的不足。
  • 将中繼資料和使用者資料分開,用單點或少量的中繼資料伺服器進行中繼資料管理,大量的使用者資料結點存儲分塊的使用者資料,規模可以達到 PB 級。
  • 面向一次寫多次讀的資料處理應用,将存儲與計算結合在一起,利用分布式檔案系統中資料的位置相關性進行高效的并行計算。

GFS/HDFS 非常适于進行以大檔案形式存儲的海量資料的并行處理,但是,當檔案系統的檔案數量持續上升時,中繼資料伺服器的可擴充性面臨極限。以 HDFS為例,隻能支援千萬級的檔案數量,如果用于存儲網際網路應用的小檔案則有困難。在這種應用場景面前,分布式對象存儲系統更為有效。

(2)分布式對象存儲系統

與分布式檔案系統不同,分布式對象存儲系統不包含樹狀名稱空間(Namespace),是以在數量增長時可以更有效地将中繼資料平衡地分布到多個結點上,提供理論上無限的可擴充性。

對象存儲系統是傳統的塊裝置的延伸,具有更高的“智能”:上層通過對象 ID 來通路對象,而不需要了解對象的具體空間分布情況。相對于分布式檔案系統,在支撐網際網路服務時,對象存儲系統具有如下優勢:

  • 相對于檔案系統的複雜 API,分布式對象存儲系統僅提供基于對象的建立、讀取、更新、删除的簡單接口,在使用時更友善而且語義沒有歧義。
  • 對象分布在一個平坦的空間中,而非檔案系統那樣的名稱空間之中,這提供了很大的管理靈活性:既可以在所有對象之上建構樹狀邏輯結構;也可以直接用平坦的空間;還可以隻在部分對象之上建構樹狀邏輯結構;甚至可以在同一組對象之上建構多個名稱空間。Amazon 的 S3 就屬于對象存儲服務。S3 通過基于 Http REST 的接口進行資料通路,按照用量和流量進行計費,其他的雲服務商也都提供了類似的接口服務。很多網際網路服務商,如 Facebook 等也都建構了對象存儲系統,用于存儲圖檔、照片等小型檔案。

    (3)分布式資料庫管理系統

    傳統的單機資料庫采用“向上擴充”的思路來解決計算能力和存儲能力的問題,即增加 CPU 處理能力、記憶體和磁盤數量。這種系統目前最大能夠支援幾個 TB 資料的存儲和處理,遠不能滿足實際需求。采用叢集設計的分布式資料庫逐漸成為主流。傳統的叢集資料庫的解決方案大體分為以下兩類:

  • Share-Everything(Share-Something)。資料庫結點之間共享資源,例如磁盤、緩存等。當結點數量增大時,結點之間的通信将成為瓶頸;而且處理各個結點對資料的通路控制也為事務處理帶來麻煩。
  • Share-Nothing。所有的資料庫伺服器之間并不共享任何資訊。當任意一個結點接到查詢任務時,都會将任務分解到其他所有的結點上面,每個結點單獨處理并傳回結果。但由于每個結點容納的資料和規模并不相同,是以如何保證一個查詢能夠被均衡地配置設定到叢集中成為一個關鍵問題。同時,結點在運算時可能從其他結點擷取資料,這同樣也延長了資料處理時間。在處理資料更新請求時,Share-Nothing 資料庫需要保證

    多結點的資料一緻性,需要快速準确定位到資料所在結點。

雲計算環境下,大部分應用不需要支援完整的 SQL 語義,而隻需要Key-Value形式或略複雜的查詢語義。在這樣的背景下,進一步簡化的各種NoSQL資料庫成為雲計算中的結構化資料存儲的重要技術。

Google 的 BigTable 是一個典型的分布式結構化資料存儲系統。在表中,資料是以“列族”為機關組織的,列族用一個單一的鍵值作為索引,通過這個鍵值,資料和對資料的操作都可以被分布到多個結點上進行。

在開源社群中,Apache HBase 使用了和 BigTable 類似的結構,基于 Hadoop平台提供 BigTable 的資料模型,而Cassandra 則采用了亞馬遜 Dynamo 的基于DHT 的完全分布式結構,實作更好的可擴充性。

2.4 并行計算模式

并行計算模型是提高海量資料處理效率的常用方法。常用的并行計算模型主要包括兩類:一類是面向高性能計算的,如 MPI (Message Passing Interface)模型;另一類是面向網際網路資料密集型應用的并行程式設計模型,如 Google 的MapReduce 模型、微軟的 Dryad 模型。第二類并行計算模型更适用于雲計算環境。

雲計算下把海量資料分布到多個結點(通常是廉價不可靠的 PC 機)上,将計算并行化,利用多機的計算資源,加快資料處理的速度。

雲計算下的并行處理需要考慮以下關鍵問題:1)任務劃分,使得任務能更加優化的被分解和并行執行;2)任務排程,操作盡量本地化,以保證在網絡資源有限的情況下,最大程度地将計算任務在本地執行,減少通信開銷;3)自動容錯處理機制,保證在結點失效的情況下處理任務仍然能夠正确地執行。下面分别闡述這三方面内容:

  • 任務劃分:

    在 MapReduce 或 Dryad 中,資料以塊的形式存儲在叢集的各個結點上,每個計算任務隻需處理一部分資料,這樣自然地實作了海量資料的并行處理。

    這種簡單的根據存儲位置進行任務劃分的方式,隻适用于不存在資料依賴關系的計算。而對于存在依賴關系的計算,MapReduce 将複雜的計算轉化為一系列單一的 Map/Reduce 計算,串聯起來完成多個 Map/Reduce 任務來實作複雜計算。轉化有兩者方式:手工轉化和利用 Pig、Hive 等工具進行自動轉化。Dyrad 将存在依賴關系的複雜計算表示為一個有向無環圖,利用圖論對計算自動進行依賴性分析和優化,最後轉化為高效的子任務執行。
  • 任務排程:

    一個叢集系統的存儲和計算資源有兩種組織方式:一是将存儲和計算資源部署在相同結點上;另一種是存儲和計算結點分開部署。

    MapReduce 和 Dryad 采用前者,MPI 采用後者。MapReduce 和 Dryad 在排程任務時認為“移動計算比移動資料更合算”,優先把計算任務排程到資料所在的結點或者就近的結點,這樣在進行計算時,大部分的輸入資料都能從本地讀取,減少了網絡帶寬的消耗,提高了整個系統的吞吐量。另外,MapReduce 對于由于各種原因(例如硬碟出錯)造成執行非常慢的子任務采用了備用任務的機制,當MapReduce 操作接近完成時,排程備用任務程序來執行剩下的執行非常慢的子任務。
  • 自動容錯處理機制:

    常用恢複機制有兩類:任務重做(Task Re-execute)和檢查點(Checkpoint)復原方式。

    這兩種機制各有優缺點,前者實作非常簡單,但是重做的代價比較大;後者實作較複雜,需要周期性地記錄所有程序狀态,但是恢複較快。MapReduce 和 Dryad 主要采用任務重做的方式來處理結點的失效,而 MPI 通常采用檢查點復原的機制。

2.5 使用者互動技術

随着雲計算的逐漸普及,浏覽器已經不僅僅是一個用戶端的軟體,而逐漸演變為承載着網際網路的平台。浏覽器與雲計算的整合技術主要展現在兩個方面:浏覽器網絡化與浏覽器雲服務。

國内各家浏覽器都将網絡化作為其功能的标配之一,主要功能展現在使用者可以登入浏覽器,并通過自己的帳号将個性化資料同步到服務端。使用者在任何地方,隻需要登入自己的帳号,就能夠同步更新所有的個性内容,包括浏覽器選項配置、收藏夾、網址記錄、智能填表、密碼儲存等。

目前的浏覽器雲服務主要展現在 P2P 下載下傳、視訊加速等單獨的用戶端軟體中,主要的應用研究方向包括:基于浏覽器的 P2P 下載下傳、視訊加速、分布式計算、多任務協同工作等。在多任務協同工作方面,AJAX(Asynchronous JavaScript and XML,異步 JavaScript 和 XML)是一種建立互動式網頁應用的網頁開發技術,改變了傳統網頁的互動方式,改進了互動體驗。

2.6 安全管理

安全問題是使用者是否選擇雲計算的主要顧慮之一。傳統集中式管理方式下也有安全問題,雲計算的多租戶、分布性、對網絡和服務提供者的依賴性,為安全問題帶來新的挑戰。其中,主要的資料安全問題和風險包括:

(1)資料存儲及通路控制:包括如何有效存儲資料以避免資料丢失或損壞,如何避免資料被非法通路和篡改,如何對多租戶應用進行資料隔離,如何避免資料服務被阻塞,如何確定雲端退役(at rest)資料的妥善保管或銷毀等等。

(2)資料傳輸保護:包括如何避免資料被竊取或攻擊,如何保證資料在分布式應用中有效傳遞等。

(3)資料隐私及敏感資訊保護:包括如何保護資料所有權、并可根據需要提供給受信方使用,如何将個人身份資訊及敏感資料挪到雲端使用等。

(4)資料可用性:包括如何提供穩定可靠的資料服務以保證業務的持續性,如何進行有效的資料容災及恢複等。

(5)依從性管理:包括如何保證資料服務及管理符合法律及政策的要求等。

相應的資料安全管理技術包括:

(1)資料保護及隐私(Data Protection and Privacy):包括虛拟鏡像安全、資料加密及解密、資料驗證、密鑰管理、資料恢複、雲遷移的資料安全等。

(2)身份及通路管理(Identity and Access Management,簡稱 IAM):包括身份驗證、目錄服務、聯邦身份鑒别/單點登陸(Single Sign on,簡稱 SSO)、個人身份資訊保護、安全斷言置智語言、虛拟資源通路、多租用資料授權、基于角色的資料通路、雲防火牆技術等。

(3)資料傳輸(Data Transportation):包括傳輸加密及解密、密鑰管理、信任管理等。

(4)可用性管理(Availability Management):包括單點失敗(Single Point of Failure,簡稱 SPoF)、主機防攻擊、容災保護等。

(5)日志管理(Log Management):包括日志系統、可用性監控、流量監控、資料完整性監控、網絡入侵監控等。

(6)審計管理(Audit Management):包括審計信任管理、審計資料加密等。

(7)依從性管理(Compliance Management):包括確定資料存儲和使用等符合相關的風險管理和安全管理的規定要求。

2.7 營運支撐管理

下面從雲的部署、負載管理和監控、計量計費、服務水準協定(Service Level Agreement,簡稱 SLA)、能效評測這五個方面分别闡述雲的營運管理。

(1)雲的部署

雲的部署包括兩個方面:雲本身的部署和應用的部署。如前所述,雲一方面規模巨大,另一方面要求很好的服務健壯性、可擴充性和安全性。是以,雲的部署是一個系統性的工程,涉及到機房建設、網絡優化、硬體選型、軟體系統開發和測試、運維等各個方面。為了保證服務的健壯性,需要将雲以一定備援部署在不同地域的若幹機房。為了應對規模的不斷增長,雲要具備便利的、近乎無限的擴充能力,因而從資料存儲層、應用業務層到接入層都需要采用相應的措施。為了保護雲及其應用的安全,需要建立起各個層次的資訊安全機制。除此之外,還需要部署一些輔助的子系統,如管理資訊系統(MIS)、資料統計系統、安全系統、監控和計費系統等,他們幫助雲的部署和營運管理達到高度自動化和智能化的程度。

雲本身的部署對雲的使用者來說是透明的。一個設計良好的雲,應使得應用的部署對使用者也是透明和便利的。這依賴雲提供部署工具(或 API)幫助使用者自動完成應用的部署。一個完整的部署流程通常包括注冊、上傳、部署和釋出四個過程。

(2)負載管理和監控

雲的負載管理和監控是一種大規模叢集的負載管理和監控技術。在單個結點粒度,它需要能夠實時地監控叢集中每個結點的負載狀态,報告負載的異常和結點故障,對出現過載或故障的結點采取既定的預案。在叢集整體粒度,通過對單個結點、單個子系統的資訊進行彙總和計算,近乎實時地得到叢集的整

體負載和監控資訊,為運維、排程和成本提供決策。與傳統的叢集負載管理和監控相比,雲對負載管理和監控有新的要求:首先,新增了應用粒度,即以應用為粒度來彙總和計算該應用的負載和監控資訊,并以應用為粒度進行負載管理。應用粒度是可以再細分的,在下面的“計量計費”一節中會提到,粒度甚

至精細到 API 調用的粒度。其次,監控資訊的展示和查詢現在要作為一項服務提供給使用者,而不僅僅是少量的專業叢集運維人員,這需要高性能的資料流分析處理平台的支援。

(3)計量計費

雲的主要商業營運模式是采取按量計費的收費方式,即便對于私有雲,其營運企業或組織也可能有按不同成本中心進行成本核算的需求。為了精确的度量“用了多少”,就需要準确的、及時的計算雲上的每一個應用服務使用了多少資源,這稱為服務計量。

服務計量是一個雲的支撐子系統,它獨立于具體的應用服務,像監控一樣能夠在背景自動地統計和計算每一個應用在一定時間點的資源使用情況。對于資源的衡量次元主要是:應用的上行(in)/下行(out)流量、外部請求響應次數、執行請求所花費的 CPU 時間、臨時和永久資料存儲所占據的存儲空間、内部服

務 API 調用次數等。也可認為,任何應用使用或消耗的雲的資源,隻要可以被準确的量化,就可以作為一種次元來計量。實踐中,計量通常既可以用機關時間内資源使用的多少來衡量,如每天多少位元組流量;也可以用累積的總使用量來衡量,如資料所占用的存儲空間位元組大小。

在計量的基礎上,選取若幹合适的次元組合,制定相應的計費政策,就能夠進行計費。計費子系統将計量子系統的輸出作為輸入,并将計費結果寫入帳号子系統的财務資訊相關子產品,完成計費。計費子系統還産生可供審計和查詢的計費資料。

(4)SLA

SLA 是在一定開銷下為保障服務的性能和可靠性,服務提供商與使用者間定義的一種雙方認可的協定。對于雲服務而言,SLA 是必不可缺的,因為使用者對雲服務的性能和可靠性有不同的要求。從使用者的角度而言,也需要從雲服務提供商處得到具有法律效力的承諾,來保證支付費用之後得到應有的服務品質。從目前的實踐看,國外的大型雲服務提供商均提供了 SLA。

一個完整的 SLA 同時也是一個具有法律效力的合同檔案,它包括所涉及的當事人、協定條款、違約的處罰、費用和仲裁機構等。當事人通常是雲服務提供商與使用者。協定條款包含對服務品質的定義和承諾。服務品質一般包括性能、穩定性等名額,如月均穩定性名額、響應時間、故障解決時間等。實際上,SLA的保障是以一系列服務水準目标(Service Level Object,簡稱 SLO)的形式定義的。SLO 是一個或多個有限定的服務元件的測量的組合。一個 SLO 被實作是指那些有限定的元件的測量值在限定範圍裡。通過前述的對雲及應用的監控和計

量,可以計算哪些 SLO 被實作或未被實作,如果一個 SLO 未被實作,即 SLA 的承諾未能履行,就可以按照“違約的處罰”對當事人(一般是雲服務提供商)進行處罰。通常采取的方法是減免使用者已繳納或将繳納的費用。

(5)能效評測

雲計算提出的初衷是将資源和資料盡可能放在雲中,通過資源共享、虛拟化技術和按需使用的方式提高資源使用率,降低能源消耗。但是在實際應用中,大型資料中心的散熱問題造成了大量的能源消耗。如何有效降低能源消耗建構綠色資料中心成為雲服務提供商迫切需要解決的問題之一。

雲計算資料中心的能耗測試評價按照不同的次元有不同測試手段和方法。針對傳統的資料中心它有顯性評價體系和隐性評價體系兩個方面。

顯性的能耗測試評價可以參照傳統資料中心的評價體系,具體包括:能源效率名額、IT 裝置的能效比、IT 裝置的工作溫度和濕度範圍、機房基礎設施的使用率名額。能源效率名額用于評估一個資料中心使用的能源中有多少用于生産,還有多少被浪費。在這方面,綠色網格組織的電能使用率 (Power Usage Effectiveness,簡稱 PUE)名額影響力較大。PUE 值越小,意味着機房的節能性越好。目前,國内絕大多數的資料中心 PUE 值為 3 左右,而歐美一些國家資料中心的 PUE 平均值為 2 左右。

隐性能耗測試評價包括雲計算服務模式節省了多少社會資源,由于客戶需求的不同,雲吞吐量的變化節省了多少 IT 裝置的投資和資源的重複建設。這些的測試評價很多時候是不能量化或者不能夠進行精準地評價。為了實作對資料中心能源的自動調節,滿足相關的節能要求,一些 IT 廠商和标準化組織紛紛推出節能技術及能耗檢測工具,如惠普公司的動态功率調整技術(Dynamic Power Saver,簡稱 DPS)、IBM 的 Provisioning 軟體。

繼續閱讀