天天看點

阿裡雲彈性計算技術專家樊毅偉:雲上成本優化實踐

阿裡雲彈性計算技術專家樊毅偉:雲上成本優化實踐

高效的自動化運維套件提升資源使用率,搭配多樣化的付費方式,一起助力企業成本優化。

摘要:2022 年 8 月 16 日,高效能,才經濟 | 雲上自動化運維 CloudOps 系列沙龍_第三彈正式開啟,阿裡雲彈性計算技術專家樊毅偉,為我們帶來了題為“雲上成本優化實踐”的主題分享,以下是他的演講内容整理,本篇内容主要分為五個部分:

1.   雲上成本控制的必要性

2.   付費方式與資源規格選型

3.   提升資源使用率

4.   成本管理

5.   使用者問答

01 雲上成本控制的必要性

如上圖所示,Flexera 2022 年雲狀态報告資料顯示,受訪企業認為他們雲開支裡有 32%是浪費的,高于去年的 30%。

根據中國資訊通信研究院的雲 MSP 服務發展調查報告顯示,成本優化成為企業雲管理的首要需求。雲上成本控制是很多企業面臨的難題、痛點。

雲上和雲下的成本管理體系有很大的差别。在雲下,企業對 IT 資産是一次性采購,一次性支付金額。在雲上,企業的 IT 資産變成按需索取,按量付費。

目前,企業在雲上的成本控制面臨很大的挑戰。首先,雲上成本管理需要多部門協作。比如财務/采購、技術/運維、産品/業務等團隊進行協作。各部門在協作過程中,形成實時的決策體系。因為雲資源的計費方式多種多樣,是以企業需要深度了解雲資源計費。

其次,企業需要及時的成本報告、監控體系。

最後,企業需要完成多雲場景适配。面對多雲場景,各個雲有不同的計費方式,企業需要針對性地進行适配,控制自己的成本。

企業的雲上成本控制的方法,主要分為四個子產品。第一,選擇合适的付費方式;第二,選擇合适的資源規格;第三,提升資源使用率;第四,成本分析與監控。

02 付費方式與資源規格選型

阿裡雲彈性計算技術專家樊毅偉:雲上成本優化實踐

以阿裡雲的 ECS 為例,ECS 主要有三種産品形态,分别是按量付費、包年包月、搶占式執行個體。

這三種産品形态對應了不同的産品功能,本質是經濟性、靈活性和确定性三者的平衡。

按量付費的靈活性非常高,可以随時建立、釋放、升配、降配,沒有任何限制。但它的缺點是比較貴,經濟性較差。

包年包月是預付機制,它的經濟性較好,價格便宜。但它的靈活性較差,資源跟财務綁定。搶占式執行個體的經濟性非常好,價格非常便宜,但确定性較差。

搶占式執行個體有兩個特點。

第一,比按量付費的價格更便宜,最低可以達到一折。

第二,确定性較差。它在穩定運作一小時後,随時可能被系統釋放。使用搶占式執行個體,适合無狀态的任務型場景,可以大幅降低成本。

接下來,介紹一下預留執行個體券。包年包月的資源跟财務綁定在一起,退款、降配有很多限制。按量付費的 ECS 加預留執行個體券,主要解決包年包月的靈活性問題。

當 ECS 的執行個體規格和預留執行個體券比對,按量付費的 ECS 就不會出賬,隻會收取 ECS 預留執行個體券的費用。

由于預留執行個體券是預付或鎖定時長的理念,是以它比按量付費更便宜,極大降低成本。預留執行個體券有零預付、部分預付和全預付。

按量付費的 ECS 可以每小時出賬,随時釋放,也是零預付的方式,但預留執行個體券的零預付與此不同,是指使用者購買了一定的時長,不能随時退款或退訂。當使用者承諾使用一年,每個小時付款,就必須使用一年。

部分預付是指使用者先付一部分,系統會每小時扣除剩下的金額。全預付和包年包月一樣,一次性付清所有的錢。

為了解決預留執行個體券不夠靈活的問題,阿裡雲推出了節省計劃。相比預留執行個體券,它能夠滿足 DevOps,容器化,多規格族,多地域部署等場景下,資源購買賬單抵扣需求。

節省計劃分為兩種,即通用型和 ECS 型。通用型沒有任何限制,可以直接抵扣 ECS 的按量付費賬單。ECS 型有一小部分的限制,即地域規格族的限制。與此同時,節省計劃支援多種産品,如 ECS、ECI、RDS 等等。

某電商使用者一直在用包年包月,資源需求不穩定,算力需求變化快。在升降配和退款上産生隐形成本。通過節省計劃搭配按量付費,資源随開随用,随時調整,總價穩定,切換後總成本降低 9%。

某線上教育使用者,不同時段對資源需求有不同。該使用者白天一部門使用一批資源,晚上另一部門使用另一批資源。包年包月資源有近一半時間在浪費。節省計劃搭配按量付費,跨規格族折扣權益共享,切換後總成本降低 42%。

某遊戲使用者對彈性要求較高,資源池必須基于按量付費建構,導緻按量付費的費用非常高。該使用者直接購買節省計劃,無需任何改造,總成本直接降低 56%。資源保障側搭配容量預留,無費用增加,按量建立成功率 100%。

綜上所述,建議使用者将多種付費類型,組合使用。因為不同的付費方式,有不同的使用場景。

搶占式執行個體支撐無狀态、任務型的業務負載。按量付費執行個體支撐有狀态、動态變化型的業務負載。包年包月執行個體,按量執行個體+抵扣類産品支撐穩定的業務負載。

如上圖所示,對計算資源各付費方式進行了比對。其中,計算資源的靈活性主要是指,資源是否可以随意建立、釋放、變配,以及資源與财務的耦合程度。

如上圖所示,對存儲資源各付費方式進行比對。其中,按量付費解除安裝和釋放均無限制,适用于不定時彈性的業務。

如上圖所示,對網絡資源各付費方式進行了比對。其中,按固定帶寬計費适用于較穩定的業務,按使用流量計費适用于突刺性的業務場景,即偶爾流量特别大,大部分場景流量比較小。

共享流量包适用于對流量有一定預估能力的場景,否則流量包購買過大或未及時抵扣,都會造成浪費。

上圖展示了資源規格選型的場景分類,使用者可以根據自身場景,進行選擇。隻有選擇适合自身業務場景的規格才能獲得最優成本效益。

如共享類的突發性能執行個體 t5/t6 成本低廉,非常适合輕量級 web 應用、開發/測試環境等低性能負載業務場景。價格可達相應獨享規格的 30%到 60%。

如某電商網站根據自身業務特點選擇計算型執行個體(4vCPU),相比通用型,成本降低 20%以上。

在資源規格選型方面,建議大家選擇最新一代。因為最新一代意味着雲廠商的軟體或硬體進行了技術更新,可以享受雲計算的技術紅利,與之相呼應的是 2022 年 7 月 6 日阿裡雲釋出官方公告:C6/C7,G6/G7,R6/R7 部分地域價格下調 9%到 19%。

03 提升資源使用率

提升資源使用率,主要針對抵扣類産品。因為抵扣類産品存在比對不到,使用率、覆寫率不夠的情況。是以預估容量很難達到 100%。使用者需要關注關注抵扣類産品使用率、覆寫率。

如果發現容量達到 100%,可能有一部分賬單無法被抵扣。使用者需要加購或重新購買預留執行個體劵或節省計劃産品。

除此之外,彈性伸縮可以有效提升資源使用率。彈性伸縮分為垂直彈性和水準彈性。垂直彈性是指,執行個體數量的增加或減少,比如 100 台 ECS 變成 200 台或 50 台。水準彈性是指,某台 ECS 的 CPU 記憶體增加或減少,升配或降配。

兩種彈性伸縮模式都支援定時模式、動态模式、動态預測模式、健康模式、手工模式、以及多種模式疊加使用。

上圖展示了,其他降本增效的方法。搶占式執行個體可借助諸如彈性供應、彈性伸縮産品來實作算力叢集的穩定傳遞。

按量付費執行個體若長期使用,可轉為包年包月,可選擇按周付費。也可購買預留執行個體券、節省計劃等抵扣類産品降低成本。開啟節省停機模式,可借助自動化運維工具 OOS 産品實作周期性定時開關機。

包年包月執行個體可開啟自動續費,借助統一到期日來提升續費效率。若不再使用,可退訂或轉按量付費。

帶寬可借助自動化運維工具 OOS 實作周期性定時升降帶寬峰值。購買共享帶寬包、共享流量包,多産品間帶寬可以互相複用,統一管理。

除此之外,使用者可以授權智能顧問 Advisor 産品,定期掃描自身資源,給出成本優化建議。借助使用者中心成本分析功能,進行費用分析與優化。

04 成本管理

從财務人員的角度看,成本管理有四個需求。

第一,清楚地知道企業内部各個部門每月消費了多少金額。

第二,  設定預算來管理各個部門的開支。

第三,需要工具從各個次元分析 &感覺自身成本,判斷自身成本是否合理,是否有優化空間。

第四,成本異常檢測能力。

在建立資源時,系統會根據配置設定政策,使用标簽将資源自動配置設定到部門或團隊。

進而清晰地看到每個團隊、每個部門消耗了多少錢。

預算管理是指,使用者根據一定的條件設定預算。如果超過預算,使用者可以設定預警,發送郵件或短信。

成本分析與優化是從各個次元分析成本是否合理。使用者可以根據标簽,産品、地域、可供區域、執行個體規格等條件進行篩選和分析。

阿裡雲彈性計算技術專家樊毅偉:雲上成本優化實踐

成本異常檢測通過人工智能算法,識别費用波動異常。異常檢測支援評估回報,使用者的回報結果會參與訓練算法,回報越多、越準确,越有利于提升檢測準确率。

包年包月、按量付費、搶占式執行個體、預留執行個體券等付費方式,是經濟性、确定性、靈活性的平衡。企業需要關注每種産品适用的場景。隻有選擇适合自己的,才能達到成本的節約。

企業需要根據自己的業務場景,選擇合适的執行個體規格。比如計算型,通用型,突發性能型的執行個體規格等等。

垂直、水準彈性伸縮、節省停機模式、自動化運維工具 OOS 産品等等,可以有效提升企業的資源使用率。成本分析與優化,主要從各個次元分析企業的成本是否合理。

05 Q&A 環節,使用者問答

Q1 為了防止成本浪費,有效管理雲服務,企業需要遵循哪些優化雲成本的實踐?

答:比如定期稽核、集中計費。除此之外,阿裡雲推出了一些成本分析,成本優化的功能,幫助企業實作降本增效。

Q2 如何把握容量的預估?

答:建議一邊使用,一邊優化。使用者可以使用雲廠商的監控名額或者基于自己的監控進行實時優化。

Q3 同一個标簽的資源,如何進行成本分攤?

答:财務單元支援成本分攤。在阿裡雲的使用者中心,财務單元會介紹成本分攤。

點選這裡,檢視雲上自動化運維 CloudOps 系列沙龍精彩回放合集 &講師資料下載下傳。

繼續閱讀