天天看點

封神-分析報告 | 性能容量

封神-分析報告 | 性能容量

1. 功能介紹

雲平台各個産品的性能總覽均需要登入對應的運維工具檢視,在提供相關報告與總結時,會耗費較長的時間,性能容量報告提供雲平台所有産品的重要名額評估及分析,可以幫助運維快速定位問題,同時可以提供相關性能離線報告,大大減少了運維成本。

1.1 資料來源

封神資料庫

1.2 解決問題

①提供全産品性能分析圖表,提高問題定位速度;

②提供整個雲平台容量分析;

③支援下載下傳離線報告。

2. 開發架構

2.1 架構說明

性能容量報告內建在封神監控系統中,資料來源于封神資料庫的監控資料,對性能容量資料進行定時分析打點并記錄入庫,前端展示與離線報告讀取對應資料,以圖表可視化形式展示,如下圖所示。

封神-分析報告 | 性能容量

圖1

2.2 功能特點

  1. 功能內建在封神系統中,對生産環境無任何影響;
  2. 分析目前雲平台整體運作狀況,并給出優化建議;
  3. 可視化展示各個産品的執行個體狀态,提高運維效率;
  4. 提供離線的資料報告,及執行個體性能的全量資料下載下傳。

2.3 功能結構及産品清單

标簽頁 産品
概述 資源容量,執行個體/主機數量,告警數量
基礎 天基,ecs,oss,slb,盤古
中間件 mq,edas,schx
資料庫 rds,drds,minirds,ots,ads
大資料 dataworks,odps
底座 docker,ops,otsinner,ftp-server,minirds,slb,vpc

3. 功能詳情

性能容量報告中按照總體概述、基礎元件、中間件、資料庫、大資料和底座進行展示分類(詳見2.3節),主要展示類型有曲線圖、柱狀圖、餅圖、熱力圖和表格形式,并對可視化内容進行分析,給出建議,可以支援時間檢索或下載下傳離線報告;

3.1 餅圖性能分析

  1. 圖中為ECS産品的整體性能情況,清晰的展示了目前雲平台的ECS資源使用情況;
  2. 單擊圖中右上角的“搜尋”按鈕,可以根據所需資料的時間範圍進行檢索;
  3. 圖中紅色文本框為分析建議,大部分ECS性能使用率都在30%以下,可見目前雲平台ECS都比較空閑,需要進行适當縮容回收資源。
封神-分析報告 | 性能容量

圖2

3.2 曲線性能分析

  1. 圖為雲平台各個産品的盤古水位使用情況,可以展示固定時間範圍内的盤古水位趨勢;
  2. 如圖所示目前雲平台盤古水位使用率幾乎都未超過30%,不需要進行優化。
封神-分析報告 | 性能容量

圖3

3.3 柱狀性能分析

  1. 圖為雲平台所有docker主控端的CPU資源數與已配置設定的CPU資源數對比圖;
  2. 如圖所示,目前環境docker主控端CPU資源超售情況比較嚴重。
封神-分析報告 | 性能容量

圖4

3.4 熱力性能分析

  1. 圖為雲平台所有docker主控端的單個CPU使用情況,可以結合圖(3-3)進行對比分析;
  2. 方格中的數字為x軸對應核心的CPU使用率,滑鼠懸浮其中一個核心便可以顯示對應核心的挂載容器;
  3. 當運維過程中有CPU遷移工作時可以參考此熱力圖,選擇同組ASW的主控端進行遷移。
封神-分析報告 | 性能容量

圖5

3.5 表格容量分析

  1. 下圖為目前雲平台的整體資源使用情況分析;
  2. 圖中展示了全部的資源數量與已使用的資源數量,以及對資源使用的預測。
封神-分析報告 | 性能容量

圖6

上述示例是報告中幾種典型可視化展示方式,每個雲産品都由不同的圖表組成,以及對應的分析建議。

我們是阿裡雲智能全球技術服務-SRE團隊,我們緻力成為一個以技術為基礎、面向服務、保障業務系統高可用的工程師團隊;提供專業、體系化的SRE服務,幫助廣大客戶更好地使用雲、基于雲建構更加穩定可靠的業務系統,提升業務穩定性。我們期望能夠分享更多幫助企業客戶上雲、用好雲,讓客戶雲上業務運作更加穩定可靠的技術,您可用釘釘掃描下方二維碼,加入阿裡雲SRE技術學院釘釘圈子,和更多雲上人交流關于雲平台的那些事。

封神-分析報告 | 性能容量