天天看點

塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄

EBS監控現狀

塊存儲是阿裡雲為雲伺服器ECS提供的塊裝置産品,具有高性能和低延遲時間的特點。臨近雙十一,在大促的時候,磁盤IO往往是運維的重點,如果磁盤被打爆了,那麼關鍵的業務可能會停滞甚至崩潰。EBS監控目前存在幾個問題

  1. 塊存儲提供的原生監控僅限制在單執行個體級别,隻能檢視單個雲盤的性能監控,缺少對全局雲盤狀态的監控,如果雲盤數量很多,那麼雲盤狀态的監控就非常麻煩
塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄
  1. 通過SLS Logtail, Telegraf或者雲監控agent等,可以實作對單個ECS執行個體所有雲盤的狀态的監控。但是這些監控方式都是侵入式的,agent的安裝、監控大盤的維護、雲盤執行個體監控精細化控制、以及跨ECS執行個體的監控,對于使用者來說,都有很大的學習成本和代價
  2. 分析次元單一,以上場景下,對雲盤的監控和分析還是基于雲盤id的,而雲盤資産本身的屬性也包含很多資訊。比如使用者想看到一個自己所有雲盤資産的大圖、各個地域的雲盤分布、各個雲盤類型的比例等資訊,都是很難做到的。

正是考慮到使用者對EBS監控的使用有如上的痛點,SLS團隊聯合EBS團隊釋出了EBS Lens(Lens, 透鏡的意思,取名為Lens意味着洞察雲産品細微的變化),針對塊存儲提供資料分析、資源監控的功能,可以幫助使用者擷取雲上塊存儲資源資訊與性能監控資料、提升雲上塊存儲資源的管理效率、高效分析業務波動與資源性能消耗情況。

EBS Lens産品特點

自動化資料采集

EBS Lens開啟後,SLS會自動從使用者的EBS資産中拉取雲盤清單。進入APP後首先展示的就是接入管理頁面,在這個頁面,可以看到EBS雲盤全局的一個管理視圖,包含以下資訊:

  • 展示目前接入的雲盤總量、資料采集的雲盤數量、雲盤的地域和目标存儲庫的數量。
  • 展示EBS執行個體資訊。例如,執行個體ID、标簽、雲盤種類、雲盤類型、可用區資訊、采集狀态、采集操作等資訊。如果使用者在開啟EBS Lens之後,對EBS雲盤有建立、更新和删除操作的話,SLS會自動更新這裡的雲盤清單
塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄

采集配置

EBS雲盤資産同步過來之後,需要使用者開啟雲盤資産的監控資料采集。在這裡,我們提供兩種采集方式,一種是供使用者進行精細化管理的手動采集,還有一種是在EBS雲盤數量過多的情況下,友善使用者全局管理的自動化采集。

手動采集

塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄
  • 支援對單個執行個體的采集狀态進行管理
  • 考慮到EBS執行個體數量會比較多,這裡支援在單個分頁下面進行批量開啟/批量關閉操作

自動化采集

塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄

當使用者雲盤有幾百甚至上千個的時候,手動采集的管理方式顯然不能滿足需求,是以我們還提供了一個自動化采集的功能。自動化采集提供了圖形化的配置界面:

  • 可以使用地域、執行個體ID、付費類型、磁盤類型、标簽等屬性設定采集條件。
  • 标準模式下各個條件之間為且關系。進階模式下,您可以靈活組合與嵌套條件。

配置儲存之後,自動化采集立刻開啟。所有滿足條件的雲盤,都會自動打開日志采集,進而省去了手動操作的步驟,另外當執行個體有所增減的時候,自動化采集也能夠感覺執行個體的變化,進行相應的調整。

存儲庫資訊展示

開啟雲盤監控資料采集之後,SLS會從EBS雲盤上拉取監控資料,然後投遞到使用者配置的目标存儲庫裡,以時序資料的形式進行存儲,在目标存儲庫這個tab裡,支援的功能有:

    • 支援檢視存儲目标庫的地域、資料儲存時間
    • 支援資料儲存時間的調整
塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄
    • 點選目标庫,可以進入SLS的project頁面,檢視原始監控資料

EBS雲盤資産同步、日志采集開啟之後,EBS Lens就有了EBS雲盤資産和雲盤的監控資料了,基于這兩個資料,EBS Lens做了兩個監控大盤,資源概覽和性能分析頁面。

多元度資料聚合與豐富的資料名額類型

  • 資源概覽頁面,提供一個全局的資産大盤,預設按照使用者次元,提供使用者賬号下所有雲盤的統計資訊,包括:
    • 雲盤總數量
    • 雲盤總容量
    • 雲盤執行個體所屬地域個數
    • 雲盤執行個體所屬可用區個數
    • 啟用快照雲盤占比
    • 加密雲盤占比
    • Top10容量的區域
    • Top10容量的可用區
    • 雲盤類型容量分布
    • 付費類型容量分布
塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄
  • 除了賬号的次元外,還支援對地域、付費類型、磁盤類型進行篩選,充分滿足使用者的各種統計需求
塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄

高精度的資料監控粒度

  • 性能分析頁面提供了一個全局的雲盤監控大盤,預設會統計使用者賬号下所有磁盤關鍵名額的監控,包括
    • 吞吐量
      • 總的吞吐量變化曲線
      • 讀/寫吞吐存儲Top100的執行個體,以及吞吐變化曲線
    • IOPS
      • 總的IOPS變化曲線
      • 讀寫IOPS Top100的執行個體,以及IOPS變化曲線
  • 性能分析頁面還支援對地域、付費類型、雲盤類型、雲盤id進行篩選,滿足使用者精細化監控的需求
  • 雲盤監控粒度為10s,監控延遲為10s内,對于抖動類場景可以有效進行監控
塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄

使用場景

EBS Lens有這麼便捷的管理方式以及豐富、多元度的監控名額,下面我們列舉了幾個常用的場景,來詳細說明下EBS Lens的功能:

監控場景

下面我們模拟日常常見的磁盤IO異常的場景,展示下EBS Lens的在監控場景下的應用。

環境準備

  1. 首先我們建立一個雲盤,或者使用已有的雲盤,挂載到ECS執行個體上。挂載雲盤的操作參見: https://help.aliyun.com/document_detail/25446.html?spm=a2c6h.13066369.0.0.57b1e42fgsiBLE&source=5176.11533457&userCode=ffsbbyn0&type=copy ,注意雲盤挂載到ECS執行個體後,必須建立分區和檔案系統,使雲盤變為可用。
  2. 将賬号下所有雲盤通過自動化采集配置,打開監控資料采集
塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄
  1. 打開性能分析頁面,确認雲盤監控資料已接入進來
塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄

異常模拟

我們進入ECS執行個體中,使用dd來模拟一個對磁盤的異常寫入的操作:

塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄

EBS Lens監控結果

塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄

在EBS Lens性能分析頁面,從大盤裡,我們發現有一塊磁盤的吞吐量和IOPS迅速提升到TOP1。為了檢視磁盤的詳細名額,我們在過濾框内輸入磁盤id,可以看到這個磁盤在標明時間範圍内吞吐量和IOPS的變化。而該執行個體id,正是我們模拟的寫入異常的磁盤。線上上,如果出現類似的問題,那麼接下來我們就該去進行詳細的問題定位,比如異常的服務日志列印、不合理的資料落盤等。通過調整時間範圍,對于設定ttl範圍内的資料,EBS Lens都支援在該頁面進行展示,對于故障的複盤和分析也是有非常大的幫助的。

塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄

配合SLS的告警功能

https://help.aliyun.com/document_detail/207608.html

,使用者完全可以自動化的監控雲盤的性能,準确定位異常雲盤。

服務壓測和性能調優

除了監控場景,EBS Lens在服務壓測和性能調優的場景,同樣有非常大的作用。所有關于性能方面的測試,最關鍵的基礎設施就是監控名額。EBS Lens性能分析大盤就可以提供雲盤實時的性能名額,這可以有效的幫助使用者快速定位雲盤是否存在性能瓶頸。我們模拟一個簡單的寫入場景:大量級的資料要以最快的速度寫到磁盤上。

  1. 我們采用跟上面環境一樣的ECS環境,在這個場景下我們指定一個固定的雲盤做測試
塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄
  1. 在EBS Lens的頁面打開該雲盤的監控資料采集
塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄

場景模拟

第一版本,這裡使用FIO模拟性能比較差的一個随機寫的實作場景:

fio -filename=/mnt/test1 -direct=1 -iodepth 1 -thread -rw=randwrite -ioengine=psync -bs=16k -size=2G -numjobs=10 -runtime=60 -group_reporting -name=mytest

通過EBS Lens的監控,我們發現雲盤的吞吐和IO比較低,遠遠沒有達到雲盤的性能上限,分别為15MB/s,900。參考塊存儲性能名額文檔:參考

https://help.aliyun.com/document_detail/25382.html
塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄

是以我們再對寫入腳本進行優化,把随機寫的實作改成了比較好的順序寫的實作:

fio -filename=/mnt/test2 -direct=1 -iodepth 1 -thread -rw=write -ioengine=psync -bs=16k -size=2G -numjobs=10 -runtime=60 -group_reporting -name=mytest

通過EBS Lens的監控,吞吐達到了47MB/s,而IOPS達到了3000左右。

塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄

通過塊存儲性能名額文檔我們得知,SSD雲盤的性能因資料塊大小而異,資料塊越小,吞吐量越小,IOPS越高。是以為了提高吞吐量,我們考慮提高單次寫入的資料塊大小:

fio -filename=/mnt/test2 -direct=1 -iodepth 1 -thread -rw=write -ioengine=psync -bs=64k -size=2G -numjobs=10 -runtime=60 -group_reporting -name=mytest

通過EBS Lens的監控,吞吐達到了143MB/s,而IOPS下降到了2300左右。由此可以看到有了EBS Lens之後,對于磁盤IO的性能測試和調優,是多麼的友善。

塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄

附錄

說明

  1. EBS Lens目前處于公測期灰階開放中,如果有興趣要試用,可以通過工單聯系我們 https://selfservice.console.aliyun.com/ticket/category/sls/recommend/3868 ,試用過程中有任何問題也可以直接聯系到我們
  2. EBS Lens公測期相關功能全部免費,公測期結束前會提前進行公示,公測結束後,費用計算可以參考 https://help.aliyun.com/document_detail/31694.html

參考文檔

塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄
  • 更多SLS的系列直播與教育訓練視訊會同步到微信公衆号與B站,敬請留意
塊存儲監控與服務壓測調優利器-EBS Lens釋出EBS監控現狀EBS Lens産品特點使用場景附錄
https://help.aliyun.com/document_detail/338394.html