天天看點

雲伺服器 ECS 監控:監控ECS執行個體

監控ecs執行個體

一般來說,在本地資料中心我們會對基礎設施進行監控,其中包括對主機執行個體的監控,以便系統地和随時地了解資源使用情況和性能變化,在出現性能瓶頸的時候合理地調配資源,或者在發生故障時追溯原因等等。

在阿裡雲上,ecs執行個體也承載着我們的業務應用,ecs執行個體的資源使用情況和性能負載直接影響着其上應用的運作穩定性和使用者體驗度。假如沒有進行監控,就很有可能在業務高峰期性能不足卻無人問津而導緻當機;也可能在出現異常和故障的時候,因為沒有曆史性能資料而無法進一步追查到原因,可見,沒有監控,當問題出現的時候,都非常被動。

是以,監控是非常有必要的,是建構完整it系統不可或缺的一個元素,下面就來介紹如何對ecs執行個體進行監控。

使用dashboard

雲監控的dashboard功能提供使用者自定義檢視監控資料的功能。使用者可以在一張監控大盤中跨産品、跨執行個體檢視監控資料,将相同業務的不同産品執行個體集中展現。既能滿足排查故障時檢視監控細節,又能滿足總覽大局時檢視服務概貌。

操作步驟

1、登入雲監控控制台。

2、點選左側菜單的“dashboard”選項,進入dashboard頁面。可以看到預設展示的“ecs全局監控大盤”。

雲伺服器 ECS 監控:監控ECS執行個體

3、可以看到預設的“ecs全局監控大盤”已經包含了比較豐富的監控項了,包括cpu使用率、網絡流入/流出帶寬、系統磁盤bps、系統盤iops、網絡流入/流出量。基本已經可以滿足日常監控需求。

4、如果業務比較複雜,需要自定義監控可視化需求時,可以建立新的監控大盤,點選頁面右上角的“建立監控大盤”,輸入監控大盤的名稱。

雲伺服器 ECS 監控:監控ECS執行個體

5、然後可以在該大盤上添加雲産品名額和使用者的業務監控名額。

6、添加雲産品名額。

a) 選擇需要檢視的雲産品和執行個體所在地域;

b) 定義圖示名稱,圖表名稱預設為您生成“産品名稱+區域”,選擇圖表展現形式;

c) 選擇需要檢視的監控項、選擇監控資料的聚合方式,常見聚合方式為最大值、最小值、平均值、選擇過濾條件、選擇group by的次元。

雲伺服器 ECS 監控:監控ECS執行個體

7、添加業務名額監控。

a) 定義圖表名稱、名額名稱、圖表類型;

b) 選擇需要檢視的監控資料并定義處理方式;

c) 點選釋出。

雲伺服器 ECS 監控:監控ECS執行個體

主機監控

雲監控主機監控服務通過在伺服器上安裝插件,為使用者提供伺服器的系統監控服務。主機監控服務采集豐富的作業系統層面監控名額,可以使用主機監控服務進行伺服器資源使用情況的查詢和排查故障時的監控資料查詢。

2、通過選擇左側菜單的主機監控,進入主機監控頁面。

3、點選執行個體清單中的“點選安裝”插件,安裝雲監控插件。

雲伺服器 ECS 監控:監控ECS執行個體

4、1-3分鐘後即可點選執行個體清單頁的“監控圖表”檢視監控資料。

雲伺服器 ECS 監控:監控ECS執行個體

5、可以看到有作業系統監控、基礎監控、程序監控。其中涵蓋了cpu、記憶體、負載、磁盤、網絡、程序各面的性能統計,并且可以根據時間範圍來展示圖示資料。

6、建立報警規則。

a) 切換到報警規則頁面;

雲伺服器 ECS 監控:監控ECS執行個體

b) 點選“這裡”建立規則;

c) 在建立報警規則頁面填寫設定報警的具體參數;

雲伺服器 ECS 監控:監控ECS執行個體
雲伺服器 ECS 監控:監控ECS執行個體
雲伺服器 ECS 監控:監控ECS執行個體

d) 儲存規則設定,完成報警規則的建立。

站點監控

如果ecs執行個體提供的主要業務應用是網站類型,可以考慮使用站點監控模拟真實使用者通路情況,探測api可用性、端口連通性、dns解析等問題。可以探測域名、ip、端口的連通性、通路響應時間,并對監控結果報警。

2、點選站點管理,進入站點監控頁面。

3、點選頁面右上角的建立監控點,添加新的監測點。

雲伺服器 ECS 監控:監控ECS執行個體

4、點選左側菜單的“站點管理”選項,進入站點監控頁面。

雲伺服器 ECS 監控:監控ECS執行個體

5、檢視站點監控詳情。

雲伺服器 ECS 監控:監控ECS執行個體

開源監控産品介紹

目前業内有不少開源的監控軟體,包括zabbix、nagios、zenoss等,每個産品都有各自的特色和優勢,下面分别簡單介紹一下以上幾款産品。

zabbix

zabbix是一個基于web界面的提供分布式系統監控以及網絡監控功能的企業級開源運維平台,也是目前國内網際網路使用者中使用最廣的監控軟體,85%以上的泛網際網路企業都在使用zabbix做監控解決方案。

zabbix入門容易、上手簡單、功能強大并且開源免費,它易于管理和配置,能生成比較漂亮的資料圖,其自動發現功能大大減輕日常管理的工作量,豐富的資料采集方式和api接口可以讓使用者靈活進行資料采集,而分布式系統架構可以支援監控更多的裝置。理論上,通過zabbix提供的插件式架構,可以滿足企業的任何需求。

nagios

nagios是一款開源的企業級監控系統,能夠實作對系統cpu、磁盤、網絡等方面參數的基本系統監控,以及smtp,pop3,http,nntp等各種基本的服務類型。另外通過安裝插件和編寫監控腳本,使用者可以實作應用監控,并針對大量的監控主機和多個對象部署階層化監控架構。

nagios最大的特點是其強大的管理中心,盡管其功能是監控服務和主機的,但nagios自身并不包括這部分功能代碼,所有的監控、告警功能都是由相關插件完成的。

zenoss

zenoss core是zenoss的開源版本,其商用版本為zenossenterprise。作為企業級智能監控軟體,zenoss core允許it管理者依靠單一的web控制台來監控網絡架構的狀态和健康度。zenoss core的強大能力來自于深入的清單與配置管理資料庫,以發現和管理公司it環境的各類資産。zenoss同時提供與cmdb關聯的事件和錯誤管理系統,以協助提高各類事件和提醒的管理效率。

zabbix vs 雲監控

zabbix是第三方開源監控軟體,是一個基于web界面的提供分布式系統監視以及網絡監視功能的企業級的開源解決方案。

zabbix能監視各種網絡參數,保證伺服器系統的安全營運;并提供靈活的通知機制以讓系統管理者快速定位/解決存在的各種問題。

雲監控既指在雲端運作的監控工具,也指監控在雲端運作的應用程式的工具。通過和雲計算平台的整合,針對網絡、系統、應用等内容提供可用性、使用者體驗和安全性方面的監控服務。

雲監控的到來,無疑給那些對技術不太熟悉的人員帶來了福音,可以通過頁面點選就可以建立自己的監控項。

産品

優點

缺點

支援多平台、分布式;

安裝部署簡單,多種資料采集插件靈活內建;

可實作複雜多條件告警;

自帶畫圖功能,得到的資料可以繪成圖形;

提供多種api接口,支援調用腳本;

出現問題時可自動遠端執行指令;

項目批量修改不友善;

中文資料較少,服務支援有限;

入門容易,但是深層次需要非常熟悉zabbix并進行大量的二次定制開發,難度較大;

系統級别報警、報警郵件、自定義項目報警需要自己設定,過程繁瑣;

缺少資料彙總功能,資料報表也需要進行二次開發;

雲監控

無前期成本投入;

無需獨立伺服器;

配置及添加監控項簡單;

頁面風格比較适合國人操作;

部分平台免費版功能較少,企業級應用費用較高;

賬戶管理功能較弱;

修改監控點配置不友善;

自定義監控配置麻煩,部分需寫腳本;

監控項目單一;

部分監控項無法實作圖形化顯示;

可以看出,各有各的優劣勢。雲監控降低我們監控的門檻,給我們提供了便利,但是在一定程度上限制了自定義和擴充。而zabbix可以靈活內建并可通過二次開發實作複雜功能,但是對人員和技能的要求也比較高。

對于上監控以更好地保障系統上線後穩定運作,我們還需要關注監控的一些方法。

除了需要了解我們的正常的監控項如硬體資源、性能、帶寬、端口、程序、服務的檢測機制之外,還要具備安全意識,比如需要知道哪些伺服器可能出現問題,可能被入侵等。

另外,需要定義監控政策,包括告警的優先級、告警内容等;對監控的業務系統進行分級,比如一級系統724小時告警,二級系統712小時告警。

如果架構比較龐大,也可以對監控對象範圍進行分類,如伺服器監控、應用程式監控、資料庫監控、網絡監控等,根據監控對象再細分監控項。每個維護人員都可以根據企業環境總結出一套适合于自身的監控體系,并逐漸精細化和智能化。

通過使用阿裡雲雲監控,能較好地對我們的ecs執行個體進行監控,使我們及時了解業務的運作狀态,并及時提供告警,讓我們可以快速定位故障,對我們管理和維護ecs提供了可靠的支援。當然,在此基礎上我們也可以結合如zabbix之類的開源監控軟體,進一步實作對ecs執行個體更全面和精準的監控。

<a href="https://help.aliyun.com/document_detail/52133.html?spm=5176.doc52565.6.760.cndjwc">原文連結</a>

繼續閱讀