天天看點

快!5分鐘快速完成監控系統搭建之實踐篇

快!5分鐘快速完成監控系統搭建之實踐篇

前言

監控告警系統是每一家企業都需要的系統。系統的監控運維告警可以幫助企業快速發現系統故障,定位故障和處理故障,對企業業務穩定性起到至關重要的作用。業務監控系統可以實時進行業務告警,進行業務趨勢的分析和判斷,對于資料化營運起到重要的幫助。

阿裡雲InfluxDB 提供了一整套快速搭建監控系統的元件和功能,可以幫助企業快速搭建監控系統。2019年8月商業化以來,依靠穩定可靠的服務能力和免運維等特性,在監控領域受到很多使用者關注,近期更是進行了重磅更新,內建了Grafana可視化服務。

正文内容

本文将以Linux系統名額監控為例,展示如何基于阿裡雲InfluxDB®服務快速搭建一個監控系統。這裡假設使用者已經購買了阿裡雲InfluxDB®執行個體,并且建立了名為telegraf的資料庫以及管理者賬号admin(也可以使用對該庫有讀寫權限的非管理者賬号)。如果您還沒有開啟阿裡雲InfluxDB®服務,可以戳

這裡

購買,資料庫和賬号如何建立請參考阿裡雲

文檔

基于阿裡雲InfluxDB搭建監控系統可以分為二個簡單的步驟即可完成。

1 配置資料源

2 配置Grafana 儀表盤

接下來,我們就開始基于這兩個步驟快速實踐一下。 出于展示目的,本文使用的作業系統為CentOS 7,yum作為包管理工具,Ubuntu/Debian使用者可以用dpkg等工具完成類似操作。接下來我們實際操作一下。

配置資料采集

主機的系統監控需要安裝telegraf作為agent進行名額采集。telegraf是開源的名額采集工具,内用占用小,安裝部署簡便,下面幾部就可以完成。如果有多台主機需要監控,在每台主機上執行下面的步驟即可,在最後的監控儀表盤總可以使用下來清單來選擇主機資訊。

Step 1: 安裝telegraf

這裡使用的是目前的最新穩定版本telegraf 1.12.4:

yum install -y https://dl.influxdata.com/telegraf/releases/telegraf-1.12.4-1.x86_64.rpm           

Step 2: 配置telegraf

Telegraf配置檔案的路徑為/etc/telegraf/telegraf.conf,使用文本編輯器(比如vim)對這個檔案進行編輯,配置内容如下:

# 采集插件
[[inputs.cpu]]  
  percpu = true
  totalcpu = true
  collect_cpu_time = false

[[inputs.disk]]
  mount_points = ["/"]
  ignore_fs = ["tmpfs", "devtmpfs"]

[[inputs.diskio]]
  devices = ["vda"] # 這裡配置需要采集的磁盤裝置

[[inputs.kernel]]

[[inputs.mem]]

[[inputs.processes]]

[[inputs.swap]]

[[inputs.system]]

[[inputs.net]]
  interfaces = ["eth0"]

[[inputs.netstat]]

# influxdb 配置
[[outputs.influxdb]]
  urls = ["https://ts-xxxxxxxxxx.influxdata.rds.aliyuncs.com:3242"] # influxdb執行個體的公網通路位址 
  database = "telegraf"
  username = "admin"
  password = "yourpassword"           

注意在[[outputs.influxdb]]部分設定阿裡雲InfluxDB®執行個體的通路位址,資料寫入的資料庫名,以及通路資料庫的賬号資訊。

Step 3: 啟動telegraf

配置檔案編輯儲存好,使用下面的指令啟動telegraf服務,主機名額資料就可以寫入到InfluxDB®中了

systemctl start telegraf.service           

配置Grafana

Grafana是流行的開源時序分析平台,采用go語言編寫,目前活躍安裝數高達40萬,可以說是監控場景的标配元件了。Grafana支援多種流行的資料源,比如InfluxDB、Prometheus、OpentTSDB、Graphite等;可視化方面Grafana提供了酷炫的圖表,使用者可以動态建立儀表盤(dashboard),支援模闆變量作為下拉清單;資料探索(Explore)頁面允許使用者使用ad-hoc查詢在資料源上進行資料分析,并且提供了語句自動補全等貼心功能;支援郵件、webhook等多種報警通道,使用者可以自定義報警規則。

阿裡雲将Grafana監控可視化與InfluxDB®的存儲分析能力無縫對接,讓使用者無需部署和運維就可以在快速搭建一個監控系統,并且不需要支付額外費用。

Step 4: 配置Grafana資料源源

要使用Grafana,需要配置與InfluxDB®資料庫相關聯的資料源,我們在telegraf庫上建立一個名為my-datasource的資料源,具體步驟參考

,這裡不重複了。

Step 5: 建立儀表盤

使用者可以使用查詢語句建立儀表盤,為每個panel定義查詢語句和展示方式;實際上多數場景下不需要這麼麻煩,因為官方社群中有很多優秀的儀表盤模闆(

https://grafana.com/grafana/dashboards)

,可以很好的滿足需求。

比如我們要配置的Linux主機監控,可以直接使用

Linux System Overview

這個儀表盤:

快!5分鐘快速完成監控系統搭建之實踐篇

而我們要做的隻是記住2381這個dashboard ID。

從阿裡雲InfluxDB®控制台打開Grafana通路位址,登入之後即可進入儀表盤管理界面:

快!5分鐘快速完成監控系統搭建之實踐篇

在儀表盤管理界面,點選Import按鈕進入Import頁面,輸入這個ID即可:

快!5分鐘快速完成監控系統搭建之實踐篇

輸入ID後,Grafana會自動識别,進入選項頁面,進行資料源的配置,這裡我們選擇之前建立好的資料源 my-datasource

快!5分鐘快速完成監控系統搭建之實踐篇

然後點選Import,儀表盤就建立好了!

快!5分鐘快速完成監控系統搭建之實踐篇

總結

本文展示了如何基于阿裡雲InfluxDB®服務快速搭建一個主機監控系統,名額資料通過telegraf進行采集,資料寫入到InfluxDB®進行存儲,Grafana作為前端進行可視化展示,使用者也可以根據自己的需求在Grafana配置報警。阿裡雲InfluxDB®提供的Grafana服務為使用者降低了運維和硬體成本,與InfluxDB的存儲分析能力相得益彰,為監控領域的使用者提供了一個絕佳的選擇。

更新: 近期阿裡雲InfluxDB®推出了一進制購優惠活動,新使用者可以首月一進制體驗,規格選擇4c16g即可:

快!5分鐘快速完成監控系統搭建之實踐篇

參考文檔

阿裡雲InfluxDB文檔之Grafana監控可視化 Grafana官網

購買可領取: 阿裡雲代金券