
前言
監控告警系統是每一家企業都需要的系統。系統的監控運維告警可以幫助企業快速發現系統故障,定位故障和處理故障,對企業業務穩定性起到至關重要的作用。業務監控系統可以實時進行業務告警,進行業務趨勢的分析和判斷,對于資料化營運起到重要的幫助。
阿裡雲InfluxDB 提供了一整套快速搭建監控系統的元件和功能,可以幫助企業快速搭建監控系統。2019年8月商業化以來,依靠穩定可靠的服務能力和免運維等特性,在監控領域受到很多使用者關注,近期更是進行了重磅更新,內建了Grafana可視化服務。
正文内容
本文将以Linux系統名額監控為例,展示如何基于阿裡雲InfluxDB®服務快速搭建一個監控系統。這裡假設使用者已經購買了阿裡雲InfluxDB®執行個體,并且建立了名為telegraf的資料庫以及管理者賬号admin(也可以使用對該庫有讀寫權限的非管理者賬号)。如果您還沒有開啟阿裡雲InfluxDB®服務,可以戳
這裡購買,資料庫和賬号如何建立請參考阿裡雲
文檔。
基于阿裡雲InfluxDB搭建監控系統可以分為二個簡單的步驟即可完成。
1 配置資料源
2 配置Grafana 儀表盤
接下來,我們就開始基于這兩個步驟快速實踐一下。 出于展示目的,本文使用的作業系統為CentOS 7,yum作為包管理工具,Ubuntu/Debian使用者可以用dpkg等工具完成類似操作。接下來我們實際操作一下。
配置資料采集
主機的系統監控需要安裝telegraf作為agent進行名額采集。telegraf是開源的名額采集工具,内用占用小,安裝部署簡便,下面幾部就可以完成。如果有多台主機需要監控,在每台主機上執行下面的步驟即可,在最後的監控儀表盤總可以使用下來清單來選擇主機資訊。
Step 1: 安裝telegraf
這裡使用的是目前的最新穩定版本telegraf 1.12.4:
yum install -y https://dl.influxdata.com/telegraf/releases/telegraf-1.12.4-1.x86_64.rpm
Step 2: 配置telegraf
Telegraf配置檔案的路徑為/etc/telegraf/telegraf.conf,使用文本編輯器(比如vim)對這個檔案進行編輯,配置内容如下:
# 采集插件
[[inputs.cpu]]
percpu = true
totalcpu = true
collect_cpu_time = false
[[inputs.disk]]
mount_points = ["/"]
ignore_fs = ["tmpfs", "devtmpfs"]
[[inputs.diskio]]
devices = ["vda"] # 這裡配置需要采集的磁盤裝置
[[inputs.kernel]]
[[inputs.mem]]
[[inputs.processes]]
[[inputs.swap]]
[[inputs.system]]
[[inputs.net]]
interfaces = ["eth0"]
[[inputs.netstat]]
# influxdb 配置
[[outputs.influxdb]]
urls = ["https://ts-xxxxxxxxxx.influxdata.rds.aliyuncs.com:3242"] # influxdb執行個體的公網通路位址
database = "telegraf"
username = "admin"
password = "yourpassword"
注意在[[outputs.influxdb]]部分設定阿裡雲InfluxDB®執行個體的通路位址,資料寫入的資料庫名,以及通路資料庫的賬号資訊。
Step 3: 啟動telegraf
配置檔案編輯儲存好,使用下面的指令啟動telegraf服務,主機名額資料就可以寫入到InfluxDB®中了
systemctl start telegraf.service
配置Grafana
Grafana是流行的開源時序分析平台,采用go語言編寫,目前活躍安裝數高達40萬,可以說是監控場景的标配元件了。Grafana支援多種流行的資料源,比如InfluxDB、Prometheus、OpentTSDB、Graphite等;可視化方面Grafana提供了酷炫的圖表,使用者可以動态建立儀表盤(dashboard),支援模闆變量作為下拉清單;資料探索(Explore)頁面允許使用者使用ad-hoc查詢在資料源上進行資料分析,并且提供了語句自動補全等貼心功能;支援郵件、webhook等多種報警通道,使用者可以自定義報警規則。
阿裡雲将Grafana監控可視化與InfluxDB®的存儲分析能力無縫對接,讓使用者無需部署和運維就可以在快速搭建一個監控系統,并且不需要支付額外費用。
Step 4: 配置Grafana資料源源
要使用Grafana,需要配置與InfluxDB®資料庫相關聯的資料源,我們在telegraf庫上建立一個名為my-datasource的資料源,具體步驟參考
,這裡不重複了。
Step 5: 建立儀表盤
使用者可以使用查詢語句建立儀表盤,為每個panel定義查詢語句和展示方式;實際上多數場景下不需要這麼麻煩,因為官方社群中有很多優秀的儀表盤模闆(
https://grafana.com/grafana/dashboards),可以很好的滿足需求。
比如我們要配置的Linux主機監控,可以直接使用
Linux System Overview這個儀表盤:
而我們要做的隻是記住2381這個dashboard ID。
從阿裡雲InfluxDB®控制台打開Grafana通路位址,登入之後即可進入儀表盤管理界面:
在儀表盤管理界面,點選Import按鈕進入Import頁面,輸入這個ID即可:
輸入ID後,Grafana會自動識别,進入選項頁面,進行資料源的配置,這裡我們選擇之前建立好的資料源 my-datasource
然後點選Import,儀表盤就建立好了!
總結
本文展示了如何基于阿裡雲InfluxDB®服務快速搭建一個主機監控系統,名額資料通過telegraf進行采集,資料寫入到InfluxDB®進行存儲,Grafana作為前端進行可視化展示,使用者也可以根據自己的需求在Grafana配置報警。阿裡雲InfluxDB®提供的Grafana服務為使用者降低了運維和硬體成本,與InfluxDB的存儲分析能力相得益彰,為監控領域的使用者提供了一個絕佳的選擇。
更新: 近期阿裡雲InfluxDB®推出了一進制購優惠活動,新使用者可以首月一進制體驗,規格選擇4c16g即可:
參考文檔
阿裡雲InfluxDB文檔之Grafana監控可視化 Grafana官網