天天看點

争議 | 開源監控工具能否滿足傳統行業需求?Zabbix、Prometheus等哪款工具更适合?

原來接觸的鋼鐵企業在資訊化方面的投入不足,資金一直都用在硬體的投入上,是以對于系統的監控我們都是采用了開源或者是非正常手段的軟體來實作業務的監控功能。我們是通過CACTI進行網絡流量的監控,并生成網絡流量拓撲圖,通過hostmonitor進行業務的自動巡檢和部分關鍵裝置的性能監控,并通過郵件推送實作手機的自動報警。基本上通過免費的方式實作了業務自動巡檢、報警、資料流量的實時監控。

對于傳統企業,我覺得觀念是最大的問題。我接觸過很多管理者都認為資訊化的投入太多,不值得,難得有點投入都用在了硬體上。對于網絡安全、資料備份、還有業務監控、自動運維這些方面,态度都像買保險一樣,結果都是苦的運維人。

@鄧毓 江西農信 系統工程師:

就開源監控而言,Zabbix是非常好的選擇,靈活性上、全面性上都無可挑剔,也是很成熟的産品,但前提是你能吃透它,具備二次開發的能力,後續通過自身技術和社群資料支撐運維和更新。而商業監控相比較而言,對自身技術要求就低很多,有廠商支撐和運維,項目周期短,但靈活性上就要弱些,主要還是要把握好選型。

@sz 系統運維工程師:

我覺得開源的産品還是需要做定制化才能滿足企業需求。

@Tomato1616 某城商銀行 系統架構師:

如果維護的資訊系統重要,我認為即使選擇開源監控産品,最好也購買一定的服務,以便設計合理的架構,減少實施周期。

@anonym 系統工程師:

zabbix,免費開源,功能強大。

@jason2006xu 昆侖銀行 技術經理:

目前市場上主流監控産品功能大同小異,但是要選擇好的監控工具應該從以下幾個非功能需求方面選擇:

1、成熟度和穩定性,監控系統本來是用來管理相對不穩定的系統,打鐵還需自身硬,是以穩定性和程度度是企業選擇監控系統最先要考慮的一點。

2、高性能,對于大型企業,被管對象多(超過1萬)時,入庫時效率是否高。

3、可擴充性,企業網絡環境複雜,機構多,是以可擴充性也是要考慮的點。

4、二次開發支援程度,如果提供API可以友善定制開發,以便運維人員使用。

5、接口開放程度,如跟CMDB、ITIL內建,對CMDB、ITIL是否開放接口。

6、部署複雜度,如果大型企業上萬台主機、如何部署代理。

7、售後支援度、社群是否活躍,如果系統故障,是否有專家支援,是否有強大團隊支援。

其次應該從以下幾個功能需求方面考慮:

1、是否支援傳統架構監控,如作業系統、資料庫、中間件、網絡、存儲

2、是否支援開源軟體如MySQL、PGSQL、MoogDB、Kafka

3、是否支援虛拟化,VMware、KVM

4、是否支援容器:Docker

5、是否支援K8S

綜上所述,傳統架構可以考慮Zabbix,雲環境、容器、K8S監控等可以考慮Prometheus。

@hufeng719 某鋼鐵企業 系統工程師:

從成本、功能、安全、穩定、便于維護和二次開發方面考慮選擇的監控工具。可以找幾個多嘗試,包括監控畫面的美感度等等,這個都是根據自身愛好選擇。

@山雞 某保險:

個人觀點:

主要還是看規模吧,如果規模不大, Zabbix足夠應付了,目前來說其社群的支援力度還是很不錯的,各種模闆都已經有了, 而且網上各種資料也是比較多的,還有就是跟伺服器的配置, 以及Zabbix日常維護這塊 也有一定關系 ,我上家公司也算是屬于傳統行業吧,用的就是Zabbix。

自己之前略微研究了下,Prometheus,個人感覺還是很不錯的,也可以考慮。下圖是各種工具對比,來源網絡,僅供參考。

争議 | 開源監控工具能否滿足傳統行業需求?Zabbix、Prometheus等哪款工具更适合?

@nameless 某雲計算廠商 技術總監:

可以從幾個次元考慮:

1、開源監控工具是否滿足自己IT需求,如果不滿足,是否有二次開發能力等;

2、開源監控工具是否成熟,軟體的穩定性、可靠性,社群發展情況,文檔資料是否齊全等等;

3、結合自身運維能力,能否hold住該監控工具,該監控工作開發語言是否和自身IT主語言一緻,遇到代碼級問題能否及時修複等;

4、可以關注下該監控工具的發展趨勢,比如cloud監控是否具備,微服務監控能力等等;

目前常用的監控工具有nagios、zenoss、Zabbix、openfalcon、Prometheus等,個人建議prometheus。比較新,功能強大,對cloud監控友好,其他監控工具傳統主機、網絡監控好。

@guoxilin 某科技公司 系統測試工程師:

Zabbix确實是比較好的監控工具候選項,它具備常見的商業監控軟體所具備的功能。比如主機的性能監控、硬體監控、應用性能監控(APM)、網絡裝置性能監控、資料庫性能監控、FTP等通用協定監控、多種告警方式、詳細的報表圖表繪制;支援自動發現網絡裝置和伺服器,支援分布式部署,集中展示和管理分布式的監控點;具備很強的擴充性,并且提供通用接口,可以按需開發定制各類監控。