
nginx dashboard
datadog 允许你以单个主机、服务、流程和度量来构建图形和警告,或者使用它们的几乎任何组合构建。例如,你可以监控你的所有主机,或者某个特定可用区域的所有nginx主机,或者您可以监视具有特定标签的所有主机的一个关键指标。本文将告诉您如何:
在 datadog 仪表盘上监控 nginx 指标,就像监控其他系统一样
当一个关键指标急剧变化时设置自动警报来通知你
<a target="_blank"></a>
datadog infrastructure list
<code>init_config:</code>
<code></code>
<code>instances:</code>
<code>- nginx_status_url: http://localhost/nginx_status/</code>
<code>tags:</code>
<code>- instance:foo</code>
当你提供了 status url 和任意 tag,将配置文件保存为 conf.d/nginx.yaml。
如果配置是正确的,你会看到这样的输出:
<code>checks</code>
<code>======</code>
<code>[...]</code>
<code>nginx</code>
<code>-----</code>
<code>- instance #0 [ok]</code>
<code>- collected 8 metrics & 0 events</code>
install integration
你可以通过增加 nginx 之外的重要指标的图表来轻松创建一个全面的仪表盘,以监控你的整个网站设施。例如,你可能想监视你 nginx 的主机级的指标,如系统负载。要构建一个自定义的仪表盘,只需点击靠近仪表盘的右上角的选项并选择“clone dash”来克隆一个默认的 nginx 仪表盘。
clone dash
一旦 datadog 捕获并可视化你的指标,你可能会希望建立一些监控自动地密切关注你的指标,并当有问题提醒你。下面将介绍一个典型的例子:一个提醒你 nginx 吞吐量突然下降时的指标监控器。
datadog 指标警报可以是“基于吞吐量的”(当指标超过设定值会警报)或“基于变化幅度的”(当指标的变化超过一定范围会警报)。在这个例子里,我们会采取后一种方式,当每秒传入的请求急剧下降时会提醒我们。下降往往意味着有问题。
创建一个新的指标监控。从 datadog 的“monitors”下拉列表中选择“new monitor”。选择“metric”作为监视器类型。
nginx metric monitor
定义你的指标监视器。我们想知道 nginx 每秒总的请求量下降的数量,所以我们在基础设施中定义我们感兴趣的 nginx.net.requestpers 之和。
nginx metric
设置指标警报条件。我们想要在变化时警报,而不是一个固定的值,所以我们选择“change alert”。我们设置监控为无论何时请求量下降了30%以上时警报。在这里,我们使用一个一分钟的数据窗口来表示 “now” 指标的值,对横跨该间隔内的平均变化和之前 10 分钟的指标值作比较。
nginx metric change alert
nginx metric notification
在这篇文章中,我们谈到了通过整合 nginx 与 datadog 来可视化你的关键指标,并当你的网络基础架构有问题时会通知你的团队。
如果你一直使用你自己的 datadog 账号,你现在应该可以极大的提升你的 web 环境的可视化,也有能力对你的环境、你所使用的模式、和对你的组织最有价值的指标创建自动监控。
本文来自云栖社区合作伙伴“linux中国”,原文发布日期:2015-08-25