如何使用 Datadog 监控 NGINX（第三篇）

nginx dashboard

datadog 允许你以单个主机、服务、流程和度量来构建图形和警告，或者使用它们的几乎任何组合构建。例如，你可以监控你的所有主机，或者某个特定可用区域的所有nginx主机，或者您可以监视具有特定标签的所有主机的一个关键指标。本文将告诉您如何：

在 datadog 仪表盘上监控 nginx 指标，就像监控其他系统一样

当一个关键指标急剧变化时设置自动警报来通知你

datadog infrastructure list

<code>init_config:</code>

<code>instances:</code>

<code>- nginx_status_url: http://localhost/nginx_status/</code>

<code>- instance:foo</code>

当你提供了 status url 和任意 tag，将配置文件保存为 conf.d/nginx.yaml。

如果配置是正确的，你会看到这样的输出：

<code>checks</code>

<code>nginx</code>

<code>- instance #0 [ok]</code>

<code>- collected 8 metrics & 0 events</code>

install integration

你可以通过增加 nginx 之外的重要指标的图表来轻松创建一个全面的仪表盘，以监控你的整个网站设施。例如，你可能想监视你 nginx 的主机级的指标，如系统负载。要构建一个自定义的仪表盘，只需点击靠近仪表盘的右上角的选项并选择“clone dash”来克隆一个默认的 nginx 仪表盘。

clone dash

一旦 datadog 捕获并可视化你的指标，你可能会希望建立一些监控自动地密切关注你的指标，并当有问题提醒你。下面将介绍一个典型的例子：一个提醒你 nginx 吞吐量突然下降时的指标监控器。

datadog 指标警报可以是“基于吞吐量的”（当指标超过设定值会警报）或“基于变化幅度的”（当指标的变化超过一定范围会警报）。在这个例子里，我们会采取后一种方式，当每秒传入的请求急剧下降时会提醒我们。下降往往意味着有问题。

创建一个新的指标监控。从 datadog 的“monitors”下拉列表中选择“new monitor”。选择“metric”作为监视器类型。

nginx metric monitor

定义你的指标监视器。我们想知道 nginx 每秒总的请求量下降的数量，所以我们在基础设施中定义我们感兴趣的 nginx.net.requestpers 之和。

nginx metric

设置指标警报条件。我们想要在变化时警报，而不是一个固定的值，所以我们选择“change alert”。我们设置监控为无论何时请求量下降了30％以上时警报。在这里，我们使用一个一分钟的数据窗口来表示 “now” 指标的值，对横跨该间隔内的平均变化和之前 10 分钟的指标值作比较。

nginx metric change alert

nginx metric notification

在这篇文章中，我们谈到了通过整合 nginx 与 datadog 来可视化你的关键指标，并当你的网络基础架构有问题时会通知你的团队。

如果你一直使用你自己的 datadog 账号，你现在应该可以极大的提升你的 web 环境的可视化，也有能力对你的环境、你所使用的模式、和对你的组织最有价值的指标创建自动监控。

本文来自云栖社区合作伙伴“linux中国”，原文发布日期：2015-08-25

继续阅读