Serilog 最佳实践

翻译自：https://benfoster.io/blog/serilog-best-practices/

Serilog是 Microsoft .NET 的结构化日志记录库，并已成为[Checkout.com .NET 的首选日志记录库。.它支持各种日志记录目的地（称为接收器）包从标准控制台和基于文件的接收器到日志服务，如 Datadog。

本指南最初是我们工程手册中的一篇文章，在收到内部积极反馈后，我决定在我的博客上发布它。

标准日志属性

日志记录基础知识

记录一切

选择合适的日志记录级别

定时操作源

上下文

HTTP 日志记录

日志的职责

日志内容的采集

Serilog标准采集方法

通过全局属性采集日志

关联日志

消息模板

消息模板推荐

日志和诊断上下文

日志上下文

诊断上下文

配置

生产日志

当日志变得不仅仅是日志

其他工具和实用程序

在本地使用 Seq

按日志类型记录日志

按属性块记录日志

按请求记录日志

标准化日志事件属性使您能够充分利用日志搜索和分析工具。在适用的情况下使用以下属性：

<code>ApplicationName</code>

生成日志事件的应用程序的名称

<code>ClientIP</code>

发出请求的客户端的 IP 地址

<code>CorrelationId</code>

可用于跨多个应用程序边界跟踪请求的 ID

<code>Elapsed</code>

操作完成所用的时间（以毫秒为单位）

<code>EventType</code>

用于确定消息类型的消息模板的哈希值

<code>MachineName</code>

运行应用程序的机器的名称

<code>Outcome</code>

手术的结果

<code>RequestMethod</code>

HTTP 请求方法，例如 <code>POST</code>

<code>RequestPath</code>

HTTP 请求路径

<code>SourceContext</code>

日志源自的组件/类的名称

<code>StatusCode</code>

HTTP 响应状态码

<code>UserAgent</code>

HTTP 用户代理

<code>Version</code>

正在运行的应用程序的版本

上面的很多属性都来自于 Serilog 自己的扩展，例如Serilog Timings（用于计时操作）和Serilog 请求日志记录。

通常，记录所有可以深入了解您的应用程序和用户行为的内容，例如：

代码中的主要分支点

遇到错误或意外值时

任何 IO 或资源密集型操作

重大领域事件

请求失败和重试

耗时的批处理操作的开始和结束

对您的日志记录要慷慨，但对您的日志记录级别要严格。在几乎所有情况下，您的日志级别都应该是<code>Debug</code>. 使用<code>Information</code>的日志事件，将在生产中需要确定运行状态或应用程序的正确性，<code>Warning</code>或<code>Error</code>突发事件，如异常。

请注意，该<code>Error</code>级别应保留用于您打算对其采取行动的事件。如果某些事情成为正常的应用程序行为（例如，请求输入验证失败），您应该降级日志级别以减少日志“噪音”。

将应用程序中的每个资源密集型操作（例如 IO）与指标代码一起记录下来。这在本地运行应用程序以查看应用程序瓶颈或响应时间消耗的情况时非常有用。该Serilog时序库提供了一个方便的方式来做到这一点：

该<code>SourceContext</code>属性用于跟踪日志事件的来源，通常是使用记录器的 C# 类。<code>ILogger</code>使用依赖注入将 Serilog 注入到类中是很常见的。为确保<code>SourceContext</code>正确设置，请使用<code>ForContext</code>扩展名：

使用Serilog 请求日志记录中间件来记录 HTTP 请求。这会自动包含上面列出的许多 HTTP 属性并生成以下日志消息：

将以下内容添加到您的应用程序启动中以添加中间件：

请注意，在health 和 metrics 中间件之后添加了 Serilog中间件。这是为了避免每次 AWS 负载均衡器命中您的健康检查端点时生成日志。

Serilog 中间件默认记录请求路径。如果您确实需要查看对应用程序中特定端点的所有请求，如果路径包含标识符等动态参数，您可能会遇到挑战。

为了解决这个问题，记录资源名称，在我们的应用程序中，按照惯例，它是<code>Name</code>赋予相应路由的属性。这是这样检索的：

过度全面的日志记录不仅会对您的应用程序产生性能影响，而且还会使诊断问题变得更加困难，并增加暴露敏感信息的风险。

Serilog 支持结构化对象输出，允许将复杂对象作为日志中的参数传递。这应该谨慎使用，如果您的主要目标是对相关属性进行分组，您最好初始化一个新的匿名对象，这样您就可以明确哪些信息被推送到日志中。

倾向于使用 Serilog 的诊断上下文功能（下面讨论）将日志折叠为单个日志条目。

将附加信息推送到您的日志中有助于提供有关特定事件的附加上下文。

您可以使用收集器来丰富应用程序生成的所有日志事件。我们建议使用以下 Serilog 浓缩器：

日志上下文收集器 - 内置于 Serilog，此丰富器可确保添加到日志上下文的任何属性都被推送到日志事件中

环境收集器- 使用机器或当前用户名采集日志

可以使用<code>Enrich.With</code>Serilog的fluent API<code>LoggerConfiguration</code>或通过您的<code>appsettings.json</code>文件（推荐）指定增强器：

您还可以全局指定属性。上面的片段<code>appsettings.json</code>演示了我们通常如何设置<code>ApplicationName</code>属性。在某些情况下，我们需要在启动时计算属性，这可以使用 Fluent API 来完成：

为了关联属于同一请求的日志，甚至跨多个应用程序，请<code>CorrelationId</code>向日志添加一个属性。

在 HTTP 应用程序中，我们通常从<code>HttpContext.TraceIdentifier</code>属性映射它。这是使用<code>Cko-Correlation-Id</code>标头在内部 API 之间传递的。我们使用以下扩展来获取 _current_correlation ID：

请注意，如果应用程序面向公众，则不应依赖提供的相关 ID 标头。

为了确保将关联 ID 推送到每个日志事件中，我们使用以下使用 Serilog 的中间件<code>LogContext</code>（本文稍后将详细讨论）：

日志消息应提供事件的简短描述。我们通常看到开发人员创建过于冗长的消息作为在事件中包含额外数据的手段，例如：

相反，您可以使用<code>ForContext</code>（或本文底部的属性包丰富器）仍然包含数据但具有更简洁的消息：

好的 Serilog 事件使用属性名称作为消息中的内容来提高可读性并使事件更紧凑，例如：

日志事件消息是片段，而不是句子；为了与使用 Serilog 的其他库保持一致，请尽可能避免尾随句点/句号。

Serilog 事件具有关联的消息模板，而不是消息。在内部，Serilog 解析和缓存每个模板（最多固定大小限制）。将日志方法的字符串参数视为消息，如下例所示，会降低性能并消耗缓存内存。例如，避免：

而是使用消息属性：

除了在日志消息中使用字符串连接/插值的性能开销之外，它还意味着无法计算一致的事件类型（请参阅事件类型丰富器），从而无法找到特定类型的所有日志。

Serilog 支持两种可用于增强日志的上下文感知功能。

<code>LogContext</code>可用于动态地添加和移除来自周围“执行上下文”性能; 例如，在事务期间写入的所有消息都可能带有该事务的 id，等等。

在<code>RequestLogContextMiddleware</code>上面的介绍演示了如何推动<code>CorrelationId</code>请求到<code>LogContext</code>在请求的开始。这可确保该请求中的所有日志都包含该属性。

更多信息可以在Serilog wiki上找到。

日志记录的一个挑战是上下文并不总是预先知道。例如，在处理 HTTP 请求的过程中，随着我们通过 HTTP 管道（例如了解用户的身份）获得额外的上下文。虽然<code>LogContext</code>我们所有人都会在附加信息可用时创建新上下文，但此信息仅在 _subsequent_log 条目中可用。这通常会导致日志数量增加，只是为了捕获有关整个请求或操作的所有信息。

诊断上下文提供了一个执行上下文（类似于<code>LogContext</code>），其优点是可以在其整个生命周期中进行丰富。请求日志中间件然后使用它来丰富最终的“日志完成事件”。这允许我们将许多不同的日志操作折叠为一个日志条目，其中包含来自请求管道中许多点的信息，例如：

在这里您可以看到，不仅有中间件发出的 HTTP 属性，还有应用程序数据，例如<code>AcquirerId</code>、<code>MerchantName</code>和<code>ResponseCode</code>。这些数据点来自请求中的不同点，但通过<code>IDiagnosticContext</code>接口推送到诊断上下文中：

诊断上下文不限于在 ASP.NET Core 中使用。它也可以以与请求日志中间件非常相似的方式在非 HTTP 应用程序中使用。例如，我们使用它在 SQS 使用者中生成完成日志事件。

Serilog 可以使用 Fluent API 或通过 Microsoft 配置系统进行配置。我们建议使用配置系统，因为可以在不发布应用程序新版本的情况下更改日志配置。

为此，添加Serilog.Settings.Configuration包并按如下方式配置 Serilog：

您现在可以通过任何支持的配置提供程序配置 Serilog。通常我们<code>appsettings.json</code>用于全局设置并通过生产中的环境变量配置实际接收器（因为我们不想在本地运行时使用我们的远程日志服务）：

在生产中部署应用程序时，请确保相应地配置日志记录：

控制台日志记录应限于<code>Error</code>. 在 .NET 中，写入控制台是一个阻塞调用，会对性能产生重大影响。

应为<code>Information</code>及以上配置全局日志记录。

据了解，在新项目发布期间，您可能需要更多信息来建立对解决方案的信心或诊断任何预期的初期问题。与其<code>Information</code>为此升级您的日志条目，不如考虑<code>Debug</code>在有限的时间内启用级别。

从开发人员那里听到的一个常见问题是他们如何在运行时动态切换日志级别。虽然这是可能的，但也可以使用蓝/绿部署来实现。使用降低的日志级别配置和部署非活动环境，然后通过加权目标组切换部分或全部流量。

日志可以提供对应用程序的大量洞察，并且在许多情况下足以处理日常支持请求或故障排除。然而，在某些情况下，日志不是工作的正确工具，有许多警告信号：

您发现自己向非技术用户开放应用程序日志

日志用于生成应用程序指标

更多信息被“塞进”日志以满足常见的支持请求或报告要求

在这些情况下，您可能需要为您的产品考虑专用工具。许多团队开发了类似“Inspector”的应用程序，将关键系统和业务数据聚合在一起，以处理可以提供给非技术利益相关者的 BAU 请求。此外，您可能会发现需要将应用程序中的数据推送到报告和分析工具中。

日志的有效性取决于您记录的内容和未记录的内容。

Seq是由 Serilog 的作者创建的免费（供本地使用）日志记录工具。它提供高级搜索和过滤功能以及对结构化日志数据的完全访问。虽然我们的日志记录要求现在超出了 Seq 所能提供的范围，但它仍然是本地测试的一个很好的选择。

我们通常在 docker 中启动 Seq 作为单独的 docker-compose 文件 ( <code>docker-compose-logging.hml</code>) 的一部分：

并配置我们的<code>appsettings.Development.json</code>文件以使用 Seq 接收器：

通常我们需要唯一标识相同类型的日志。一些接收器（例如Seq）通过散列消息模板来自动执行此操作。为了在其他接收器中复制相同的行为，我们创建了以下使用Murmerhash 算法的收集器：

如果您想向日志事件添加多个属性，请使用<code>PropertyBagEnricher</code>：

Serilog 请求日志记录中间件允许提供一个函数，该函数可用于将来自 HTTP 请求的附加信息添加到完成日志事件。我们使用它来记录<code>ClientIP</code>,<code>UserAgent</code>和<code>Resource</code>属性：