万字长文聊缓存（上）

深入解析springmvc核心原理：从手写简易版mvc框架开始(smartmvc) : https://github.com/silently9527/smartmvc idea多线程文件下载插件: https://github.com/silently9527/fastdownloadideaplugin 公众号：贝塔学java

缓存的目的是为了提高系统的访问速度，让数据更加接近于使用者，通常也是提升性能的常用手段。缓存在生活中其实也是无处不在，比如物流系统，他们基本上在各地都有分仓库，如果本地仓库有数据，那么送货的速度就会很快；cpu读取数据也采用了缓存，寄存器->高速缓存->内存->硬盘/网络；我们经常使用的maven仓库也同样有本地仓库和远程仓库。现阶段缓存的使用场景也越来越多，比如：浏览器缓存、反向代理层缓存、应用层缓存、数据库查询缓存、分布式集中缓存。

本文我们就先从浏览器缓存和nginx缓存开始聊起。

浏览器缓存是指当我们去访问一个网站或者http服务的时候，服务器可以设置http的响应头信息，其中如果设置缓存相关的头信息，那么浏览器就会缓存这些数据，下次再访问这些数据的时候就直接从浏览器缓存中获取或者是只需要去服务器中校验下缓存时候有效，可以减少浏览器与服务器之间的网络时间的开销以及节省带宽。

htpp相关的知识，欢迎去参观《面试篇》http协议

该命令是通用首部字段（请求首部和响应首部都可以使用），用于控制缓存的工作机制，该命令参数稍多，常用的参数：

no-cache: 表示不需要缓存该资源

max-age(秒): 缓存的最大有效时间，当max-age=0时，表示不需要缓存

控制资源失效的日期，当浏览器接受到<code>expires</code>之后，浏览器都会使用本地的缓存，在过期日期之后才会向务器发送请求；如果服务器同时在响应头中也指定了<code>cache-control</code>的<code>max-age</code>指令时，浏览器会优先处理<code>max-age</code>。

如果服务器不想要让浏览器对资源缓存，可以把<code>expires</code>和首部字段<code>date</code>设置相同的值

<code>last-modified</code> 用于指明资源最终被修改的时间。配合<code>if-modified-since</code>一起使用可以通过时间对缓存是否有效进行校验；后面实战会使用到这种方式。

如果请求头中<code>if-modified-since</code>的日期早于请求资源的更新日期，那么服务会进行处理，返回最新的资源；如果<code>if-modified-since</code>指定的日期之后请求的资源都未更新过，那么服务不会处理请求并返回<code>304 mot modified</code>的响应，表示缓存的文件有效可以继续使用。

使用springmvc做缓存的测试代码：

当第一次访问<code>http://localhost:8080/http/cache</code>的时候，我们可以看到如下的响应头信息：

前面我们已提到了<code>cache-control</code>的优先级高于<code>expires</code>，实际的项目中我们可以同时使用，或者只使用<code>cache-control</code>。<code>expires</code>的值通常情况下都是<code>系统当前时间+缓存过期时间</code>

当我们在15秒之内再次访问<code>http://localhost:8080/http/cache</code>会看到如下的请求头：

此时发送到服务器端的头信息<code>if-modified-since</code>就是上次请求服务器返回的<code>last-modified</code>，浏览器会拿这个时间去和服务器校验内容是否发送了变化，由于我们后台程序在15秒之内都表示没有修改过内容，所以得到了如下的响应头信息

响应的状态码304，表示服务器告诉浏览器，你的缓存是有效的可以继续使用。

请求首部字段<code>if-none-match</code>传输给服务器的值是服务器返回的etag值，只有当服务器上请求资源的<code>etag</code>值与<code>if-none-match</code>不一致时，服务器才去处理该请求。

响应首部字段<code>etag</code>能够告知客服端响应实体的标识，它是一种可将资源以字符串的形式做唯一标识的方式。服务器可以为每份资源指定一个<code>etag</code>值。当资源被更新时，<code>etag</code>的值也会被更新。通常生成<code>etag</code>值的算法使用的是md5。

强etag值：不论实体发生了多么细微的变化都会改变其值

弱etag值：只用于提示资源是否相同，只有当资源发送了根本上的变化，etag才会被改变。使用弱etag值需要在前面添加<code>w/</code>

通常建议选择弱etag值，因为大多数时候我们都会在代理层开启gzip压缩，弱etag可以验证压缩和不压缩的实体，而强etag值要求响应实体字节必须完全一致。

etag是用于发送到服务器端进行内容变更验证的，第一次请求<code>http://localhost:8080/http/etag</code>，获取到的响应头信息：

在30秒之内，我们再次刷新页面，可以看到如下的请求头信息：

这里的<code>if-none-match</code>就是上一次请求服务返回的<code>etag</code>值，服务器校验<code>if-none-match</code>值与<code>etag</code>值相等，所以返回了304告诉浏览器缓存可以用。

通过上面的两个事例我们可以看出<code>etag</code>需要服务器先查询出需要响应的内容，然后计算出etag值，再与浏览器请求头中<code>if-none-match</code>来比较觉得是否需要返回数据，对于服务器来说仅仅是节省了带宽，原本应该服务器调用后端服务查询的信息依然没有被省掉；而<code>last-modified</code>通过时间的比较，如果内容没有更新，服务器不需要调用后端服务查询出响应数据，不仅节省了服务器的带宽也降低了后端服务的压力；

对比之后得出结论：通常来说为了降低后端服务的压力<code>etag</code>适用于图片/js/css等静态资源，而类似用户详情信息需要调用后端服务的数据适合使用<code>last-modified</code>来处理。

通常情况下我们都会使用到nginx来做反向代理服务器，我们可以通过缓冲、缓存来对nginx进行调优，本篇我们就从这两个方面来聊聊nginx调优

默认情况下，nginx在返回响应给客户端之前会尽可能快的从上游服务器获取数据，nginx会尽可能的将上有服务器返回的数据缓冲到本地，然后一次性的全部返回给客户端，如果每次从上游服务器返回的数据都需要写入到磁盘中，那么nginx的性能肯定会降低；所以我们需要根据实际情况对nginx的缓存做优化。

<code>proxy_buffer_size</code>: 设置nginx缓冲区的大小，用来存储upstream端响应的header。

<code>proxy_buffering</code>: 启用代理内容缓冲，当该功能禁用时，代理一接收到上游服务器的返回就立即同步的发送给客户端，<code>proxy_max_temp_file_size</code>被设置为0；通过设置<code>proxy_buffering</code>为on，<code>proxy_max_temp_file_size</code>为0 可以确保代理的过程中不适用磁盘，只是用缓冲区; 开启后<code>proxy_buffers</code>和<code>proxy_busy_buffers_size</code>参数才会起作用

<code>proxy_buffers</code>: 设置响应上游服务器的缓存数量和大小，当一个缓冲区占满后会申请开启下一个缓冲区，直到缓冲区数量到达设置的最大值

<code>proxy_busy_buffers_size</code>: 在从上游服务器读取响应数据时分配给发送到客户端响应的缓冲区大小，所有连接共用<code>proxy_busy_buffers_size</code>设置的缓冲区大小，一旦<code>proxy_buffers</code>设置的buffer被写入，直到buffer里面的数据被完整的传输完（传输到客户端），这个buffer将会一直处在busy状态，我们不能对这个buffer进行任何别的操作。所有处在busy状态的buffer size加起来不能超过<code>proxy_busy_buffers_size</code>，所以<code>proxy_busy_buffers_size</code>是用来控制同时传输到客户端的buffer数量的；典型是设置成<code>proxy_buffers</code>的两倍。

nginx代理缓冲的设置都是作用到每一个请求的，想要设置缓冲区的大小到最佳状态，需要测量出经过反向代理服务器器的平均请求数和响应的大小；<code>proxy_buffers</code>指令的默认值 8个 4kb 或者 8个 8kb（具体依赖于操作系统），假如我们的服务器是1g，这台服务器只运行了nginx服务，那么排除到操作系统的内存使用，保守估计nginx能够使用的内存是768m

每个活动的连接使用缓冲内存：8个4kb = 8 4 1024 = 32768字节

系统可使用的内存大小768m: 768 1024 1024 = 805306368字节

所以nginx能够同时处理的连接数：805306368 / 32768 = 24576

经过我们的粗略估计，1g的服务器只运行nginx大概可以同时处理24576个连接。

假如我们测量和发现经过反向代理服务器响应的平均数据大小是 900kb , 而默认的 8个4kb的缓冲区是无法满足的，所以我们可以调整大小

这样设置之后每次请求可以达到最快的响应，但是同时处理的连接数减少了，<code>(768 * 1024 * 1024) / (30 * 32 * 1024)</code>=819个活动连接；

如果我们系统的并发数不是太高，我们可以将<code>proxy_buffers</code>缓冲区的个数下调，设置稍大的<code>proxy_busy_buffers_size</code>加大往客户端发送的缓冲区，以确保nginx在传输的过程中能够把从上游服务器读取到的数据全部写入到缓冲区中。

nignx除了可以缓冲上游服务器的响应达到快速返回给客户端，它还可以是实现响应的缓存，通过上图我们可以看到

1a: 一个请求到达nginx，先从缓存中尝试获取

1b: 缓存不存在直接去上游服务器获取数据

1c: 上游服务器返回响应，nginx把响应放入到缓存

1d: 把响应返回到客户端

2a: 另一个请求达到nginx, 到缓存中查找

2b: 缓存中有对应的数据，直接返回，不去上游服务器获取数据

nginx的缓存常用配置：

<code>proxy_cache_path</code>: 放置缓存响应和共享的目录。<code>levels</code> 设置缓存文件目录层次, levels=1:2 表示两级目录，最多三层，其中 1 表示一级目录使用一位16进制作为目录名，2 表示二级目录使用两位16进制作为目录名，如果文件都存放在一个目录中，文件量大了会导致文件访问变慢。<code>keys_zone</code>设置缓存名字和共享内存大小，<code>inactive</code> 当被放入到缓存后如果不被访问的最大存活时间，<code>max_size</code>设置缓存的最大空间

<code>proxy_cache</code>: 定义响应应该存放到哪个缓存区中（<code>keys_zone</code>设置的名字）

<code>proxy_cache_key</code>: 设置缓存使用的key, 默认是完整的访问url，可以自己根据实际情况设置

<code>proxy_cache_lock</code>: 当多个客户端同时访问一下url时，如果开启了这个配置，那么只会有一个客户端会去上游服务器获取响应，获取完成后放入到缓存中，其他的客户端会等待从缓存中获取。

<code>proxy_cache_lock_timeout</code>: 启用了<code>proxy_cache_lock</code>之后，如果第一个请求超过了<code>proxy_cache_lock_timeout</code>设置的时间默认是5s，那么所有等待的请求会同时到上游服务器去获取数据，可能会导致后端压力增大。

<code>proxy_cache_min_uses</code>: 设置资源被请求多少次后才会被缓存

<code>proxy_cache_use_stale</code>: 在访问上游服务器发生错误时，返回已经过期的数据给客户端；当缓存内容对于过期时间不敏感，可以选择采用这种方式

<code>proxy_cache_valid</code>: 为不同响应状态码设置缓存时间。如果设置<code>proxy_cache_valid 5s</code>，那么所有的状态码都会被缓存。

设置所有的响应被缓存后最大不被访问的存活时间6小时，缓存的大小设置为1g，缓存的有效期是1天，配置如下：

如果当前响应中设置了set-cookie头信息，那么当前的响应不会被缓存，可以通过使用<code>proxy_ignore_headers</code>来忽略头信息以达到缓存

如果这样做了，我们需要把cookie中的值作为<code>proxy_cache_key</code>的一部分，防止同一个url响应的数据不同导致缓存数据被覆盖，返回到客户端错误的数据

注意，这种情况还是有问题，因为在缓存的key中添加cookie信息，那么可能导致公共资源被缓存多份导致浪费空间；要解决这个问题我们可以把不同的资源分开配置，比如：

虽然我们设置了缓存加快了响应，但是有时候会遇到缓存错误的请求，通常我们需要为自己开一个后面，方便发现问题之后通过手动的方式及时的清理掉缓存。nginx可以考虑使用<code>ngx_cache_purge</code>模块进行缓存清理。

该方法要限制访问权限； <code>proxy_cache_purge</code>缓存清理的模块，<code>cache_one</code>指定的key_zone，<code>$host$1$is_args$args</code> 指定的生成缓存key的参数

如果有大的静态文件，这些静态文件基本不会别修改，那么我们就可以不用给它设置缓存的有效期，让nginx直接存储这些文件直接。如果上游服务器修改了这些文件，那么可以单独提供一个程序把对应的静态文件删除。

请求首先会去<code>/img</code>中查找文件，如果不存在再去上游服务器查找；<code>internal</code> 指令用于指定只允许来自本地 nginx 的内部调用，来自外部的访问会直接返回 404 not found 状态。<code>proxy_store</code>表示需要把从上游服务器返回的文件存储到 <code>/var/www/data</code>； <code>proxy_store_access</code>设置访问权限

<code>cache-control</code>和<code>expires</code> 设置资源缓存的有效期

使用<code>last-modified / if-modified-since</code>判断缓存是否有效

使用<code>if-none-match / etag</code>判断缓存是否有效

通过配置nginx缓冲区大小对nginx调优

使用nginx缓存加快请求响应速度

如何加快请求响应的速度，本篇我们主要围绕着http缓存和nignx反向代理两个方面来聊了缓存，你以为这样就完了吗，不！下一篇我们将从应用程序的维度来聊聊缓存

文中或许会存在或多或少的不足、错误之处，有建议或者意见也非常欢迎大家在评论交流。

最后，白嫖不好，创作不易，希望朋友们可以点赞评论关注三连，因为这些就是我分享的全部动力来源

万字长文聊缓存（上）

继续阅读

nginx虚拟主机配置及负载均衡示例

欢迎使用CSDN-markdown编辑器Nginx配置文件nginx.conf中文详解（总结）

云服务器部署项目：vue-cli 部署服务配置

win7 localhost 配置 nginx ssl自签名证书步骤报错相关链接

（Nginx）03_Nginx原理与优化一、Nginx原理二、master-workers机制三、面试题：

（Nginx）02_Nginx配置实例一、Nginx的应用：反向代理实现一：二、反向代理实例二：三、Nginx的配置实例三–负载均衡：四、Nginx的配置实例四–动静分离：Nginx在实际开发中的应用：

nginx配置示例

niginx的location的location详细规则和优先级关系以及测试案例2.1匹配语法2.2优先级判断2.3练习3.1处理逻辑如何执行3.2功能测试3.3流程解析

Puppet自动化Nginx+Mongrel负载均衡配置

Ubuntu修改nginx将多个域名分别配置到服务器不同端口

Nginx服务优化（1）——隐藏版本号、修改用户与组、网页缓存时间、日志切割、连接超时一、隐藏版本号二、修改用户与组三、配置Nginx网页缓存时间四、实现Nginx日志分割五、配置Nginx实现连接超时六、补充关于时间日期的命令

修改or隐藏nginx版本号

Nginx安全改动：隐藏Nginx版本号背景解决serve_tokens指令参考

版本号隐藏

Nginx服务优化（版本隐藏、版本号伪装、超时管理、进程管理、日志分割）Nginx服务优化未完待续

nginx location中斜线的位置的重要性