天天看点

CC 排查集锦

【场景1-访问资源出现 5xx】

PC 端排查方法

一、网络测试

访问

https://cdn.dns-detect.alicdn.com/https/doc.html

,获取到客户端的 IP 、DNS 提供阿里云排查后端日志,以及客户端 DNS 、IP 调度是否正常排查;

CC 排查集锦

网民执行 "nslookup 域名 114.114.114.114" 命令结果;

CC 排查集锦

二、判断出现 5xx 范围

提供大致异常的时间范围;

  • 2.1 如果是大面积的某个地区集体出现了 5xx 无法访问,让网民直接 nslookup $domain,提供下解析出来的 IP 以及域名,阿里云优先排查节点;
  • 2.2 如果是个别用户访问异常,需要继续向下的分析;

三、网民浏览器测试

打开浏览器的 F12 (debug 功能)或者邮件 ”检查元素“ 在浏览器中输入客户要访问的 URL ,或者 CC 自己网站中输入 URL 将客户端发起请求和完整的 response header 截图提供下;



CC 排查集锦

结果分析

  • 3.1、如果发现 response header 中有 “X-Swift-Error: orig response 5XX error” 的 header,说明回源到 CC 原站后出现的 5xx ,需要 CC 先确认下原站的网络、应用层、安全策略等是否正常;
  • 3.2、如果客户端没有抓到 response header 就出现了 5xx ,和客户端关系比较大。比如 504 可能和客户端的 TCP 建联超时;
  • 3.3、如果网民的 request header(请求头) 中还没有解析出 IP 说明是客户端 DNS 故障导致解析失败;
  • 3.4、如果网民访问 CDN 出现了 5xx,但 CDN 返回的响应头中没有出现 “X-Swift-Error: orig response 5XX error“ 的字段,那需要 CDN 先自查下;

四、最终办法

如果以上网民都不方便操作,排查难度和时间成本增加,需要做一个最基础配合测试;

手机端排查方法

CC 排查集锦

二、提供异常的访问 URL

提供访问异常的 URL,以及大致时间,便于结合第一步的客户端 IP 捞取后端日志;

三、网民端测试信息

有条件网民可以下载一个 ping 软件,直接输入域名,提供下 ping 的截图;

或者让阿里云提供一个 URL诊断地址让网民直接访问,后端可以跟踪到诊断 URL的全链路日志;

【场景2—视频无法播放】

类似这种无法复现的问题也没有出现 5xx 的状态码,只能通过服务端过滤日志分析节点,以及请求的详细日志来判断;

  • 提供异常的 URL,以及异常时间范围,便于过滤后端日志;
  • 提供 网民的 IP、DNS结果
  • 让阿里云提供一个 URL诊断地址让网民直接访问,后端可以跟踪到诊断 URL的全链路日志;

【场景3-视频播放异常】

如果是播放过程中出现了 5xx ,可以按照 【访问资源出现 5xx】 的方式排查

如果是播放过程中未出现 5xx ,正常的 2xx 参数排查方式如下

CC 排查集锦
CC 排查集锦

二、或者访问到的节点

PC 端打开 CMD 或者使用命令行,执行 “nslookup 域名 114.114.114.114” ,将解析结果提供给阿里云;

三、判断播放异常范围

如果是大面积地区播放视频异常,可以提供下 nslookup 解析的异常节点,我们优先排查节点;

如果是个别网民播放异常,可以继续下面步骤排查;

四、网民测试

在主流 浏览器中输入客户要访问的 URL ,或者 CC 自己网站中输入 URL ,开启 F12 的 debug 检查功能(或者右键检查),将客户端发起请求和完整的 response header 截图提供下;

CC 排查集锦
  • 4.1、如果发现 response header 中有 “X-Swift-Error: orig response 5XX error” 的 header,说明回源到 CC 原站后出现的 5xx ,需要 CC 先确认下原站的网络、应用层、安全策略等是否正常;
  • 4.2、如果客户端没有抓到 response header 就出现了 5xx ,和客户端关系比较大。比如 504 可能和客户端的 TCP 建联超时;
  • 4.3、如果网民的 request header(请求头) 中还没有解析出 IP 说明是客户端 DNS 故障导致解析失败;
  • 4.4、如果网民访问 CDN 出现了 5xx,但 CDN 返回的响应头中没有出现 “X-Swift-Error: orig response 5XX error“ 的字段,那需要 CDN 先自查下;

【场景3-加载资源慢】

,获取到客户端的 IP 、DNS 提供阿里云排查使用,方便后端快速的缩小日志排查范围,以及客户端 DNS 、IP 调度是否正常排查;

CC 排查集锦

二、判断访问慢的范围

出现访问慢的时间范围;

如果是某个地区大面积访问慢,阿里云优先对第一步的节点进行排查;

如果是个别客户访问慢,继续进行排查;

1、打开浏览器的 F12 (debug 功能)或者邮件 ”检查元素“ 在浏览器中输入客户要访问的 URL ,或者 CC 自己网站中输入 URL 将客户端发起请求和完整的 response header 截图提供下;

CC 排查集锦

2、有条件的网民可以在 PC 端,更改 hosts 文件,固定原站 IP 进行测试对比,看访问原站是否也慢;

mac/Linux hosts 文件在 /etc/hosts 下,编辑文件内容,添加格式为 “原站IP 域名”;

windows hosts 文件在 C:WindowsSystem32driversetc 下,编辑文件内容,添加格式为 “原站IP 域名”;

【场景4-直播异常诊断】

一、直播诊断机器人

先通过 【CDN】CC视频企业级服务 群内的 “直播诊断机器人” 分析下直播推流上行是否存在异常,排除基本问题;

如果分析结果中上行推流正常可以继续排查;

CC 排查集锦

二、网络测试

PC 端客户需要搜集下信息;

  • CC 排查集锦

手机端客户需要搜集下信息;

  • 有条件客户可以下载一个 ping 软件,提供 ping 域名返回的结果截图;

直播流信息

完成直播播放 URL;

出现直播卡顿的异常时间点;

【场景5-解析的节点无法访问】

提供以下信息,给到阿里云排查:

  • 1、 “nslookup cname ” 解析结果
  • 2、 “nslookup 域名 ” 解析结果
  • 3、 “nslookup 域名 114.114.114.114" 解析结果
  • 4、客户端访问异常的 URL ;
  • 5、访问

如果发现第 1、3 步解析的 IP 是相似的也能访问通,而第 2 步解析出来的结果完全不一样也访问不通。说明很大可能是网民的 DNS 出现异常,调度到了一个非阿里云节点,或者一个阿里云下线的节点,此时建议反馈阿里云的同时,也让网民反馈下当地的运营商;

继续阅读