天天看点

流程业务监控设计一览

初衷:为了流程开放平台的高可用,可监控,快速报警,人员快速响应问题解决,更重要的就是用户体验,因为你app的响应时间很大程度影响用户喜好,所以我们项目对监控内容作了详细划分

监控工具:cat打点,granafa监控配置,运维监控报警平台

监控分类

一.系统层监控

 这一块基本不用业务开发设计,目前的cat,zabbx等都提供基础监控:gc,redis,mysql,io,带宽等等

二.业务监控

 1.接口响应时间监控,报警频率不需要每次超过阙值就报警,一般超过阙值的频率10/s就需要报警

 2.被调用接口请求量监控,这个监控主要是为了防范调用方和黑客攻击,一样超过阙值范围需要报警,我们服务是有多租户的分布式限流的,会统计监控具体的租户,做溯源。

3.调用外部接口的响应监控,这个主要是为了防范外部系统超时,响应慢导致自己服务出现问题,当然有各种熔断重试机制(接入hystrix监控),但是我们的目标是自己打点监控统计到公司平台,毕竟很多公司都有自己的技术栈

4.业务监控细分,比如我们流程中心为了快速发现问题,需要将流程扭转,人员,表单,java异常等不同内部领域的异常分别报警给相关负责人,我们的做法是不同领域定义不同的异常类extends Exception,在同一异常拦截中心进行捕获上报

在运维监控平台增加规则拦截,每个异常配置一个服务人,进行报警

继续阅读