1. Cluster SLO and Error budget

1.1 Cluster control plane SLO

avg(
avg_over_time((sum without ()(kube_pod_container_status_ready{namespace="kube-system",pod=~".*.dashboard.*|.*.dns.*|kube.*|.*.calico.*|.*.flannel.*|.*.etcd.*"}) 
/ 
count without ()(kube_pod_container_status_ready{namespace="kube-system",pod=~".*.dashboard.*|.*.dns.*|kube.*|.*.calico.*|.*.flannel.*|.*.etcd.*"}))[$duration:5m])
)

k8s的grafana的dashboard指标分析1. Cluster SLO and Error budget 2. Overall cluster status 3.master Node details 4. Namespace monitoring details5. API Server

k8s集群要达到的服务质量目标（SLO）SLO 关注时间

99% 的可用性意味着什么？它不是 1% 的错误率 (失败的 http 响应的百分比)，而是在一个预定义的时间段内可用服务的时间百分比。

1.2 Cluster control plane error budget remaining

(( avg(avg_over_time((sum without ()(kube_pod_container_status_ready{namespace="kube-system",pod=~".*.dashboard.*|.*.dns.*|kube.*|.*.calico.*|.*.flannel.*|.*.etcd.*"}) 
/ 
count without ()(kube_pod_container_status_ready{namespace="kube-system",pod=~".*.dashboard.*|.*.dns.*|kube.*|.*.calico.*|.*.flannel.*|.*.etcd.*"}))[$duration:5m])
)) - 0.98999999999999999 ) 
* 
avg((time() - timestamp(up{job="apiserver",namespace="default",service="kubernetes"} offset $duration)))

k8s的grafana的dashboard指标分析1. Cluster SLO and Error budget 2. Overall cluster status 3.master Node details 4. Namespace monitoring details5. API Server

群集控制平面错误预算剩余

1.3 Promtheus monitoring SLO

avg(
avg_over_time((sum without ()(kube_pod_status_ready{namespace="monitoring",pod="prometheus-prometheus-operator-prometheus-0",condition="true"}) 
/ 
count without ()(kube_pod_status_ready{namespace="monitoring",pod="prometheus-prometheus-operator-prometheus-0"}))[$duration:5m])
)

k8s的grafana的dashboard指标分析1. Cluster SLO and Error budget 2. Overall cluster status 3.master Node details 4. Namespace monitoring details5. API Server

2. Overall cluster status

k8s的grafana的dashboard指标分析1. Cluster SLO and Error budget 2. Overall cluster status 3.master Node details 4. Namespace monitoring details5. API Server

Burstable: pod中只要有一个容器的requests和limits的设置不相同，该pod的QoS即为Burstable。举例如下：

Container bar没有指定resources

containers:
name: foo
resources:
  limits:
    cpu: 10m
    memory: 1Gi
  requests:
    cpu: 10m
    memory: 1Gi

name: bar

Burstable 举例2：pod中只要有一个容器没有对cpu或者memory中的request和limits都没有明确指定。

containers:
name: foo
resources:
  limits:
    memory: 1Gi

name: bar
resources:
  limits:
    cpu: 100m

Burstable 举例3：Container foo没有设置limits，而bar requests与 limits均未设置。

containers:
name: foo
resources:
  requests:
    cpu: 10m
    memory: 1Gi  
name: bar

Best-Effort：如果对于全部的resources来说requests与limits均未设置，该pod的QoS即为Best-Effort。举例如下：

containers:
name: foo
resources:
name: bar
resources:

k8s的grafana的dashboard指标分析1. Cluster SLO and Error budget 2. Overall cluster status 3.master Node details 4. Namespace monitoring details5. API Server

3.master Node details

k8s的grafana的dashboard指标分析1. Cluster SLO and Error budget 2. Overall cluster status 3.master Node details 4. Namespace monitoring details5. API Server

k8s的grafana的dashboard指标分析1. Cluster SLO and Error budget 2. Overall cluster status 3.master Node details 4. Namespace monitoring details5. API Server
4. Namespace monitoring details

k8s的grafana的dashboard指标分析1. Cluster SLO and Error budget 2. Overall cluster status 3.master Node details 4. Namespace monitoring details5. API Server

5. API Server

k8s的grafana的dashboard指标分析1. Cluster SLO and Error budget 2. Overall cluster status 3.master Node details 4. Namespace monitoring details5. API Server

k8s的grafana的dashboard指标分析1. Cluster SLO and Error budget 2. Overall cluster status 3.master Node details 4. Namespace monitoring details5. API Server

1. Cluster SLO and Error budget

1.1 Cluster control plane SLO

1.2 Cluster control plane error budget remaining

1.3 Promtheus monitoring SLO

2. Overall cluster status

3.master Node details

k8s的grafana的dashboard指标分析1. Cluster SLO and Error budget 2. Overall cluster status 3.master Node details 4. Namespace monitoring details5. API Server
4. Namespace monitoring details

5. API Server

继续阅读

深入理解Kubernetes资源限制：内存深入理解Kubernetes资源限制：内存

安装harborInstallation and Configuration Guide

【k8s学习系列】第2篇，规模和更新部署k8s学习系列前言规模和更新部署总结

Kubernetes - Kubernetes 组件

k8s部署es集群和kibana

kubernetes学习笔记--挂载GlusterFS存储卷

Kubernetes - Xshell连接虚拟机 & 搭建Kubernetes基础集群

Kubernetes学习--资源管理方式

kubernetes-云原生技术进阶第18讲：Kubernetes 调度和资源管理第18讲：Kubernetes 调度和资源管理一、Kubernetes 调度过程二、Kubernetes 基础调度力三、Kubernetes 高级调度能力

通过serviceAccount的secret访问kubernetes API Server前提设置环境变量通过curl访问restAPI额外部分

cephadm离线搭建v17.2.0 Quincy版本Ceph集群集群规划准备工作

使用jvm监控工具(jconsole、jvisualvm)通过jmx远程连接kubernetes上的java应用

企业级监控管理平台建设密谈

Error: docker-ce conflicts with 2:docker-1.13.1-53.git774336d.el7.centos.x86_64

golang构建Dockerfile，并打包成镜像，运行在docker和k8s上

使用kubeadm+calico部署kubernetes v1.25.3

k8s的grafana的dashboard指标分析1. Cluster SLO and Error budget 2. Overall cluster status 3.master Node details 4. Namespace monitoring details5. API Server

1. Cluster SLO and Error budget

1.1 Cluster control plane SLO

1.2 Cluster control plane error budget remaining

1.3 Promtheus monitoring SLO

2. Overall cluster status

3.master Node details

k8s的grafana的dashboard指标分析1. Cluster SLO and Error budget 2. Overall cluster status 3.master Node details 4. Namespace monitoring details5. API Server 4. Namespace monitoring details

5. API Server

继续阅读

k8s的grafana的dashboard指标分析1. Cluster SLO and Error budget 2. Overall cluster status 3.master Node details 4. Namespace monitoring details5. API Server
4. Namespace monitoring details