天天看点

ceph分布式存储-检查集群健康状态

1. 检查集群

输出信息里包含:

集群的 ID

集群健康状况

monitor map 版本和 mon 法定人数状态

OSD map 版本和 OSD 状态摘要

PG map 版本

PG 和 Pool 的数量

集群存储的数据量,对象的总量,以及集群的已用容量/总容量/可用

容量

客户端的 iops 信息

输出的 GLOBAL 段展示了数据所占用集群存储空间的概要:

SIZE: 集群的总容量。

AVAIL: 集群的可用空间总量。

RAW USED:已用存储空间总量。

% RAW USED:已用存储空间比率。用此值对比 full ratio 和 near full ratio 来确保不会用尽集群空间。

输出的 POOLS 段展示了存储池列表及各存储池的大致使用率。本段没有反映出副本、克隆和快照的占用情况。例如,如果你把 1MB 的数据存储为对象,理论使用率将是 1MB ,但考虑到副本数、克隆数、和快照数,实际使用量可能是 2MB 或更多。

NAME:存储池名字。

ID:存储池唯一标识符。

USED:大概数据量,单位为 KB 、MB 或 GB ;

%USED:各存储池的大概使用率。

Objects:各存储池内的大概对象数。

2. 检查osd

3. 检查mon

要检查监视器的法定人数状态,执行下面的命令:

4. 检查 MDS

元数据服务器为 Ceph 文件系统提供元数据服务,不过在当前生产环境中并未部署 MDS 。

元数据服务器有两种状态: up | down 和 active | inactive ,执行下面的命令查看元数据服务器状态为 up 且 active :

要展示元数据集群的详细状态,执行下面的命令:

5. 检查PG

PG 把对象映射到 OSD 。监控 PG 时,我们希望它们的状态是 active 且 clean。

6. 使用管理套接字

Ceph 管理套接字允许你通过套接字接口查询守护进程,它们默认存在于 /var/run/ceph 下。要通过管理套接字访问某个守护进程,先登录它所在的主机、再执行下列命令:

比如,这是下面这两种用法是等价的:

用下列命令查看可用的管理套接字命令:

管理套接字命令允许你在运行时查看和修改配置。

另外,你可以在运行时直接修改配置选项(也就是说管理套接字会绕过 Mon,不要求你直接登录宿主主机,不像 ceph {daemon-type} tell {id} injectargs 会依赖监视器)。

继续阅读