1. 检查集群
输出信息里包含:
集群的 ID
集群健康状况
monitor map 版本和 mon 法定人数状态
OSD map 版本和 OSD 状态摘要
PG map 版本
PG 和 Pool 的数量
集群存储的数据量,对象的总量,以及集群的已用容量/总容量/可用
容量
客户端的 iops 信息
输出的 GLOBAL 段展示了数据所占用集群存储空间的概要:
SIZE: 集群的总容量。
AVAIL: 集群的可用空间总量。
RAW USED:已用存储空间总量。
% RAW USED:已用存储空间比率。用此值对比 full ratio 和 near full ratio 来确保不会用尽集群空间。
输出的 POOLS 段展示了存储池列表及各存储池的大致使用率。本段没有反映出副本、克隆和快照的占用情况。例如,如果你把 1MB 的数据存储为对象,理论使用率将是 1MB ,但考虑到副本数、克隆数、和快照数,实际使用量可能是 2MB 或更多。
NAME:存储池名字。
ID:存储池唯一标识符。
USED:大概数据量,单位为 KB 、MB 或 GB ;
%USED:各存储池的大概使用率。
Objects:各存储池内的大概对象数。
2. 检查osd
3. 检查mon
要检查监视器的法定人数状态,执行下面的命令:
4. 检查 MDS
元数据服务器为 Ceph 文件系统提供元数据服务,不过在当前生产环境中并未部署 MDS 。
元数据服务器有两种状态: up | down 和 active | inactive ,执行下面的命令查看元数据服务器状态为 up 且 active :
要展示元数据集群的详细状态,执行下面的命令:
5. 检查PG
PG 把对象映射到 OSD 。监控 PG 时,我们希望它们的状态是 active 且 clean。
6. 使用管理套接字
Ceph 管理套接字允许你通过套接字接口查询守护进程,它们默认存在于 /var/run/ceph 下。要通过管理套接字访问某个守护进程,先登录它所在的主机、再执行下列命令:
比如,这是下面这两种用法是等价的:
用下列命令查看可用的管理套接字命令:
管理套接字命令允许你在运行时查看和修改配置。
另外,你可以在运行时直接修改配置选项(也就是说管理套接字会绕过 Mon,不要求你直接登录宿主主机,不像 ceph {daemon-type} tell {id} injectargs 会依赖监视器)。