天天看點

用戶端-RBD監控埋點

1. perf dump

  • ceph daemon /var/run/ceph/ceph-client.admin.asok perf dump

1. RBD Client Metrics Table

監控類型 監控項 說明 級别
AsyncMessenger* msgr_recv_messages 網絡接收消息
* msgr_send_messages 網絡發送消息
msgr_recv_bytes 網絡接收位元組
msgr_send_bytes 網絡發送位元組
msgr_created_connections 建立連接配接數
msgr_active_connections 有效連接配接數
msgr_running_total_time 線程運作的總時間
msgr_running_send_time 消息發送的總時間
msgr_running_recv_time 消息接收的總時間
msgr_running_fast_dispatch_time 快速排程總時間

2. RBD Finisher-RadosClient Metrics Table

finisher-radosclient queue_len 隊列長度
complete_latency.avgcount 完成延遲 平均數
complete_latency.sum 完成延遲 總數
complete_latency.avgtime 完成延遲 平均時間

3. RBD ObjectCacher-librbd-{id}-{pool}-{image} Metrics Table

objectcacher-librbd-{id}-{pool}-{image} cache_ops_hit 命中緩存
cache_ops_miss 穿透緩存
cache_bytes_hit 命中緩存大小
cache_bytes_miss 穿透緩存大小
data_read 讀資料大小
data_written 寫緩存資料大小
data_flushed 資料重新整理
data_overwritten_while_flushing 重新整理時資料重寫
write_ops_blocked 肮髒限制延遲的寫操作
write_bytes_blocked 寫入髒資料的限制
write_time_blocked 由于髒資料限制而阻塞寫入的時間

4. RBD librbd-{id}-{pool}-{image} Metrics Table

librbd-{id}-{pool}-{image} rd 讀操作數
rd_bytes 讀操作的位元組數
rd_latency.avgcount 讀操作延遲隊列的平均數
rd_latency.sum 讀操作延遲隊列的總數
rd_latency.avgtime 讀操作延遲隊列的平均時間
wr 寫操作數
wr_bytes 寫操作位元組數
wr_latency.avgcount 寫操作延遲隊列的平均數
wr_latency.sum 寫操作延遲隊列的總數
wr_latency.avgtime 寫操作延遲隊列的平均時間
discard 丢棄操作數
discard_bytes 丢棄操作位元組數
discard_latency.avgcount 丢棄操作延遲隊列平均數
discard_latency.sum 丢棄操作延遲隊列總數
discard_latency.avgtime 丢棄操作延遲隊列平均時間
flush 重新整理操作數
aio_flush 異步IO重新整理操作數
aio_flush_latency.avgcount 異步IO重新整理操作延遲隊列平均數
aio_flush_latency.sum 異步IO重新整理操作延遲隊列總數
aio_flush_latency.avgtime 異步IO重新整理操作延遲隊列平均時間
ws WriteSame: 清零操作offload到存儲,加速塊配置設定、克隆、資料初始化操作
ws_bytes ws位元組數大小
ws_latency.avgcount ws延遲隊列平均數
ws_latency.sum ws延遲隊列總數
ws_latency.avgtime ws延遲隊列平均時間
cmp
cmp_bytes cmp位元組數大小
cmp_latency.avgcount cmp延遲隊列平均數
cmp_latency.sum cmp延遲隊列總數
cmp_latency.avgtime cmp延遲隊列平均時間
snap_create 快照建立數
snap_remove 快照移除數
snap_rollback 快照復原數
snap_rename 快照重命名數
notify 更新通知數
resize 調整大小
readahead 讀取頭數
readahead_bytes 讀取頭大小
invalidate_cache 緩存失效

5. objecter

perf dump objecter op_active 主動操作數
op_laggy 消極操作數
op_send 發送操作數
op_send_bytes 發送操作bytes
op_resend 重操作數
op_reply 回複操作數
op 操作數
op_r
op_w
op_rmw 讀寫修改操作數
op_pg PG操作數
osdop_stat 操作狀态
osdop_create 建立對象操作
osdop_read 讀操作
osdop_write 寫操作
osdop_writefull 寫滿對象操作
osdop_writesame 寫相同的對象操作
osdop_append 追加操作
osdop_zero 設定對象0操作
osdop_truncate 截斷對象操作
osdop_delete 删除對象操作
osdop_mapext 映射範圍操作
osdop_sparse_read 稀少讀操作
osdop_clonerange 克隆範圍操作
osdop_getxattr 擷取xattr操作
osdop_setxattr 設定xattr操作
osdop_cmpxattr 比較xattr操作
osdop_rmxattr 移除xattr操作
osdop_resetxattrs 重置xattr操作
osdop_tmap_up tmap更新操作
osdop_tmap_put tmap推送操作
osdop_tmap_get tmap擷取操作
osdop_call 調用執行操作
osdop_watch 監控對象操作
osdop_notify 對象操作通知
osdop_src_cmpxattr 多個操作擴充屬性
osdop_pgls pg對象操作
osdop_pgls_filter pg過濾對象操作
osdop_other 其他操作
linger_active 主動延遲操作
linger_send 延遲發送操作
linger_resend 延遲重新發送
linger_ping 延遲ping操作
poolop_active 主動池操作
poolop_send 發送池操作
poolop_resend 重新發送池操作
poolstat_active 主動擷取池子統計操作
poolstat_send 發送池子統計操作
poolstat_resend 重新發送池子統計操作
statfs_active fs狀态操作
statfs_send 發送fs狀态
statfs_resend 重新發送fs狀态
command_active 活動的指令
command_send 發送指令
command_resend 重新發送指令
map_epoch OSD map epoch
map_full 接收滿的OSD map
map_inc 接收到增量OSD map
osd_sessions osd 會話
osd_session_open 打開osd會話
osd_session_close 關閉osd會話
osd_laggy 緩慢的osd會話
omap_wr osd map讀寫操作
omap_rd osd map讀操作
omap_del osd map删除操作

6. throttle

perf dump throttle-* val 目前可用的值
max 最大限制數
get 擷取到的值
get_sum 擷取到的總數
get_or_fail_fail 擷取或者錯誤值
get_or_fail_success 擷取或者錯誤成功值
take 接受值
take_sum 接受總數
put 推送值
put_sum 推送總數
wait.avgcount 等待平均數量
wait.sum 等待總數