天天看点

Linux服务器性能数据收集

Linux中的top,free等命令不能完全满足我们性能数据收集的要求,我们需要一个更加强大的工具来收集性能数据。

经过考察和对比,发现 Sysstat是一个非常强大的工具,因此下载了试了下,效果不错。Sysstat是一个工具集,

包括sar、pidstat、iostat、mpstat、sadf、sadc。 其中sar是其中最强大,也是最能符合我们测试要求的工具,

同时pidstat也是非常有用的东东,因此本文结合性能测试重点介绍这两个工具。

Sysstat的安装

从http://pagesperso-orange.fr/sebastien.godard/download.html下载最新版本,解压, 安装

wget http://pagesperso-orange.fr/sebastien.godard/sysstat-9.1.7.tar.gz

tar zxvf sysstat - 8.1 . 2 .tar.gz

cd sysstat - 8.1 . 2

. / configure

make

su

<enter root password >

make install

监视某个进程

通过ps命令找到相应进程的PID:

ps - e

使用pidstat命令监视进程 pidstat 2 5                     // 每隔2秒,显示5次,所有活动进程的CPU 使用情况

pidstat - p 3132 2 5      // 每隔2秒,显示5次,PID为1643的进程的CPU使用情况显示

pidstat - p 3132 2 5 - r // 每隔2秒,显示5次,PID为1643的进程的内存使用情况显示

pidstat命令没有保存性能数据的功能。

查看性能数据

sar是最强大的了,通过sar几乎可以监视所有的性能数据,同时,sar还支持将性能数据保存起来。

sar 2 5 // 每隔2秒,显示5次,CPU使用的情况

sar - r 2 5 // 每隔2秒,显示5次,内存使用的情况

sar - n DEV 2 5 // 每隔2秒,显示5次,网络吞吐量情况

sar 1 10 > data.txt // 每隔1秒,写入10次,把CPU使用数据保存到data.txt文件中。

sar 1 0 - e 15 : 00 : 00 > data.txt// 每隔1秒记录CPU的使用情况,直到15点,数据将保存到data.txt文件中。

(-e 参数表示结束时间,注意时间格式: 必须为 hh:mm:ss格式)

sar 1 0 - r - e 15 : 00 : 00 > data.txt // 每隔1秒记录内存使用情况,直到15点,数据将保存到data.txt文件中。

sar 1 0 - n DEV - e 15 : 00 : 00 > data.txt  // 每隔1秒记录网络使用情况,直到15点,数据将保存到data.txt文件中。

保存为二进制文件

由于保存的二进制文件只有sar通过-f参数才能打开,不利于我们分 析和统计数据,因此不推荐使用这个方法。

保存二进制文件的参数是-o,如:

sar 1 5 - r - o data

// 每隔1秒,写入5次,将内存使用的数据写入二进制文件data中。

sar - f data

// 查看data文件

Sar能工作,/proc目录必须被mount上来

CPU

-u

-P

内存

-r

-R

Block device情况 -d
I/O -b
页交换情况 -B
进程 -c
网络 -n
机器负载 -q
Swap -W
全部的信息 -A

CPU使用率 – 缺省

Report CPU utilization

-u

%user: Percentage of CPU utilization that occurred while exe cuting at the user level (application).

%nice:at the user level with nice priority

%system:at the system level (kernel).

%iowait:Percentage of time that the CPU or CPUs were idle during which the system had an outstanding disk I/O request

%idle: Percentage of time that the CPU or CPUs were idle and the system did not have an outstanding disk I/O request

CPU情况 -P cpu | ALL

统计单个或多个cpu的情况

ALL:再加上整体统计情况

-u 和–I SUM 2个参数跟着-P有意义。

内存使用率

Report memory and swap space utilization statistics

-r

所有的数量单位: kbytes

Kbmemfree、Kbmemused、%memused:

内存空闲、使用了,使用的%

Kbbuffers:内核当作buffer使用的内存

Kbcached::内核当作cache data使用的内存

Kbswpfree、Kbswpused、%swpused

Swap使用的3个值

Kbswpcad:缓存的swap空间。这个意思是:内存被swap out,又立即swap back in,但是还存在swap中,(如果memory需要,memory不需要再次swap out了,它在swap已经存在,节省了I/O)

内存使用统计

Report memory statistics

-R

frmpg/s:系统释放的内存页数量,如果是负数表示被系统分配的数量。内存页时4k或8k和系统架构有关。

bufpg/s:系统用作buffer的增量内存页

campg/s:系统用作cache的增量内存页

I/O和传输统计

I/O and tranfer statistics

-b

只在Kernal2.5以前的版本中才有效

Tps:物理磁盘每秒总的传输量。多个逻辑的请求可能被合并成一个单独的磁盘请求。

Rtps:读的请求

Wtps:写的请求

Bread/s:每秒从磁盘读的块数

Wread/s:每秒写的块数

页的统计消息

Paging statistics

-B

Pgpgin/s: 每秒磁盘page in的数量(kbytes)

Pgpgout/s:每秒磁盘page out的量(kbytes)

Fault/s:系统每秒page faults(major+minor)的数量(2.5以上kernal)

majflt/s:系统每秒产生的major faults数量(2.5以上kernel)

进程

Process creation

-c Proc/s:每秒产生的进程数量
Block device性能 -d

2.4或以上版本有

Devm-n: m:device的major number

n: device的 minor number(kernal 2.5)

tps: 设备的每秒传输量

rd_sec/s:设备的读的扇区数量(512k/sector)

wr_sec/s : 设备写的扇区数量(512k/sector)

采用文件

-f : 从。。读

-o: 写入。。。

从文件中获取数据(由-o产生的文件)

缺省值是current daily data file(/var/log/sa/sadd)

-f排斥-o参数

改变间隔时间 -i interval 单位是秒
网络情况

-n

-n DEV | EDEV | SOCK | FULL

DEV参数:

Network devices 的统计信息被报告

IFACE:设备名字

rxpck/s:每秒收到的包(package)

txpck/s:每秒传输的包

rxbyt/s:每秒收到的字节

txbyt/s:每秒传输的字节

rxcmp/s:每秒收到的压缩包(如cslip..)

txcmp/s:

rxmcst/s: 每秒收到的广播包

EDEV:

错误的统计信息

rxerr/s, txerr/s

coll/s: 传输过程中遇到的冲突包

rxdrop/s, txdrop/s:由于缺少Linux缓存区,被丢弃的接收/传输包

txcarr/s: 传输包时候遇到的carrier-errors数量

rxfram/s:接收frame对列错误数量

rxfifo/s:接收FIFO overrun错误数量

txfifo/s:传输的FIFO overrun错误数量

SOCK:

使用中的socket统计

Totsck: 使用中的socket

Tcpsck: tcp socket

Udpsck:

Rawsck:

ip-frag: Number of IP fragments currently in use.

机器负载

Report queue length and load averages

-q

runq-sz:运行的队列长度(number of processes waiting for run time)

plist-sz: (Number of processes in the process list)

ldavg-1、ldavg-5、ldavg-15:

1、5、15分钟平均负载

文件

Report status of inode, file and other kernel tables

-v

Dentunusd:Number of unused cache entries in the directory cache

file-sz:Number of used file handles

inode-sz:Number of used file handles

super-sz、%super-sz: Number of super block handlers allocated by the kerne。(regard to the maximum number of super block handlers that Linux can allocate)

dquot-sz、%dquot-sz:Number of allocated disk quota entries (regard to the maximum number of cached disk quota entries that can be allocated)

rtsig-sz、%rtsig-sz:Number of queued RT signals.(regard to the maxi mum number of RT signals that can be queued)

Report system switching activity -w cswch/s:Total number of context switches per second.

Swap:

Report swapping statistics

-W

pswpin/s: Total number of swap pages the system brought in per second

pswpout/s:Total number of swap pages the system brought out per second

Process相关

-x

-X

改变格式

-h

-H

设定时间

-e hh:mm:ss:结束时间

-s 开始时间

设置报告的截止时间。缺省的截止时间是18:00:00, 给出的时间必须24小时制。

这个参数只有当数据从文件中读写时候才有效(-f / -o 参数)。

如果同时使用-h参数,给出的时间是UTC时间