top指令詳解

top指令

沒有圖形化界面下的linux，也有指令可以實作windows的任務管理器功能，這個指令就是"top"，使用者可以使用top來對程序排序，結束程序等.

top 指令是 linux 下常用的性能分析工具，能夠實時顯示系統中各個程序的資源占用狀況，預設5秒重新整理一下程序清單，是以類似于 windows 的任務管理器。

top指令顯示的前五行是系統整體的統計資訊。

top - 15:09:51 up 17 days , 3:38 , 4 users , load average : 1.09 , 3.39 , 4.76

15:09:51 目前時間

up 17 days , 3:38 系統運作時間，格式為時:分

4 users 目前登入使用者數

load average : 1.09 , 3.39 , 4.76 系統負載，即任務隊列的平均長度。

三個數值分别為1分鐘、5分鐘、15分鐘前到現在的平均值。

第二、三行為程序和cpu的資訊。當有多個cpu時，這些内容可能會超過兩行。eg.

tasks : 115 total , 1 running , 114 sleeping , 0stopped , 0zombie

cpu(s) : 16.1% us , 2.0% sy , 0.0% ni , 79.5% id , 1.4% wa , 0.0% hi , 1.0% si

tasks : 115 total 程序總數

0 zombie 僵屍程序數

cpu(s) : 16.1% us 使用者空間占用cpu百分比

2.0% sy 核心空間占用cpu百分比

0.0% ni 使用者程序空間内改變過優先級的程序占用cpu百分比

79.5% id 空閑cpu百分比

1.4% wa 等待輸入輸出的cpu時間百分比

0.0% hi

0.0% si

最後兩行為記憶體資訊。eg.

mem : 8169876 k total , 7686472 k used , 483404 k free , 35272 k buffers

swap : 4096532 k total , 160 k used , 4096372 k free , 2477532 k cached

mem : 8169876 ktotal 實體記憶體總量

7686472 k used 使用的實體記憶體總量

483404 k free 空閑記憶體總量

swap : 4096532 k total 交換分區總量

160 k used 使用的交換區總量

4096372 k free 空閑交換區總量

2477532 k cached 緩沖的交換區總量。

記憶體中的内容被換出到交換區，而後又被換入到記憶體，但使用過的交換區尚未被覆寫，該數值即為這些内容已存在于記憶體中的交換區的大小。相應的記憶體再次被換出時可不必再對交換區寫入。

統計資訊區域的下方顯示了各個程序的詳細資訊。首先來認識一下各列的含義。

pid user pr ni virt res shr s %cpu %mem time+ command

序号列名含義

pid 程序id

ppid 父程序id

ruser realusername

uid 程序所有者的使用者id

user 程序所有者的使用者名

group 程序所有者的組名

tty 啟動程序的終端名。不是從終端啟動的程序則顯示為?

pr 優先級

ninice 值。負值表示高優先級，正值表示低優先級

p 最後使用的cpu，僅在多cpu環境下有意義

%cpu 上次更新到現在的cpu時間占用百分比

time 程序使用的cpu時間總計，機關秒

time+ 程序使用的cpu時間總計，機關1/100秒

%mem 程序使用的實體記憶體百分比

virt 程序使用的虛拟記憶體總量，機關kb。virt=swap+res

swap 程序使用的虛拟記憶體中，被換出的大小，機關kb。

res 程序使用的、未被換出的實體記憶體大小，機關kb。res=code+data

code 可執行代碼占用的實體記憶體大小，機關kb

data 可執行代碼以外的部分(資料段+棧)占用的實體記憶體大小，機關kb

shr 共享記憶體大小，機關kb

nflt 頁面錯誤次數

ndrt 最後一次寫入到現在，被修改過的頁面數。

s 程序狀态。

d= 不可中斷的睡眠狀态

r= 運作

s= 睡眠

t= 跟蹤/停止

z= 僵屍程序

command 指令名/指令行

wchan 若該程序在睡眠，則顯示睡眠中的系統函數名

flags 任務标志，參考sched.h

top裡可以設定按照某一項來排序，預設的情況下，是按照cpu的使用情況來排序，

m,（注意大寫）,按記憶體使用情況排序

p , 根據cpu使用百分比大小進行排序

t, 根據時間/累計時間進行排序。

輸入字母k(小寫)，然後再輸入想要kill的pid

當然你也可直接運作指令,kill pid

top的其他用法，可以在top界面中，輸"h"，就可以進入到top指令幫助界面

檢視多核cpu指令

mpstat -p all 和 sar -p all

說明：sar -p all > aaa.txt 重定向輸出内容到檔案 aaa.txt

top指令經常用來監控linux的系統狀況，比如cpu、記憶體的使用，程式員基本都知道這個指令，但比較奇怪的是能用好它的人卻很少，例如top監控視圖中記憶體數值的含義就有不少的曲解。

本文通過一個運作中的web伺服器的top監控截圖，講述top視圖中的各種資料的含義，還包括視圖中各程序（任務）的字段的排序。

top進入視圖

top視圖 01

【top視圖 01】是剛進入top的基本視圖，我們來結合這個視圖講解各個資料的含義。

第一行：

10:01:23 — 目前系統時間

126 days, 14:29 — 系統已經運作了126天14小時29分鐘（在這期間沒有重新開機過）

2 users — 目前有2個使用者登入系統

load average: 1.15, 1.42, 1.44 — load average後面的三個數分别是1分鐘、5分鐘、15分鐘的負載情況。

load average資料是每隔5秒鐘檢查一次活躍的程序數，然後按特定算法計算出的數值。如果這個數除以邏輯cpu的數量，結果高于5的時候就表明系統在超負荷運轉了。

第二行：

tasks — 任務（程序），系統現在共有183個程序，其中處于運作中的有1個，182個在休眠（sleep），stoped狀态的有0個，zombie狀态（僵屍）的有0個。

第三行：cpu狀态

6.7% us — 使用者空間占用cpu的百分比。

0.4% sy — 核心空間占用cpu的百分比。

0.0% ni — 改變過優先級的程序占用cpu的百分比

92.9% id — 空閑cpu百分比

0.0% wa — io等待占用cpu的百分比

0.0% hi — 硬中斷（hardware irq）占用cpu的百分比

0.0% si — 軟中斷（software interrupts）占用cpu的百分比

在這裡cpu的使用比率和windows概念不同，如果你不了解使用者空間和核心空間，需要充充電了。

第四行：記憶體狀态

8306544k total — 實體記憶體總量（8gb）

7775876k used — 使用中的記憶體總量（7.7gb）

530668k free — 空閑記憶體總量（530m）

79236k buffers — 緩存的記憶體量（79m）

第五行：swap交換分區

2031608k total — 交換區總量（2gb）

2556k used — 使用的交換區總量（2.5m）

2029052k free — 空閑交換區總量（2gb）

4231276k cached — 緩沖的交換區總量（4gb）

這裡要說明的是不能用windows的記憶體概念了解這些資料，如果按windows的方式此台伺服器“危矣”：8g的記憶體總量隻剩下530m的可用記憶體。linux的記憶體管理有其特殊性，複雜點需要一本書來說明，這裡隻是簡單說點和我們傳統概念（windows）的不同。

第四行中使用中的記憶體總量（used）指的是現在系統核心控制的記憶體數，空閑記憶體總量（free）是核心還未納入其管控範圍的數量。納入核心管理的記憶體不見得都在使用中，還包括過去使用過的現在可以被重複利用的記憶體，核心并不把這些可被重新使用的記憶體交還到free中去，是以在linux上free記憶體會越來越少，但不用為此擔心。

如果出于習慣去計算可用記憶體數，這裡有個近似的計算公式：第四行的free + 第四行的buffers + 第五行的cached，按這個公式此台伺服器的可用記憶體：530668+79236+4231276 = 4.7gb。

對于記憶體監控，在top裡我們要時刻監控第五行swap交換分區的used，如果這個數值在不斷的變化，說明核心在不斷進行記憶體和swap的資料交換，這是真正的記憶體不夠用了。

第六行是空行

第七行以下：各程序（任務）的狀态監控

pid — 程序id

user — 程序所有者

pr — 程序優先級

ni — nice值。負值表示高優先級，正值表示低優先級

virt — 程序使用的虛拟記憶體總量，機關kb。virt=swap+res

res — 程序使用的、未被換出的實體記憶體大小，機關kb。res=code+data

shr — 共享記憶體大小，機關kb

s — 程序狀态。d=不可中斷的睡眠狀态 r=運作 s=睡眠 t=跟蹤/停止 z=僵屍程序

%cpu — 上次更新到現在的cpu時間占用百分比

%mem — 程序使用的實體記憶體百分比

time+ — 程序使用的cpu時間總計，機關1/100秒

command — 程序名稱（指令名/指令行）

多u多核cpu監控

在top基本視圖中，按鍵盤數字“1”，可監控每個邏輯cpu的狀況：

top視圖 02

觀察上圖，伺服器有16個邏輯cpu，實際上是4個實體cpu。

程序字段排序

預設進入top時，各程序是按照cpu的占用量來排序的，在【top視圖 01】中程序id為14210的java程序排在第一（cpu占用100%），程序id為14183的java程序排在第二（cpu占用12%）。可通過鍵盤指令來改變排序字段，比如想監控哪個程序占用mem最多，我一般的使用方法如下：

1. 敲擊鍵盤“b”（打開/關閉加亮效果），top的視圖變化如下：

top視圖 03

我們發現程序id為10704的“top”程序被加亮了，top程序就是視圖第二行顯示的唯一的運作态（runing）的那個程序，可以通過敲擊“y”鍵關閉或打開運作态程序的加亮效果。

2. 敲擊鍵盤“x”（打開/關閉排序列的加亮效果），top的視圖變化如下：

top視圖 04

可以看到，top預設的排序列是“%cpu”。

3. 通過”shift + >”或”shift + <”可以向右或左改變排序列，下圖是按一次”shift + >”的效果圖：

top視圖 05

視圖現在已經按照%mem來排序了。

改變程序顯示字段

1. 敲擊“f”鍵，top進入另一個視圖，在這裡可以編排基本視圖中的顯示字段：

top視圖 06

這裡列出了所有可在top基本視圖中顯示的程序字段，有”*”并且标注為大寫字母的字段是可顯示的，沒有”*”并且是小寫字母的字段是不顯示的。如果要在基本視圖中顯示“code”和“data”兩個字段，可以通過敲擊“r”和“s”鍵：

top視圖 07

2. “回車”傳回基本視圖，可以看到多了“code”和“data”兩個字段：

top視圖 08

top指令的補充

top指令是linux上進行系統監控的首選指令，但有時候卻達不到我們的要求，比如目前這台伺服器，top監控有很大的局限性。這台伺服器運作着websphere叢集，有兩個節點服務，就是【top視圖 01】中的老大、老二兩個java程序，top指令的監控最小機關是程序，是以看不到我關心的java線程數和客戶連接配接數，而這兩個名額是java的web服務非常重要的名額，通常我用ps和netstate兩個指令來補充top的不足。

監控java線程數：

ps -elf | grep java | wc -l

監控網絡客戶連接配接數：

netstat -n | grep tcp | grep 偵聽端口 | wc -l

上面兩個指令，可改動grep的參數，來達到更細緻的監控要求。

在linux系統“一切都是檔案”的思想貫徹指導下，所有程序的運作狀态都可以用檔案來擷取。系統根目錄/proc中，每一個數字子目錄的名字都是運作中的程序的pid，進入任一個程序目錄，可通過其中檔案或目錄來觀察程序的各項運作名額，例如task目錄就是用來描述程序中線程的，是以也可以通過下面的方法擷取某程序中運作中的線程數量（pid指的是程序id）：

ls /proc/pid/task | wc -l

在linux中還有一個指令pmap，來輸出程序記憶體的狀況，可以用來分析線程堆棧：

pmap pid

top指令詳解

繼續閱讀

Java String.format方法的簡單使用

neo4j之cypher使用文檔

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

mybatis_入門程式Mybatis入門

samba伺服器的功能

AOP程式設計_Android優雅權限架構(1)概念基礎，2021金三銀四前言正文大綱正文

Effective Java 8:通用程式設計

【Linux】UDP廣播封包接收速率問題

OOM三種類型

工廠模式-三種類型

【遞歸】高效率求2的n次幂

win10本地scala和spark安裝安裝scala安裝spark

Linux裝置模型（中）之上層容器

scala (3) Function 和 Method

PowerPC平台 Linux移植三