前言
隻有光頭才能變強。
文本已收錄至我的GitHub倉庫,歡迎Star:
https://github.com/ZhongFuCheng3y/3y
之前寫過一篇 《
在公司做的項目和自己在學校做的有什麼差別?》不知道大家還有印象沒有,裡面提到了在工作中可能需要等上Linux伺服器,檢視一些資訊(特别是查日志找Bug)。
我在大學的時候也有過Linux的課程,在期間也做過Linux相關的筆記:
但是,在學校學完,沒咋練手(還是太菜了),去到公司可以說是全忘光了。這篇文章主要來回顧以前的筆記,以及記錄一下在工作中比較常用的一些指令。
- 我這肯定是以我現在的次元來考量的,我工作時長比較短,是以可能會有很多指令會忽略掉了,歡迎在評論區補充
一、檢視日志
線上出現了問題,登上線上的機器查日志是非常常見的操作了。我第一次登上線上機器查日志的時候,我還隻記得以下的幾個指令(假設現在我們的日志檔案叫做
service.log
):
-
cat service.log
-
tail -f service.log
-
vim serivice.log
- (明顯是不夠用的)
現在日志每天産出的大小大概1GB:
如果是小檔案的話,單純的
cat
指令還是可以應付的,但如果你直接用
cat
指令打開一個1GB的日志檔案,保證卡死你(
ctrl + c
退出
cat
指令需要很久才能将
cat
指令停下來)。
- 一般我隻用
來檢視這個小檔案的文本内容是什麼cat
同樣地,如果是小檔案,單純的
vim
指令去打開檔案也是可以應付的,但如果你用
vim
指令去打開一個1GB甚至更大的檔案,也能明顯感受到緩慢和卡頓。
平時我還是很喜歡用
vim
去查找對應的記錄的,我一般的操作:
-
vim service
- 按
跳轉到檔案的末尾G
-
+關鍵字搜尋對應的記錄?
-
往上查詢,按n
往下查詢N
tail -f service.log
這個指令我一般用于檢視流量是否進來了(或者調試的時候可以直接看到日志,再迅速
ctrl +c
關掉)
面對比較大的日志檔案,這我們就得配合
grep
來玩了,比如我們現在得知某個手機号收不到短信驗證碼,想要看一下這個手機号的日志是怎麼樣的。于是我們就可以這樣搞:
-
cat service.log | grep 13888888888
這麼一搞,就能将
service.log
中所有含有
13888888888
的記錄給搜出來,搜尋的速度還是賊快的。
現在我們已經能根據關鍵字搜到對應的記錄了,接着我想看一下那條記錄的日志上下文【這樣就能知道這條資料大概的執行狀态了】
首先,我們先要查出對應記錄的行号,在
cat
指令後面加上一個
-n
參數就好了。是以指令是:
cat -n service.log | grep 13888888888
,如下圖我們就可以查到對應的行号了
現在行數是29506,我們一般隻要看一下29506的前10行和後10行就差不多知道問題出現在哪了,于是我們可以這樣做:
-
:從29496行開始檢索,到29516行結束sed -n "29496,29516p" service.log
-
:從29496行開始檢索,往前推20條cat -n service.log | tail -n +29496 | head -n 20
如果關鍵字不太準确(日志輸出的記錄太多了),我們可以使用
more
指令來浏覽或者輸出到檔案上再分析:
-
:将查詢後的結果交由more輸出cat service.log | grep 13 |more
-
将查詢後的結果寫到cat service.log | grep 13 > /home/sanwai/aa.txt
檔案上/home/sanwai/aa.txt
有的時候,我們想統計這個日志輸出了多少行,我們可以使用這條指令:
-
cat service.log | wc -l
參考資料:
二、查程序和端口
查程序有兩個指令:
-
ps -ef
-
ps aux
上面兩個指令都是列出所有的程序,我們還是通過
|
管道和
grep
來過濾掉想要查的程序,比如說:
ps -ef |grep java
把程序查出來幹嘛?知道它的程序ID了,我們可以把他給殺掉。
-
:殺掉某個程序kill -9 processId
查端口也是一個很常見的操作,常見指令:
netstat -lntup
:
l:listening n:num t:tcp u:udp p:display PID/Program name for sockets
檢視目前所有tcp/udp端口的資訊
檢視某個端口詳細的資訊:
lsof -i:4000
三、檢視系統的狀态
3.1 TOP實時檢視程序的狀态
TOP指令檢視程序的狀态,其中有個load average可能不是那麼好了解,下面來解釋一下:
load average:在特定時間間隔内運作隊列中(在CPU上運作或者等待運作多少程序)的平均程序數。
load average 有三個值,分别代表:1分鐘、5分鐘、15分鐘内運作程序隊列中的平均程序數量。
- 正在運作的程序 + 準備好等待運作的程序 在特定時間内(1分鐘,5分鐘,10分鐘)的平均程序數
Linux程序可以分為三個狀态:
- 阻塞程序
- 可運作的程序
- 正在運作的程序
比如現在系統有2個正在運作的程序,3個可運作程序,那麼系統的load就是5,load average就是一定時間内的load數量均值。
3.2free檢視記憶體使用狀況
linux的記憶體管理機制的思想包括(不敢說就是)記憶體使用率最大化,核心會把剩餘的記憶體申請為cached,而cached不屬于free範疇。
如果free的記憶體不夠,核心會把部分cached的記憶體回收,回收的記憶體再配置設定給應用程式。是以對于linux系統,可用于配置設定的記憶體不隻是free的記憶體,還包括cached的記憶體(其實還包括buffers)。
- 可用記憶體=free的記憶體+cached的記憶體+buffers
Buffer Cache和Page Cache。前者針對磁盤塊的讀寫,後者針對檔案inode的讀寫。這些Cache有效縮短了 I/O系統調用(比如read,write,getdents)的時間。磁盤的操作有邏輯級(檔案系統)和實體級(磁盤塊)
- https://blog.csdn.net/zhangchenglikecc/article/details/52103737
- https://www.cnblogs.com/peida/archive/2012/12/24/2831353.html
最後
我工作時長比較短,是以可能會有很多指令會忽略掉了,歡迎在評論區補充比較常用的指令。後續如果某些指令比較重要的,我再分享哈~
樂于輸出幹貨的Java技術公衆号:Java3y。公衆号内有200多篇原創技術文章、海量視訊資源、精美腦圖,關注即可擷取!
覺得我的文章寫得不錯,點贊!