這裡詳細介紹awk内置函數,主要分以下3種類似:算數函數、字元串函數、時間函數、其它一般函數
1. 算術函數
函數名 | 說明 |
atan2( y, x ) | 傳回 y/x 的反正切。 |
cos( x ) | 傳回 x 的餘弦;x 是弧度。 |
sin( x ) | 傳回 x 的正弦;x 是弧度。 |
exp( x ) | 傳回 x 幂函數。 |
log( x ) | 傳回 x 的自然對數。 |
sqrt( x ) | 傳回 x 平方根。 |
int( x ) | 傳回 x 的截斷至整數的值。 |
rand( ) | 傳回任意數字 n,其中 0 <= n < 1。 |
srand( [Expr] ) | 将 rand 函數的種子值設定為 Expr 參數的值,或如果省略 Expr 參數則使用某天的時間。傳回先前的種子值。 |
舉例:
-
awk 'BEGIN{OFMT="%.3f";fs=sin(1);fe=exp(10);fl=log(10);fi=int(3.1415);print fs,fe,fl,fi;}'
-
// 0.841 22026.466 2.303 3
-
awk 'BEGIN{srand();fr=int(100*rand());print fr;}'
-
// 9
備注:
OFMT 設定輸出資料格式是保留3位小數
2. 字元串函數
函數 | |
gsub( Ere, Repl, [ In ] ) | 除了正規表達式所有具體值被替代這點,它和 sub 函數完全一樣地執行。 |
sub( Ere, Repl, [ In ] ) | 用 Repl 參數指定的字元串替換 In 參數指定的字元串中的由 Ere 參數指定的擴充正規表達式的第一個具體值。sub 函數傳回替換的數量。出現在 Repl 參數指定的字元串中的 &(和符号)由 In 參數指定的與 Ere 參數的指定的擴充正規表達式比對的字元串替換。如果未指定 In 參數,預設值是整個記錄($0 記錄變量)。 |
index( String1, String2 ) | 在由 String1 參數指定的字元串(其中有出現 String2 指定的參數)中,傳回位置,從 1 開始編号。如果 String2 參數不在 String1 參數中出現,則傳回 0(零)。 |
length [(String)] | 傳回 String 參數指定的字元串的長度(字元形式)。如果未給出 String 參數,則傳回整個記錄的長度($0 記錄變量)。 |
blength [(String)] | 傳回 String 參數指定的字元串的長度(以位元組為機關)。如果未給出 String 參數,則傳回整個記錄的長度($0 記錄變量)。 |
substr( String, M, [ N ] ) | 傳回具有 N 參數指定的字元數量子串。子串從 String 參數指定的字元串取得,其字元以 M 參數指定的位置開始。M 參數指定為将 String 參數中的第一個字元作為編号 1。如果未指定 N 參數,則子串的長度将是 M 參數指定的位置到 String 參數的末尾 的長度。 |
match( String, Ere ) | 在 String 參數指定的字元串(Ere 參數指定的擴充正規表達式出現在其中)中傳回位置(字元形式),從 1 開始編号,或如果 Ere 參數不出現,則傳回 0(零)。RSTART 特殊變量設定為傳回值。RLENGTH 特殊變量設定為比對的字元串的長度,或如果未找到任何比對,則設定為 -1(負一)。 |
split( String, A, [Ere] ) | 将 String 參數指定的參數分割為數組元素 A[1], A[2], . . ., A[n],并傳回 n 變量的值。此分隔可以通過 Ere 參數指定的擴充正規表達式進行,或用目前字段分隔符(FS 特殊變量)來進行(如果沒有給出 Ere 參數)。除非上下文指明特定的元素還應具有一個數字值,否則 A 數組中的元素用字元串值來建立。 |
tolower( String ) | 傳回 String 參數指定的字元串,字元串中每個大寫字元将更改為小寫。大寫和小寫的映射由目前語言環境的 LC_CTYPE 範疇定義。 |
toupper( String ) | 傳回 String 參數指定的字元串,字元串中每個小寫字元将更改為大寫。大寫和小寫的映射由目前語言環境的 LC_CTYPE 範疇定義。 |
sprintf(Format, Expr, Expr, . . . ) | 根據 Format 參數指定的 printf 子例程格式字元串來格式化 Expr 參數指定的表達式并傳回最後生成的字元串。 |
-
awk 'BEGIN{str="I am from China";print substr(str,3,2)}' // am
-
awk 'BEGIN{info="this is a test2010test!";gsub(/[0-9]/,"!",info);print info}' // this is a test!!!!test!
-
awk 'BEGIN{str="I am from China";print index(str,"from");}' // 6
-
awk 'BEGIN{str="I am from China";print length(str);}' // 15
-
awk 'BEGIN{str="I am from China";split(str,arr," ");print length(arr);for(pos in arr){print pos , arr[pos];}}'
-
4
-
4 China
-
1 I
-
2 am
-
3 from
以空格分割字元串str,動态建立數組arr,注意的是for(pos in arr),是一個無序的循環。 并不是從數組下标1開始到n,而是亂序輸出。
格式化字元串輸出(sprintf使用)
格式化字元串格式:
其中格式化字元串包括兩部分内容: 一部分是正常字元, 這些字元将按原樣輸出; 另一部分是格式化規定字元, 以”%”開始, 後跟一個或幾個規定字元,用來确定輸出内容格式。
格式符 | |
%d | 十進制有符号整數 |
%u | 十進制無符号整數 |
%f | 浮點數 |
%s | 字元串 |
%c | 單個字元 |
%p | 指針的值 |
%e | 指數形式的浮點數 |
%x | %X 無符号以十六進制表示的整數 |
%o | 無符号以八進制表示的整數 |
%g | 自動選擇合适的表示法 |
-
awk 'BEGIN{n1=124.113;n2=-1.224;n3=1.2345; printf("%.2f,%.2u,%.2g,%X,%o\n",n1,n2,n3,n1,n1);}'
-
124.11,18446744073709551615,1.2,7C,174
3. 時間函數
mktime( YYYY MM DD HH MM SS[ DST]) | 生成時間格式 |
strftime([format [, timestamp]]) | 格式化時間輸出,将時間戳轉為時間字元串 具體格式,見下表. |
systime() | 得到時間戳,傳回從1970年1月1日開始到目前時間(不計閏年)的整秒數 |
-
awk 'BEGIN{tstamp=mktime("2001 01 01 12 12 12");print strftime("%c",tstamp);}'
-
2001年01月01日 星期一 12時12分12秒
strftime日期和時間格式說明符
%a | 星期幾的縮寫(Sun) |
%A | 星期幾的完整寫法(Sunday) |
%b | 月名的縮寫(Oct) |
%B | 月名的完整寫法(October) |
本地日期和時間 | |
十進制日期 | |
%D | 日期 08/20/99 |
日期,如果隻有一位會補上一個空格 | |
%H | 用十進制表示24小時格式的小時 |
%I | 用十進制表示12小時格式的小時 |
%j | 從1月1日起一年中的第幾天 |
%m | 十進制表示的月份 |
%M | 十進制表示的分鐘 |
12小時表示法(AM/PM) | |
%S | 十進制表示的秒 |
%U | 十進制表示的一年中的第幾個星期(星期天作為一個星期的開始) |
%w | 十進制表示的星期幾(星期天是0) |
%W | 十進制表示的一年中的第幾個星期(星期一作為一個星期的開始) |
重新設定本地日期(08/20/99) | |
%X | 重新設定本地時間(12:00:00) |
%y | 兩位數字表示的年(99) |
%Y | 目前月份 |
%Z | 時區(PDT) |
%% | 百分号(%) |
4. 一般函數
close( Expression ) | 用同一個帶字元串值的 Expression 參數來關閉由 print 或 printf 語句打開的或調用 getline 函數打開的檔案或管道。如果檔案或管道成功關閉,則傳回 0;其它情況下傳回非零值。如果打算寫一個檔案,并稍後在同一個程式中讀取檔案,則 close 語句是必需的。 |
system(Command ) | 執行 Command 參數指定的指令,并傳回退出狀态。等同于 system 子例程。 |
Expression | getline [ Variable ] | 從來自 Expression 參數指定的指令的輸出中通過管道傳送的流中讀取一個輸入記錄,并将該記錄的值指定給 Variable 參數指定的變量。如果目前未打開将 Expression 參數的值作為其指令名稱的流,則建立流。建立的流等同于調用 popen 子例程,此時 Command 參數取 Expression 參數的值且 Mode 參數設定為一個是 r 的值。隻要流保留打開且 Expression 參數求得同一個字元串,則對 getline 函數的每次後續調用讀取另一個記錄。如果未指定 Variable 參數,則 $0 記錄變量和 NF 特殊變量設定為從流讀取的記錄。 |
getline [ Variable ] < Expression | 從 Expression 參數指定的檔案讀取輸入的下一個記錄,并将 Variable 參數指定的變量設定為該記錄的值。隻要流保留打開且 Expression 參數對同一個字元串求值,則對 getline 函數的每次後續調用讀取另一個記錄。如果未指定 Variable 參數,則 $0 記錄變量和 NF 特殊變量設定為從流讀取的記錄。 |
getline [ Variable ] | 将 Variable 參數指定的變量設定為從目前輸入檔案讀取的下一個輸入記錄。如果未指定 Variable 參數,則 $0 記錄變量設定為該記錄的值,還将設定 NF、NR 和 FNR 特殊變量。 |
-
xiaosi@Qunar:~$ awk 'BEGIN{while("cat /home/xiaosi/order.txt"|getline){print $3;};close("/home/xiaosi/order.txt");}'
-
flight
-
hotel
-
vacation
-
train
-
tuan
-
hotel
-
flight
-
hotel
-
train
轉載于http://blog.jobbole.com/92497/