<a href="http://www.cnblogs.com/kentyshang/archive/2007/07/11/814279.html">shell 字元串操作</a>
得到長度
代碼:
%x="abcd"
#方法一
%expr length $x
4
# 方法二
靐o $
# 方法三
%expr "$x" : ".*"
# expr 的幫助
# STRING : REGEXP anchored pattern match of REGEXP in STRING
查找子串
%expr index $x "b"
2
%expr index $x "a"
1
%expr index $x "c"
3
%expr index $x "d"
得到子字元串
# 方法一
# expr <string> startpos length
%expr substr "$x" 1 3
abc
%expr substr "$x" 1 5
abcd
%expr substr "$x" 2 5
bcd
# $
cd
ab
%pos=1
%len=2
bc
比對正規表達式
# 列印比對長度
%expr match $x "."
%expr match $x "abc"
%expr match $x "bc"
字元串的掐頭去尾
%x=aabbaarealwwvvww
靐o "$"
aabbaarealwwvv
aabbaareal
lwwvvww
bbaarealwwvvww
其中 , # 表示掐頭, 因為鍵盤上 # 在 $ 的左面。
其中 , % 表示%, 因為鍵盤上 % 在 $ 的右面。
單個的表示最小比對,雙個表示最大比對。
也就是說,當比對的有多種方案的時候,選擇比對的最大長度還是最小長度。
字元串的替換
%x=abcdabcd
靐o $ # 隻替換一個
bbcdabcd
靐o $ # 替換所有
bbcdbbcd
不可以使用 regexp , 隻能用 * ? 的檔案擴充方式
-------------------------------------------------------------------------------------------------------------------------------------------------------------
對字元串的處理
包括:截取,連接配接,比對,替換,翻轉... ...
字元串的處理:
1,截取
方法一:
echo $a|awk '{print substr( ,1,8)}'
substr是awk中的一個子函數,對第一個參數的進行截取,從第一個字元開始,共截取8個字元,如果不夠就從第二個字元中補
方法二
echo $a|cut -b2-8
cut:對标準輸入的字元串進行處理
cut -bn-m:以byte為機關,從第n個byte開始,取m個
cut -bn,m:以byte為機關,截取第n,m個byte
cut -b-n,m:以byte為機關,截取1-n,和第m個
-c:以charactor為機關
-d:指定分隔符,預設為tab
-s:使标準輸入中沒有delimeter
cut -f1:截取第1個域
方法三
a=123456
echo $
方法四
使用sed截取字元串的最後兩位
echo $test |sed 's/\(.*\)\(..\)$//'
截取字元串的前2位
echo $test |sed 's/^\(..\)\(.*\)//'
歡迎通路007電腦資訊
2,比較
好像沒有什麼可以比較的
3,連接配接
$a$b
或者
$string
4,翻轉
使用rev指令
方法二:
編寫腳本實作
#!/usr/bin/awk -f
#############################################################
# Description : duplicate rev in awk
{
revline = ""
for (i=1;i<=length;i++)
revline = substr(,i,1) revline
}
END{print revline}
5,比對
grep
egrep
fgrep
6,排序
7,替換
bash中:
%x=abcdabcd
%echo $ # 隻替換一個
bbcdabcd
%echo $ # 替換所有
bbcdbbcd
sh中:
??
如何替換/
使用sed
替換所有比對
echo $test |sed 's/xx/yy'
替換單個比對
8,得到字元串的長度:
bash當中
$
expr "$VAR" : '.*'
9,判斷字元串是否為數字
10,得到字元串中某個字元的重複次數
echo $a |tr "x" "\n" |wc -l
得到的結果需要減去1
或者 echo $a |awk -F"x" '{print NF-1}'
11,得到字元串中某個string的重複次數 007電腦資訊
12,将一批檔案中的所有string替換
for i in file_list
do
vi $i <<-!
:g/xxxx/s//XXXX/g
:wq
!
done
13,如何将字元串内每兩個字元中間插入一個字元
echo $test |sed 's/../&[insert char]/g'
============================================================================
象專業人員那樣截斷字元串
盡管 basename 和 dirname 是很好的工具,但有時可能需要執行更進階的字元串“截斷”,而不隻是标準的路徑名操作。當需要更強的說服力時,可以利用 bash 内置的變量擴充功能。已經使用了類似于 ${MYVAR} 的标準類型的變量擴充。但是 bash 自身也可以執行一些便利的字元串截斷。看一下這些例子:
第一種方法:
${varible##*string} 從左向右截取最後一個string後的字元串
${varible#*string}從左向右截取第一個string後的字元串
${varible%%string*}從右向左截取最後一個string後的字元串
${varible%string*}從右向左截取第一個string後的字元串
"*"隻是一個通配符可以不要
$ MYVAR=foodforthought.jpg
$ echo ${MYVAR##*fo}
rthought.jpg
$ echo ${MYVAR#*fo}
odforthought.jpg
在 第一個例子中,輸入了 ${MYVAR##*fo}。它的确切含義是什麼?基本上,在 ${ } 中輸入環境變量名稱,兩個 ##,然後是通配符 ("*fo")。然後,bash 取得 MYVAR,找到從字元串 "foodforthought.jpg" 開始處開始、且比對通配符 "*fo" 的 最長 子字元串,然後将其從字元串的開始處截去。剛開始了解時會有些困難,為了感受一下這個特殊的 "##" 選項如何工作,讓我們一步步地看看 bash 如何完成這個擴充。首先,它從 "foodforthought.jpg" 的開始處搜尋與 "*fo" 通配符比對的子字元串。以下是檢查到的子字元串:
f
fo MATCHES *fo
foo
food
foodf
foodfo MATCHES *fo
foodfor
foodfort
foodforth
foodfortho
foodforthou
foodforthoug
foodforthought
foodforthought.j
foodforthought.jp
foodforthought.jpg
在搜尋了比對的字元串之後,可以看到 bash 找到兩個比對。它選擇最長的比對,從初始字元串的開始處除去,然後傳回結果。
上 面所示的第二個變量擴充形式看起來與第一個相同,但是它隻使用一個 "#" -- 并且 bash 執行 幾乎同樣的過程。它檢視與第一個例子相同的子字元串系列,但是 bash 從初始字元串除去 最短 的比對,然後傳回結果。是以,一查到 "fo" 子字元串,它就從字元串中除去 "fo",然後傳回 "odforthought.jpg"。
這樣說可能會令人十分困惑,下面以一簡 單方式記住這個功能。當搜尋最長比對時,使用 ##(因為 ## 比 # 長)。當搜尋最短比對時,使用 #。看,不難記吧!等一下,怎樣記住應該使用 '#' 字元來從字元串開始部分除去?很簡單!注意到了嗎:在美國鍵盤上,shift-4 是 "$",它是 bash 變量擴充字元。在鍵盤上,緊靠 "$" 左邊的是 "#"。這樣,可以看到:"#" 位于 "$" 的“開始處”,是以(根據我們的記憶法),"#" 從字元串的開始處除去字元。您可能要問:如何從字元串末尾除去字元。如果猜到我們使用美國鍵盤上緊靠 "$" 右邊 的字元 ("%),那就猜對了。這裡有一些簡單的例子,解釋如何截去字元串的末尾部分:
$ MYFOO="chickensoup.tar.gz"
$ echo ${MYFOO%%.*}
chickensoup
$ echo ${MYFOO%.*}
chickensoup.tar
正如您所見,除了将比對通配符從字元串末尾除去之外,% 和 %% 變量擴充選項與 # 和 ## 的工作方式相同。請注意:如果要從末尾除去特定子字元串,不必使用 "*" 字元:
MYFOOD="chickensoup"
$ echo ${MYFOOD%%soup}
chicken
在此例中,使用 "%%" 或 "%" 并不重要,因為隻能有一個比對。還要記住:如果忘記了應該使用 "#" 還是 "%",則看一下鍵盤上的 3、4 和 5 鍵,然後猜出來。
第二種方法:${varible:n1:n2}:截取變量varible從n1到n2之間的字元串。
可以根據特定字元偏移和長度,使用另一種形式的變量擴充,來選擇特定子字元串。試着在 bash 中輸入以下行:
$ EXCLAIM=cowabunga
$ echo ${EXCLAIM:0:3}
cow
$ echo ${EXCLAIM:3:7}
abunga
這種形式的字元串截斷非常簡便,隻需用冒号分開來指定起始字元和子字元串長度。
應用字元串截斷
現在我們已經學習了所有截斷字元串的知識,下面寫一個簡單短小的 shell 腳本。我們的腳本将接受一個檔案作為自變量,然後列印:該檔案是否是一個 tar 檔案。要确定它是否是 tar 檔案,将在檔案末尾查找模式 ".tar"。如下所示:
mytar.sh -- 一個簡單的腳本
#!/bin/bash
if [ "${1##*.}" = "tar" ]
then
echo This appears to be a tarball.
else
echo At first glance, this does not appear to be a tarball.
fi
要運作此腳本,将它輸入到檔案 mytar.sh 中,然後輸入 "chmod 755 mytar.sh",生成可執行檔案。然後,如下做一下 tar 檔案試驗:
$ ./mytar.sh thisfile.tar
This appears to be a tarball.
$ ./mytar.sh thatfile.gz
At first glance, this does not appear to be a tarball.
好, 成功運作,但是不太實用。在使它更實用之前,先看一下上面使用的 "if" 語句。語句中使用了一個布爾表達式。在 bash 中,"=" 比較運算符檢查字元串是否相等。在 bash 中,所有布爾表達式都用方括号括起。但是布爾表達式實際上測試什麼?讓我們看一下左邊。根據前面所學的字元串截斷知識,"${1##*.}" 将從環境變量 "1" 包含的字元串開始部分除去最長的 "*." 比對,并傳回結果。這将傳回檔案中最後一個 "." 之後的所有部分。顯然,如果檔案以 ".tar" 結束,結果将是 "tar",條件也為真。
您可能會想:開始處的 "1" 環境變量是什麼。很簡單 -- $1 是傳給腳本的第一個指令行自變量,$2 是第二個,以此類推。
本文轉自 xkdcc 51CTO部落格,原文連結:http://blog.51cto.com/brantc/199902,如需轉載請自行聯系原作者