shell字元串操作

<a href="http://www.cnblogs.com/kentyshang/archive/2007/07/11/814279.html">shell 字元串操作</a>

得到長度

代碼:

%x="abcd"

#方法一

%expr length $x

# 方法二

靐o $

# 方法三

%expr "$x" : ".*"

# expr 的幫助

# STRING : REGEXP anchored pattern match of REGEXP in STRING

查找子串

%expr index $x "b"

%expr index $x "a"

%expr index $x "c"

%expr index $x "d"

得到子字元串

# 方法一

# expr <string> startpos length

%expr substr "$x" 1 3

abc

%expr substr "$x" 1 5

abcd

%expr substr "$x" 2 5

bcd

# $

%pos=1

%len=2

比對正規表達式

# 列印比對長度

%expr match $x "."

%expr match $x "abc"

%expr match $x "bc"

字元串的掐頭去尾

%x=aabbaarealwwvvww

靐o "$"

aabbaarealwwvv

aabbaareal

lwwvvww

bbaarealwwvvww

其中 , # 表示掐頭，因為鍵盤上 # 在 $ 的左面。

其中 , % 表示%，因為鍵盤上 % 在 $ 的右面。

單個的表示最小比對，雙個表示最大比對。

也就是說，當比對的有多種方案的時候，選擇比對的最大長度還是最小長度。

字元串的替換

%x=abcdabcd

靐o $ # 隻替換一個

bbcdabcd

靐o $ # 替換所有

bbcdbbcd

不可以使用 regexp ，隻能用 * ? 的檔案擴充方式

-------------------------------------------------------------------------------------------------------------------------------------------------------------

對字元串的處理

包括：截取，連接配接，比對，替換，翻轉... ...

字元串的處理：

1，截取

方法一：

echo $a|awk '{print substr( ,1,8)}'

substr是awk中的一個子函數，對第一個參數的進行截取，從第一個字元開始，共截取8個字元，如果不夠就從第二個字元中補

方法二

echo $a|cut -b2-8

cut：對标準輸入的字元串進行處理

cut -bn-m:以byte為機關，從第n個byte開始，取m個

cut -bn,m:以byte為機關，截取第n,m個byte

cut -b-n,m:以byte為機關，截取1-n,和第m個

-c:以charactor為機關

-d:指定分隔符，預設為tab

-s:使标準輸入中沒有delimeter

cut -f1:截取第1個域

方法三

a=123456

echo $

方法四

使用sed截取字元串的最後兩位

echo $test |sed 's/$.*$$..$$//'

截取字元串的前2位

echo $test |sed 's/^$..$$.*$//'

歡迎通路007電腦資訊

2，比較

好像沒有什麼可以比較的

3，連接配接

$a$b

或者

$string

4，翻轉

使用rev指令

方法二：

編寫腳本實作

#!/usr/bin/awk -f

#############################################################

# Description : duplicate rev in awk

{

revline = ""

for (i=1;i<=length;i++)

revline = substr(,i,1) revline

}

END{print revline}

5，比對

grep

egrep

fgrep

6，排序

7，替換

bash中：

%x=abcdabcd

%echo $ # 隻替換一個

bbcdabcd

%echo $ # 替換所有

bbcdbbcd

sh中：

？？

如何替換/

使用sed

替換所有比對

echo $test |sed 's/xx/yy'

替換單個比對

8，得到字元串的長度：

bash當中

expr "$VAR" : '.*'

9，判斷字元串是否為數字

10，得到字元串中某個字元的重複次數

echo $a |tr "x" "\n" |wc -l

得到的結果需要減去1

或者 echo $a |awk -F"x" '{print NF-1}'

11，得到字元串中某個string的重複次數 007電腦資訊

12，将一批檔案中的所有string替換

for i in file_list

vi $i <<-!

:g/xxxx/s//XXXX/g

:wq

done

13，如何将字元串内每兩個字元中間插入一個字元

echo $test |sed 's/../&[insert char]/g'

============================================================================

象專業人員那樣截斷字元串

盡管 basename 和 dirname 是很好的工具，但有時可能需要執行更進階的字元串“截斷”，而不隻是标準的路徑名操作。當需要更強的說服力時，可以利用 bash 内置的變量擴充功能。已經使用了類似于 ${MYVAR} 的标準類型的變量擴充。但是 bash 自身也可以執行一些便利的字元串截斷。看一下這些例子：

第一種方法:

${varible##*string} 從左向右截取最後一個string後的字元串

${varible#*string}從左向右截取第一個string後的字元串

${varible%%string*}從右向左截取最後一個string後的字元串

${varible%string*}從右向左截取第一個string後的字元串

"*"隻是一個通配符可以不要

$ MYVAR=foodforthought.jpg

$ echo ${MYVAR##*fo}

rthought.jpg

$ echo ${MYVAR#*fo}

odforthought.jpg

在第一個例子中，輸入了 ${MYVAR##*fo}。它的确切含義是什麼？基本上，在 ${ } 中輸入環境變量名稱，兩個 ##，然後是通配符 ("*fo")。然後，bash 取得 MYVAR，找到從字元串 "foodforthought.jpg" 開始處開始、且比對通配符 "*fo" 的最長子字元串，然後将其從字元串的開始處截去。剛開始了解時會有些困難，為了感受一下這個特殊的 "##" 選項如何工作，讓我們一步步地看看 bash 如何完成這個擴充。首先，它從 "foodforthought.jpg" 的開始處搜尋與 "*fo" 通配符比對的子字元串。以下是檢查到的子字元串：

fo MATCHES *fo

foo

food

foodf

foodfo MATCHES *fo

foodfor

foodfort

foodforth

foodfortho

foodforthou

foodforthoug

foodforthought

foodforthought.j

foodforthought.jp

foodforthought.jpg

在搜尋了比對的字元串之後，可以看到 bash 找到兩個比對。它選擇最長的比對，從初始字元串的開始處除去，然後傳回結果。

上面所示的第二個變量擴充形式看起來與第一個相同，但是它隻使用一個 "#" -- 并且 bash 執行幾乎同樣的過程。它檢視與第一個例子相同的子字元串系列，但是 bash 從初始字元串除去最短的比對，然後傳回結果。是以，一查到 "fo" 子字元串，它就從字元串中除去 "fo"，然後傳回 "odforthought.jpg"。

這樣說可能會令人十分困惑，下面以一簡單方式記住這個功能。當搜尋最長比對時，使用 ##（因為 ## 比 # 長）。當搜尋最短比對時，使用 #。看，不難記吧！等一下，怎樣記住應該使用 '#' 字元來從字元串開始部分除去？很簡單！注意到了嗎：在美國鍵盤上，shift-4 是 "$"，它是 bash 變量擴充字元。在鍵盤上，緊靠 "$" 左邊的是 "#"。這樣，可以看到："#" 位于 "$" 的“開始處”，是以（根據我們的記憶法），"#" 從字元串的開始處除去字元。您可能要問：如何從字元串末尾除去字元。如果猜到我們使用美國鍵盤上緊靠 "$" 右邊的字元 ("%)，那就猜對了。這裡有一些簡單的例子，解釋如何截去字元串的末尾部分：

$ MYFOO="chickensoup.tar.gz"

$ echo ${MYFOO%%.*}

chickensoup

$ echo ${MYFOO%.*}

chickensoup.tar

正如您所見，除了将比對通配符從字元串末尾除去之外，% 和 %% 變量擴充選項與 # 和 ## 的工作方式相同。請注意：如果要從末尾除去特定子字元串，不必使用 "*" 字元：

MYFOOD="chickensoup"

$ echo ${MYFOOD%%soup}

chicken

在此例中，使用 "%%" 或 "%" 并不重要，因為隻能有一個比對。還要記住：如果忘記了應該使用 "#" 還是 "%"，則看一下鍵盤上的 3、4 和 5 鍵，然後猜出來。

第二種方法：${varible:n1:n2}:截取變量varible從n1到n2之間的字元串。

可以根據特定字元偏移和長度，使用另一種形式的變量擴充，來選擇特定子字元串。試着在 bash 中輸入以下行：

$ EXCLAIM=cowabunga

$ echo ${EXCLAIM:0:3}

cow

$ echo ${EXCLAIM:3:7}

abunga

這種形式的字元串截斷非常簡便，隻需用冒号分開來指定起始字元和子字元串長度。

應用字元串截斷

現在我們已經學習了所有截斷字元串的知識，下面寫一個簡單短小的 shell 腳本。我們的腳本将接受一個檔案作為自變量，然後列印：該檔案是否是一個 tar 檔案。要确定它是否是 tar 檔案，将在檔案末尾查找模式 ".tar"。如下所示：

mytar.sh -- 一個簡單的腳本

#!/bin/bash

if [ "${1##*.}" = "tar" ]

then

echo This appears to be a tarball.

else

echo At first glance, this does not appear to be a tarball.

要運作此腳本，将它輸入到檔案 mytar.sh 中，然後輸入 "chmod 755 mytar.sh"，生成可執行檔案。然後，如下做一下 tar 檔案試驗：

$ ./mytar.sh thisfile.tar

This appears to be a tarball.

$ ./mytar.sh thatfile.gz

At first glance, this does not appear to be a tarball.

好，成功運作，但是不太實用。在使它更實用之前，先看一下上面使用的 "if" 語句。語句中使用了一個布爾表達式。在 bash 中，"=" 比較運算符檢查字元串是否相等。在 bash 中，所有布爾表達式都用方括号括起。但是布爾表達式實際上測試什麼？讓我們看一下左邊。根據前面所學的字元串截斷知識，"${1##*.}" 将從環境變量 "1" 包含的字元串開始部分除去最長的 "*." 比對，并傳回結果。這将傳回檔案中最後一個 "." 之後的所有部分。顯然，如果檔案以 ".tar" 結束，結果将是 "tar"，條件也為真。

您可能會想：開始處的 "1" 環境變量是什麼。很簡單 -- $1 是傳給腳本的第一個指令行自變量，$2 是第二個，以此類推。

本文轉自 xkdcc 51CTO部落格，原文連結：http://blog.51cto.com/brantc/199902，如需轉載請自行聯系原作者

shell字元串操作

繼續閱讀

1、Linux 指令行使用技巧

VBA調用cmd指令行下執行的指令

在目前位置打開指令行視窗的技巧

unit 1 - redhat Enterprise 8.0 Linux 指令行使用技巧

Windows指令行中使用SSH連接配接Linux

Linux下指令行中的複制和粘貼

1.Linux指令行使用技巧

spec檔案詳解

HK-2000資料采集儀資料庫操作說明

終端環境之tmux

查找檔案中的字元串

拒絕使用者登入:/bin/false和/usr/sbin/nologin

Shell程式設計——sort排序、uniq忽略重複、tr替換壓縮删除、cut指定删除字段、正規表達式元字元sort 指令uniq 指令tr 指令cut 指令正規表達式

Linxu常用指令技巧彙總

《Linux指令行與Shell腳本程式設計大全第2版.布盧姆》pdf

ACS基本配置-權限等級管理