oracle中正規表達式規則,Oracle SQL 正規表達式

From:http://blog.sina.com.cn/s/blog_69e7b8d701012tuj.html

在oracle資料庫當中有字元處理的函數，比如substr()、replace()和instr()，當然也有做字元比對的操作符like，不過這些函數和操作符在處理一些複雜的字元串時，會顯得有些力不從心。從oracle

10g開始，Oracle内建了符合IEEE

POSIX (Portable Operating System for

Unix)标準的正規表達式。當然oracle也支援perl的正規表達式規則。熟練使用正規表達式，可以寫出簡潔，強大的SQL語句。實際上，它們類似于已有的操作符，但現在增加了強大的模式比對功能。被搜尋的資料可以是簡單的字元串或是存儲在資料庫字元列中的大量文本。正規表達式讓您能夠以一種您以前從未想過的方式來搜尋、替換和驗證資料，并提供高度的靈活性。同時，正規表達式對oracle的限制也給與了加強。

正規表達式

正規表達式由一個或多個字元型文字或元字元組成。在最簡單的格式下，正規表達式僅由字元文字組成，如正規表達式cat。它被讀作字母c，接着是字母a和t，這種模式比對cat、location和catalog之類的字元串。元字元提供算法來确定Oracle如何處理組成一個正規表達式的字元。當您了解了各種元字元的含義時，您将體會到正規表達式用于查找和替換特定的文本資料是非常強大的。如果我們簡單了解的話，正規表達式就是一種字元串的組成和表示方法。

在使用這個新功能之前，您需要了解一些元字元的含義。句号(.)比對一個正規表達式中的任意字元(除了換行符)。例如，正規表達式a.b比對的字元串中首先包含字母a，接着是其它任意單個字元(除了換行符)，再接着是字母b。字元串axb、xaybx和abba都與之比對，因為在字元串中隐藏了這種模式。如果您想要精确地比對以a開頭和以b結尾的一條三個字母的字元串，則您必須對正規表達式進行定位。脫字元号(^)元字元訓示一行的開始，而美元符号($)訓示一行的結尾。是以，正規表達式^a.b$比對字元串aab、abb或axb。将這種方式與LIKE操作符提供的類似的模式比對a_b相比較，其中"_"是單字元通配符。

下表是正規表達式部分元字元的解釋(符合POSIX标準)：

使表達式定位至一行的開頭

使表達式定位至一行的末尾

比對0次或更多次

比對0次或1次

比對1次或更多次

{ｍ}

正好比對m次

{ｍ，}

至少比對m次

{ｍ，ｎ}

至少比對m次但不超過n次

[:alpha:]

字母字元

[:lower:]

小寫字母字元

[:upper:]

大寫字母字元

[:digit:]

數字

[:alnum:]

字母數字字元

[:space:]

空白字元(禁止列印)，如回車符、換行符、豎直制表符和換頁符

[:punct:]

标點字元

(...)

将子表達式分組為一個替換單元、量詞單元或後向引用單元

[...]

比對清單中的字元

[^...]

比對不在清單中的字元

Oracle提供了四個支援正規表達式的函數:

REGEXP_LIKE , REGEXP_REPLACE , REGEXP_INSTR ,

REGEXP_SUBSTR。

REGEXP_LIKE：比較一個字元串是否與正規表達式比對

(srcstr, pattern [,

match_option])

REGEXP_INSTR：在字元串中查找正規表達式，并且傳回比對的位置

(srcstr, pattern [, position [, occurrence [,

return_option [,

match_option]]]])

REGEXP_SUBSTR：傳回與正規表達式比對的子字元串

(srcstr, pattern [, position [, occurrence [,

match_option]]])

REGEXP_REPLACE：搜尋并且替換比對的正規表達式

(srcstr, pattern [, replacestr [, position [,

occurrence [, match_option]]]])

其中各參數的含義為:

srcstr:被查找的字元資料，可以是列和綁定變量等

pattern:正規表達式。

occurrence:出現的次數。預設為1。

position:開始位置

return_option:預設值為0，傳回該模式的起始位置；值為1則傳回符合比對條件的下一個字元的起始位置。

replacestr:用來替換比對模式的字元串。

match_option:比對方式選項。預設為c。

c：case

sensitive

I：case

insensitive

n：(.)比對任何字元(包括newline)

m：字元串存在換行的時候被作為多行處理

下面通過一些具體的例子來說明如何使用這四個函數。在測試當中，你就會逐漸的體會到這些正規表達式的優勢

首先建立測試表TEST，并加載測試資料：[email protected]>

create table test (c1 int , testcol varchar2(100));Table