oracle中正则表达式规则,Oracle SQL 正则表达式

From:http://blog.sina.com.cn/s/blog_69e7b8d701012tuj.html

在oracle数据库当中有字符处理的函数，比如substr()、replace()和instr()，当然也有做字符匹配的操作符like，不过这些函数和操作符在处理一些复杂的字符串时，会显得有些力不从心。从oracle

10g开始，Oracle内建了符合IEEE

POSIX (Portable Operating System for

Unix)标准的正则表达式。当然oracle也支持perl的正则表达式规则。熟练使用正则表达式，可以写出简洁，强大的SQL语句。实际上，它们类似于已有的操作符，但现在增加了强大的模式匹配功能。被搜索的数据可以是简单的字符串或是存储在数据库字符列中的大量文本。正规表达式让您能够以一种您以前从未想过的方式来搜索、替换和验证数据，并提供高度的灵活性。同时，正则表达式对oracle的约束也给与了加强。

正规表达式

正规表达式由一个或多个字符型文字或元字符组成。在最简单的格式下，正规表达式仅由字符文字组成，如正规表达式cat。它被读作字母c，接着是字母a和t，这种模式匹配cat、location和catalog之类的字符串。元字符提供算法来确定Oracle如何处理组成一个正规表达式的字符。当您了解了各种元字符的含义时，您将体会到正规表达式用于查找和替换特定的文本数据是非常强大的。如果我们简单理解的话，正则表达式就是一种字符串的组成和表示方法。

在使用这个新功能之前，您需要了解一些元字符的含义。句号(.)匹配一个正规表达式中的任意字符(除了换行符)。例如，正规表达式a.b匹配的字符串中首先包含字母a，接着是其它任意单个字符(除了换行符)，再接着是字母b。字符串axb、xaybx和abba都与之匹配，因为在字符串中隐藏了这种模式。如果您想要精确地匹配以a开头和以b结尾的一条三个字母的字符串，则您必须对正规表达式进行定位。脱字符号(^)元字符指示一行的开始，而美元符号($)指示一行的结尾。因此，正规表达式^a.b$匹配字符串aab、abb或axb。将这种方式与LIKE操作符提供的类似的模式匹配a_b相比较，其中"_"是单字符通配符。

下表是正则表达式部分元字符的解释(符合POSIX标准)：

使表达式定位至一行的开头

使表达式定位至一行的末尾

匹配0次或更多次

匹配0次或1次

匹配1次或更多次

{ｍ}

正好匹配m次

{ｍ，}

至少匹配m次

{ｍ，ｎ}

至少匹配m次但不超过n次

[:alpha:]

字母字符

[:lower:]

小写字母字符

[:upper:]

大写字母字符

[:digit:]

数字

[:alnum:]

字母数字字符

[:space:]

空白字符(禁止打印)，如回车符、换行符、竖直制表符和换页符

[:punct:]

标点字符

(...)

将子表达式分组为一个替换单元、量词单元或后向引用单元

[...]

匹配列表中的字符

[^...]

匹配不在列表中的字符

Oracle提供了四个支持正则表达式的函数:

REGEXP_LIKE , REGEXP_REPLACE , REGEXP_INSTR ,

REGEXP_SUBSTR。

REGEXP_LIKE：比较一个字符串是否与正则表达式匹配

(srcstr, pattern [,

match_option])

REGEXP_INSTR：在字符串中查找正则表达式，并且返回匹配的位置

(srcstr, pattern [, position [, occurrence [,

return_option [,

match_option]]]])

REGEXP_SUBSTR：返回与正则表达式匹配的子字符串

(srcstr, pattern [, position [, occurrence [,

match_option]]])

REGEXP_REPLACE：搜索并且替换匹配的正则表达式

(srcstr, pattern [, replacestr [, position [,

occurrence [, match_option]]]])

其中各参数的含义为:

srcstr:被查找的字符数据，可以是列和绑定变量等

pattern:正则表达式。

occurrence:出现的次数。默认为1。

position:开始位置

return_option:默认值为0，返回该模式的起始位置；值为1则返回符合匹配条件的下一个字符的起始位置。

replacestr:用来替换匹配模式的字符串。

match_option:匹配方式选项。缺省为c。

c：case

sensitive

I：case

insensitive

n：(.)匹配任何字符(包括newline)

m：字符串存在换行的时候被作为多行处理

下面通过一些具体的例子来说明如何使用这四个函数。在测试当中，你就会逐步的体会到这些正则表达式的优势

首先创建测试表TEST，并加载测试数据：[email protected]>

create table test (c1 int , testcol varchar2(100));Table