RegExp 是正規表達式的縮寫。
RegExp 對象用于存儲檢索模式。
通過 new 關鍵詞來定義 RegExp 對象。
參考:http://www.w3school.com.cn/js/js_obj_regexp.asp
RegExp 對象表示正規表達式,它是對字元串執行模式比對的強大工具。
直接量文法
建立 RegExp 對象的文法:
參數
參數 pattern 是一個字元串,指定了正規表達式的模式或其他正規表達式。
參數 attributes 是一個可選的字元串,包含屬性 "g"、"i" 和 "m",分别用于指定全局比對、區分大小寫的比對和多行比對。ECMAScript 标準化之前,不支援 m 屬性。如果 pattern 是正規表達式,而不是字元串,則必須省略該參數。
傳回值
一個新的 RegExp 對象,具有指定的模式和标志。如果參數 pattern 是正規表達式而不是字元串,那麼 RegExp() 構造函數将用與指定的 RegExp 相同的模式和标志建立一個新的 RegExp 對象。
如果不用 new 運算符,而将 RegExp() 作為函數調用,那麼它的行為與用 new 運算符調用時一樣,隻是當 pattern 是正規表達式時,它隻傳回 pattern,而不再建立一個新的 RegExp 對象。
抛出
SyntaxError - 如果 pattern 不是合法的正規表達式,或 attributes 含有 "g"、"i" 和 "m" 之外的字元,抛出該異常。
TypeError - 如果 pattern 是 RegExp 對象,但沒有省略 attributes 參數,抛出該異常。
參考:
http://www.w3school.com.cn/jsref/jsref_obj_regexp.asp
https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/RegExp
經過測試其中比對雙位元組字元(包括漢字在内):[^\x00-\xff]非常好用推薦一下
這個家夥收錄的正則很多,呵呵
關鍵字:正規表達式 模式比對 Javascript
摘要:收集一些常用的正規表達式。
正規表達式用于字元串處理,表單驗證等場合,實用高效,但用到時總是不太把握,以緻往往要上網查一番。我将一些常用的表達式收藏在這裡,作備忘之用。本貼随時會更新。
比對中文字元的正規表達式: [\u4e00-\u9fa5]
比對雙位元組字元(包括漢字在内):[^\x00-\xff]
應用:計算字元串的長度(一個雙位元組字元長度計2,ASCII字元計1)
String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}
比對空行的正規表達式:\n[\s| ]*\r
比對HTML标記的正規表達式:/<(.*)>.*<\/\1>|<(.*) \/>/
比對首尾空格的正規表達式:(^\s*)|(\s*$)
String.prototype.trim = function()
{
return this.replace(/(^\s*)|(\s*$)/g, "");
}
利用正規表達式分解和轉換IP位址:
下面是利用正規表達式比對IP位址,并将IP位址轉換成對應數值的Javascript程式:
function IP2V(ip)
re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //比對IP位址的正規表達式
if(re.test(ip))
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
else
throw new Error("Not a valid IP address!")
不過上面的程式如果不用正規表達式,而直接用split函數來分解可能更簡單,程式如下:
var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))
比對Email位址的正規表達式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
比對網址URL的正規表達式:http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?
利用正規表達式去除字串中重複的字元的算法程式 :[注:此程式不正确,原因見本貼回複]
var s="abacabefgeeii"
var s1=s.replace(/(.).*\1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //結果為:abcefgi
我原來在CSDN上發貼尋求一個表達式來實作去除重複字元的方法,最終沒有找到,這是我能想到的最簡單的實作方法。思路是使用後向引用取出包括重複的字元,再以重複的字元建立第二個表達式,取到不重複的字元,兩者串連。這個方法對于字元順序有要求的字元串可能不适用。
得用正規表達式從URL位址中提取檔案名的javascript程式,如下結果為page1
s="http://www.9499.net/page1.htm"
s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2")
alert(s)
利用正規表達式限制網頁表單裡的文本框輸入内容:
用正規表達式限制隻能輸入中 文:onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"
用正規表達式限制隻能輸入全角字元: onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"
用正規表達式限制隻能輸入數 字:onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"
用正規表達式限制隻能輸入數字和英 文:onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"
應用:javascript中沒有像vbscript那樣的trim函數,我們就可以利用這個表達式來實作,如下:
1. GBK (GB2312/GB18030)
\x00-\xff GBK雙位元組編碼範圍
\x20-\x7f ASCII
\xa1-\xff 中文
\x80-\xff 中文
2. UTF-8 (Unicode)
\u4e00-\u9fa5 (中文)
\x3130-\x318F (韓文
\xAC00-\xD7A3 (韓文)
\u0800-\u4e00 (日文)
ps: 韓文是大于[\u9fa5]的字元