天天看點

JavaScript 正規表達式判斷日文的正規表達式

RegExp 是正規表達式的縮寫。

RegExp 對象用于存儲檢索模式。

通過 new 關鍵詞來定義 RegExp 對象。

參考:http://www.w3school.com.cn/js/js_obj_regexp.asp

RegExp 對象表示正規表達式,它是對字元串執行模式比對的強大工具。

直接量文法

建立 RegExp 對象的文法:

參數

參數 pattern 是一個字元串,指定了正規表達式的模式或其他正規表達式。

參數 attributes 是一個可選的字元串,包含屬性 "g"、"i" 和 "m",分别用于指定全局比對、區分大小寫的比對和多行比對。ECMAScript 标準化之前,不支援 m 屬性。如果 pattern 是正規表達式,而不是字元串,則必須省略該參數。

傳回值

一個新的 RegExp 對象,具有指定的模式和标志。如果參數 pattern 是正規表達式而不是字元串,那麼 RegExp() 構造函數将用與指定的 RegExp 相同的模式和标志建立一個新的 RegExp 對象。

如果不用 new 運算符,而将 RegExp() 作為函數調用,那麼它的行為與用 new 運算符調用時一樣,隻是當 pattern 是正規表達式時,它隻傳回 pattern,而不再建立一個新的 RegExp 對象。

抛出

SyntaxError - 如果 pattern 不是合法的正規表達式,或 attributes 含有 "g"、"i" 和 "m" 之外的字元,抛出該異常。

TypeError - 如果 pattern 是 RegExp 對象,但沒有省略 attributes 參數,抛出該異常。

參考:

http://www.w3school.com.cn/jsref/jsref_obj_regexp.asp

https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/RegExp

經過測試其中比對雙位元組字元(包括漢字在内):[^\x00-\xff]非常好用推薦一下

這個家夥收錄的正則很多,呵呵

關鍵字:正規表達式  模式比對 Javascript

摘要:收集一些常用的正規表達式。

正規表達式用于字元串處理,表單驗證等場合,實用高效,但用到時總是不太把握,以緻往往要上網查一番。我将一些常用的表達式收藏在這裡,作備忘之用。本貼随時會更新。

比對中文字元的正規表達式: [\u4e00-\u9fa5]

比對雙位元組字元(包括漢字在内):[^\x00-\xff]

應用:計算字元串的長度(一個雙位元組字元長度計2,ASCII字元計1)

String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}

比對空行的正規表達式:\n[\s| ]*\r

比對HTML标記的正規表達式:/<(.*)>.*<\/\1>|<(.*) \/>/

比對首尾空格的正規表達式:(^\s*)|(\s*$)

String.prototype.trim = function()

{

    return this.replace(/(^\s*)|(\s*$)/g, "");

}

利用正規表達式分解和轉換IP位址:

下面是利用正規表達式比對IP位址,并将IP位址轉換成對應數值的Javascript程式:

function IP2V(ip)

 re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g  //比對IP位址的正規表達式

if(re.test(ip))

return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1

else

 throw new Error("Not a valid IP address!")

不過上面的程式如果不用正規表達式,而直接用split函數來分解可能更簡單,程式如下:

var ip="10.100.20.168"

ip=ip.split(".")

alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))

比對Email位址的正規表達式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

比對網址URL的正規表達式:http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?

利用正規表達式去除字串中重複的字元的算法程式 :[注:此程式不正确,原因見本貼回複]

var s="abacabefgeeii"

var s1=s.replace(/(.).*\1/g,"$1")

var re=new RegExp("["+s1+"]","g")

var s2=s.replace(re,"") 

alert(s1+s2)  //結果為:abcefgi

我原來在CSDN上發貼尋求一個表達式來實作去除重複字元的方法,最終沒有找到,這是我能想到的最簡單的實作方法。思路是使用後向引用取出包括重複的字元,再以重複的字元建立第二個表達式,取到不重複的字元,兩者串連。這個方法對于字元順序有要求的字元串可能不适用。

得用正規表達式從URL位址中提取檔案名的javascript程式,如下結果為page1

s="http://www.9499.net/page1.htm"

s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2")

alert(s)

利用正規表達式限制網頁表單裡的文本框輸入内容:

用正規表達式限制隻能輸入中 文:onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"

用正規表達式限制隻能輸入全角字元:  onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"

用正規表達式限制隻能輸入數 字:onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

用正規表達式限制隻能輸入數字和英 文:onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

應用:javascript中沒有像vbscript那樣的trim函數,我們就可以利用這個表達式來實作,如下:

1. GBK (GB2312/GB18030)

\x00-\xff  GBK雙位元組編碼範圍

\x20-\x7f  ASCII

\xa1-\xff  中文

\x80-\xff  中文

2. UTF-8 (Unicode)

\u4e00-\u9fa5 (中文)

\x3130-\x318F (韓文

\xAC00-\xD7A3 (韓文)

\u0800-\u4e00 (日文)

ps: 韓文是大于[\u9fa5]的字元

繼續閱讀