JavaScript 正規表達式判斷日文的正規表達式

RegExp 是正規表達式的縮寫。

RegExp 對象用于存儲檢索模式。

通過 new 關鍵詞來定義 RegExp 對象。

參考：http://www.w3school.com.cn/js/js_obj_regexp.asp

RegExp 對象表示正規表達式，它是對字元串執行模式比對的強大工具。

直接量文法

建立 RegExp 對象的文法：

參數

參數 pattern 是一個字元串，指定了正規表達式的模式或其他正規表達式。

參數 attributes 是一個可選的字元串，包含屬性 "g"、"i" 和 "m"，分别用于指定全局比對、區分大小寫的比對和多行比對。ECMAScript 标準化之前，不支援 m 屬性。如果 pattern 是正規表達式，而不是字元串，則必須省略該參數。

傳回值

一個新的 RegExp 對象，具有指定的模式和标志。如果參數 pattern 是正規表達式而不是字元串，那麼 RegExp() 構造函數将用與指定的 RegExp 相同的模式和标志建立一個新的 RegExp 對象。

如果不用 new 運算符，而将 RegExp() 作為函數調用，那麼它的行為與用 new 運算符調用時一樣，隻是當 pattern 是正規表達式時，它隻傳回 pattern，而不再建立一個新的 RegExp 對象。

抛出

SyntaxError - 如果 pattern 不是合法的正規表達式，或 attributes 含有 "g"、"i" 和 "m" 之外的字元，抛出該異常。

TypeError - 如果 pattern 是 RegExp 對象，但沒有省略 attributes 參數，抛出該異常。

參考：

http://www.w3school.com.cn/jsref/jsref_obj_regexp.asp

https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/RegExp

經過測試其中比對雙位元組字元(包括漢字在内)：[^\x00-\xff]非常好用推薦一下

這個家夥收錄的正則很多，呵呵

關鍵字：正規表達式模式比對 Javascript

摘要：收集一些常用的正規表達式。

正規表達式用于字元串處理，表單驗證等場合，實用高效，但用到時總是不太把握，以緻往往要上網查一番。我将一些常用的表達式收藏在這裡，作備忘之用。本貼随時會更新。

比對中文字元的正規表達式： [\u4e00-\u9fa5]

比對雙位元組字元(包括漢字在内)：[^\x00-\xff]

應用：計算字元串的長度（一個雙位元組字元長度計2，ASCII字元計1）

String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}

比對空行的正規表達式：\n[\s| ]*\r

比對HTML标記的正規表達式：/<(.*)>.*<\/\1>|<(.*) \/>/

比對首尾空格的正規表達式：(^\s*)|(\s*$)

String.prototype.trim = function()

{

return this.replace(/(^\s*)|(\s*$)/g, "");

}

利用正規表達式分解和轉換IP位址：

下面是利用正規表達式比對IP位址，并将IP位址轉換成對應數值的Javascript程式：

function IP2V(ip)

re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //比對IP位址的正規表達式

if(re.test(ip))

return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1

else

throw new Error("Not a valid IP address!")

不過上面的程式如果不用正規表達式，而直接用split函數來分解可能更簡單，程式如下：

var ip="10.100.20.168"

ip=ip.split(".")

alert("IP值是："+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))

比對Email位址的正規表達式：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

比對網址URL的正規表達式：http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?

利用正規表達式去除字串中重複的字元的算法程式：[注：此程式不正确，原因見本貼回複]

var s="abacabefgeeii"

var s1=s.replace(/(.).*\1/g,"$1")

var re=new RegExp("["+s1+"]","g")

var s2=s.replace(re,"")

alert(s1+s2) //結果為：abcefgi

我原來在CSDN上發貼尋求一個表達式來實作去除重複字元的方法，最終沒有找到，這是我能想到的最簡單的實作方法。思路是使用後向引用取出包括重複的字元，再以重複的字元建立第二個表達式，取到不重複的字元，兩者串連。這個方法對于字元順序有要求的字元串可能不适用。

得用正規表達式從URL位址中提取檔案名的javascript程式，如下結果為page1

s="http://www.9499.net/page1.htm"

s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2")

alert(s)

利用正規表達式限制網頁表單裡的文本框輸入内容：

用正規表達式限制隻能輸入中文：onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"

用正規表達式限制隻能輸入全角字元： onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"

用正規表達式限制隻能輸入數字：onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

用正規表達式限制隻能輸入數字和英文：onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

應用：javascript中沒有像vbscript那樣的trim函數，我們就可以利用這個表達式來實作，如下：

1. GBK (GB2312/GB18030)

\x00-\xff GBK雙位元組編碼範圍

\x20-\x7f ASCII

\xa1-\xff 中文

\x80-\xff 中文

2. UTF-8 (Unicode)

\u4e00-\u9fa5 (中文)

\x3130-\x318F (韓文

\xAC00-\xD7A3 (韓文)

\u0800-\u4e00 (日文)

ps: 韓文是大于[\u9fa5]的字元

JavaScript 正規表達式判斷日文的正規表達式

繼續閱讀

JavaScript的那些坑之事件代理事件代理事件階段

javascript的for (var i in data)慎用javascript中的for (var i in data)謹慎用

筆試面試題目：滑動視窗(二)

java中使用正規表達式比對特殊字元串\$natureOrder.*\)

資料結構與算法（27）——排序（二）

tab滑鼠經過菜單切換

vue （vue2.0）使用總結(從大體結構總結)

vue搭建過程及出現問題

/\B(?=(?:\d{3})+$)/g 一條令人費解的正規表達式

Dijkstra--簡易版（最短路徑）

适用于JavaScript的ECMAScript 2020規範向前發展

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

JS生成uuid的四種方法

layui多任務上傳添加進度條

hdu7108哈希