天天看點

js 正則學習小記之比對字元串

今天看了第5章幾個例子,有點收獲,記錄下來當作回顧也當作分享。

關于比對字元串問題,有很多種類型,今天讨論 js 代碼裡的字元串比對。(因為我想學完之後寫個文法高亮練手,是以用js代碼當作例子)

 var str1 = "我是字元串1哦,快把我取走", str2 = "我是字元串2哦,快把我取走"; 

比如這樣一個字元串,比對起來很簡單 /"[^"]*"/g 即可。

js 正則學習小記之比對字元串
js 正則學習小記之比對字元串

PS: 白色截圖是 chrome 34 控制台中運作的結果,深灰色是 sublime text 結果。

很容易就取到内容了,可是親,你有沒有想過,js字元串裡允許轉義。

 var str1 = "我是字元串1哦,\"快把我取走\"", str2 = "我是字元串2哦,\"快把我取走\""; 

js 正則學習小記之比對字元串
js 正則學習小記之比對字元串

這不是我們想要的結果,是以我們要處理下轉義問題。

轉義的規則是 \ 後面跟着一個字元,是以我們用 \\. 去比對它,就有了這樣的正則 /"(?:\\.|[^"])*"/g

js 正則學習小記之比對字元串
js 正則學習小記之比對字元串

可能對于正則不熟悉的朋友,一下子從 /"[^"]*"/g 變到 /"(?:\\.|[^"])*"/g 後了解不了,我簡單說明下。

(?:) 是非捕獲組,就是不會把内容抓取儲存到記憶體裡的。

\\. 用于比對 \" \' \a 之類的轉義字元,比對成功的話消耗2個字元。

[^"] 比對除了 " 以外的所有字元,比對成功的話消耗1個字元。

是以這個表達式的意思是,先比對 \. 這樣轉義,如果成功會消耗掉正确的轉義,如果不成功就用 [^"] 比對。

消耗掉正确的轉義的意思是,比如 "aa\\aa\"aa\ufffaa" 都會被正常比對,因為這些都在正常的轉義。

形如 "aa\\aa\"aa\ufff\\"aa" 這裡的 \\" 其中 \\ 會被比對,而 " 既不滿足 \\. 也不滿足 [^"]

是以這個比對結果會是 "aa\\aa\"aa\ufff\\" 後面的 aa" 無法比對到。

js 正則學習小記之比對字元串
js 正則學習小記之比對字元串

是以現在我們得到了比較強力的正則,可以有效的比對 js 代碼中的字元串了。

騷等,好像還有哪裡不對。

js 字元串允許折行,形如這樣:

但是這樣的字元串用剛才的正則能比對麼?答案是能。

因為 \ 不能被 \\. 比對,但是可以被 [^"] 比對到,\ 後面一個字元是 \r, \n 或 \r\n (具體是什麼換行符要看系統了) 都能被 [^"] 比對到,是以我們無意間寫了個強力的表達式。

現在剩下最後一個問題了,就是 ' 的比對。

我們修改下表達式 /"(?:\\.|[^"])*"|'(?:\\.|[^'])*'/g 就好了。

來測試一下:

js 正則學習小記之比對字元串
js 正則學習小記之比對字元串

比對成功。

好了,這些就是今天的分享了,明天見。

js 正則學習小記之比對字元串

繼續閱讀