天天看點

正規表達式——去除文本中的非漢字(VB2005)

  本人由于工作關系,需要一段代碼,将給定的字元串中的非漢字去除,隻保留漢字部分。

  這個一般用正規表達式比較簡單,網上有一些比對漢字的正規表達式,拿來經過改造就能實作我前面的要求。

  

  注釋一下,正規表達式[\u4e00-\u9fa5]表示比對中文,則正規表達式[^\u4e00-\u9fa5]比對非中文。用Replace方法将比對的非中文替換為空字元串,也就是去除了文本中的非中文字元。

  代碼格式修正于2012年1月5日 

Imports System.Text.RegularExpressions

Public Class clsT

  Public Function OnlyChinese(ByVal mText As String) As String

    Return Regex.Replace(mText, "[^\u4e00-\u9fa5]", "")

  End Function

End Class