本人由于工作關系,需要一段代碼,将給定的字元串中的非漢字去除,隻保留漢字部分。
這個一般用正規表達式比較簡單,網上有一些比對漢字的正規表達式,拿來經過改造就能實作我前面的要求。
注釋一下,正規表達式[\u4e00-\u9fa5]表示比對中文,則正規表達式[^\u4e00-\u9fa5]比對非中文。用Replace方法将比對的非中文替換為空字元串,也就是去除了文本中的非中文字元。
代碼格式修正于2012年1月5日
Imports System.Text.RegularExpressions
Public Class clsT
Public Function OnlyChinese(ByVal mText As String) As String
Return Regex.Replace(mText, "[^\u4e00-\u9fa5]", "")
End Function
End Class