正規表達式——去除文本中的非漢字（VB2005）

2021-11-16 04:04:26

　　本人由于工作關系，需要一段代碼，将給定的字元串中的非漢字去除，隻保留漢字部分。

　　這個一般用正規表達式比較簡單，網上有一些比對漢字的正規表達式，拿來經過改造就能實作我前面的要求。

　　注釋一下，正規表達式[\u4e00-\u9fa5]表示比對中文，則正規表達式[^\u4e00-\u9fa5]比對非中文。用Replace方法将比對的非中文替換為空字元串，也就是去除了文本中的非中文字元。

　　代碼格式修正于2012年1月5日

Imports System.Text.RegularExpressions

Public Class clsT

　　Public Function OnlyChinese(ByVal mText As String) As String

　　　　Return Regex.Replace(mText, "[^\u4e00-\u9fa5]", "")

　　End Function

End Class