前言:
在org.apache.commons包中提供了的一系列能簡化一些程式設計過程中常見問題的共通函數和類,使程式員能把主要精力集中在
構架,業務實作和優化而不是具體實作及驗證上,一言以蔽之,它能使我們避免重複的發明車輪。
org.apache.commons包的下載下傳頁面在:
http://jakarta.apache.org/site/downloads/downloads_commons-lang.cgi
其中源碼大家可以借鑒一下,我覺得很有參考價值,尤其是有些函數在不用正規表達式下取得的效果。
取得commons-lang-2.1.jar後加入自己工程的lib目錄就可以了.如果使用者不允許使用commons,那末打開其源碼把具體函數加入自己的代碼也可以,當然需要尊重人家的知識産權。
以下代碼經過測試,測試環境(WinXp+Eclipse3.1+JDK1.5+commons-lang-2.1),我在有些地方修改了一下。
Jakarta Commons Cookbook—01—Manipulating Text
Commons之字元串操作
要利用Jakarta Commons來進行字元串操作,首先需要加載需要用到的包:
import org.apache.commons.lang.StringUtils;
import org.apache.commons.lang.WordUtils;
以下是StringUtils的各項用法
1.空字元串檢查
使用函數: StringUtils.isBlank(testString)
函數介紹: 當testString為空,長度為零或者僅由空白字元(whitespace)組成時,傳回True;否則傳回False
例程:
String test = "";
String test2 = "\n\n\t";
String test3 = null;
String test4 = "Test";
System.out.println( "test blank? " + StringUtils.isBlank( test ) );
System.out.println( "test2 blank? " + StringUtils.isBlank( test2 ) );
System.out.println( "test3 blank? " + StringUtils.isBlank( test3 ) );
System.out.println( "test4 blank? " + StringUtils.isBlank( test4 ) );
輸出如下:
test blank? true
test2 blank? true
test3 blank? true
test4 blank? False
函數StringUtils.isNotBlank(testString)的功能與StringUtils.isBlank(testString)相反.
2.清除空白字元
使用函數: StringUtils.trimToNull(testString)
函數介紹:清除掉testString首尾的空白字元,如果僅testString全由空白字元
(whitespace)組成則傳回null
例程:
String test1 = "\t";
String test2 = " A Test ";
String test3 = null;
System.out.println( "test1 trimToNull: " + StringUtils.trimToNull( test1 ) );
System.out.println( "test2 trimToNull: " + StringUtils.trimToNull( test2 ) );
System.out.println( "test3 trimToNull: " + StringUtils.trimToNull( test3 ) );
輸出如下:
test1 trimToNull: null
test2 trimToNull: A Test
test3 trimToNull: null
注意:函數StringUtils.trim(testString)與
StringUtils.trimToNull(testString)功能類似,但testString由空白字元
(whitespace)組成時傳回零長度字元串。
3.取得字元串的縮寫
使用函數: StringUtils.abbreviate(testString,width)和StringUtils.abbreviate(testString,offset,width)
函數介紹:在給定的width内取得testString的縮寫,當testString的長度小于width則傳回原字元串.
例程:
String test = "This is a test of the abbreviation.";
String test2 = "Test";
System.out.println( StringUtils.abbreviate( test, 15 ) );
System.out.println( StringUtils.abbreviate( test, 5,15 ) );
System.out.println( StringUtils.abbreviate( test2, 10 ) );
輸出如下:
This is a te...
...is a test...
Test
4.劈分字元串
使用函數: StringUtils.split(testString,splitChars,arrayLength)
函數介紹:splitChars中可以包含一系列的字元串來劈分testString,并可以設定得
到數組的長度.注意設定長度arrayLength和劈分字元串間有抵觸關系,建議一般情況下
不要設定長度.
例程:
String input = "A b,c.d|e";
String input2 = "Pharmacy, basketball funky";
String[] array1 = StringUtils.split( input, " ,.|");
String[] array2 = StringUtils.split( input2, " ,", 2 );
System.out.println( ArrayUtils.toString( array1 ) );
System.out.println( ArrayUtils.toString( array2 ) );
輸出如下:
{A,b,c,d,e}
{Pharmacy,basketball funky}
5.查找嵌套字元串
使用函數:StringUtils.substringBetween(testString,header,tail)
函數介紹:在testString中取得header和tail之間的字元串。不存在則傳回空
例程:
String htmlContent = "ABC1234ABC4567";
System.out.println(StringUtils.substringBetween(htmlContent, "1234", "4567"));
System.out.println(StringUtils.substringBetween(htmlContent, "12345", "4567"));
輸出如下:
ABC
null
6.去除尾部換行符
使用函數:StringUtils.chomp(testString)
函數介紹:去除testString尾部的換行符
例程:
String input = "Hello\n";
System.out.println( StringUtils.chomp( input ));
String input2 = "Another test\r\n";
System.out.println( StringUtils.chomp( input2 ));
輸出如下:
Hello
Another test
7.重複字元串
使用函數:StringUtils.repeat(repeatString,count)
函數介紹:得到将repeatString重複count次後的字元串
例程:
System.out.println( StringUtils.repeat( "*", 10));
System.out.println( StringUtils.repeat( "China ", 5));
輸出如下:
**********
China China China China China
其他函數:StringUtils.center( testString, count,repeatString );
函數介紹:把testString插入将repeatString重複多次後的字元串中間,得到字元串
的總長為count
例程:
System.out.println( StringUtils.center( "China", 11,"*"));
輸出如下:
***China***
8.颠倒字元串
使用函數:StringUtils.reverse(testString)
函數介紹:得到testString中字元颠倒後的字元串
例程:
System.out.println( StringUtils.reverse("ABCDE"));
輸出如下:
EDCBA
9.判斷字元串内容的類型
函數介紹:
StringUtils.isNumeric( testString ) :如果testString全由數字組成傳回True
StringUtils.isAlpha( testString ) :如果testString全由字母組成傳回True
StringUtils.isAlphanumeric( testString ) :如果testString全由數字或數字組
成傳回True
StringUtils.isAlphaspace( testString ) :如果testString全由字母或空格組
成傳回True
例程:
String state = "Virginia";
System.out.println( "Is state number? " + StringUtils.isNumeric(
state ) );
System.out.println( "Is state alpha? " + StringUtils.isAlpha( state )
);
System.out.println( "Is state alphanumeric? " +StringUtils.isAlphanumeric( state ) );
System.out.println( "Is state alphaspace? " + StringUtils.isAlphaSpace( state ) );
輸出如下:
Is state number? false
Is state alpha? true
Is state alphanumeric? true
Is state alphaspace? true
10.取得某字元串在另一字元串中出現的次數
使用函數:StringUtils.countMatches(testString,seqString)
函數介紹:取得seqString在testString中出現的次數,未發現則傳回零
例程:
System.out.println(StringUtils.countMatches( "Chinese People", "e"
));
輸出:
4
11.部分截取字元串
使用函數:
StringUtils.substringBetween(testString,fromString,toString ):取得兩字元
之間的字元串
StringUtils.substringAfter( ):取得指定字元串後的字元串
StringUtils.substringBefore( ):取得指定字元串之前的字元串
StringUtils.substringBeforeLast( ):取得最後一個指定字元串之前的字元串
StringUtils.substringAfterLast( ):取得最後一個指定字元串之後的字元串
函數介紹:上面應該都講明白了吧。
例程:
String formatted = " 25 * (30,40) [50,60] | 30";
System.out.print("N0: " + StringUtils.substringBeforeLast( formatted, "*" ) );
System.out.print(", N1: " + StringUtils.substringBetween( formatted, "(", "," ) );
System.out.print(", N2: " + StringUtils.substringBetween( formatted, ",", ")" ) );
System.out.print(", N3: " + StringUtils.substringBetween( formatted, "[", "," ) );
System.out.print(", N4: " + StringUtils.substringBetween( formatted, ",", "]" ) );
System.out.print(", N5: " + StringUtils.substringAfterLast( formatted, "|" ) );
輸出如下:
N0: 25 , N1: 30, N2: 40, N3: 50, N4: 40) [50,60, N5: 30