-------------------------------------------------------------------------------------------------------------
Java也提供了一個byte資料類型,并且是基本類型。java byte是做為最小的數字來處理的,是以它的值域被定義為-128~127,也就是signed byte。
不幸的是,byte的用作計數的時間遠少于用表達基本記憶體單元的時間。比如從stream裡讀入一個雙位元組字元,我們先收到2個byte。為了把byte轉換成适當的形式,需要對byte值做一些比較,比如判斷字元集要比較其是否在某個編碼範圍内,比如GBK 0x8140~0xFEFE,然後new适當的string。
signed byte 把 0x00 ~ 0xff 映射成0~127 -128~-1兩段,注意當與literal比較時,java自動将literal識别成int
可以用 下面的小程式來驗證:
1 public class JavaByte
2 {
3 public static void main(String[] args)
4 {
5 byte b = 0;
6 for ( int i = 0; i <= 0xff; ++i )
7 {
8 b = (byte)i;
9 System.out.print(" "+i+":"+b+", ");
10 }
11 }
12 }
當收到(0xC7B0)這個GBK字元時,要判斷 0x81 <= 0xC7 <= 0xFE 是否成立,實際變成判斷 -127 < -57 < -2,唔,萬幸,可以直接比較 low < ch < high。如果要判斷 0x00 <= 0xC7 <= 0x80 (ASC Char),這回麻煩了,變成判斷 (0 <= -57 <= 127) || ( 0x57 == -128 )。比較簡單的辦法用 (b+256)%256的辦法令其值回到0~255,或者用&0xff并賦給一個int。
考慮到jvm裡的byte其實也是32位的,是以在計劃用byte的地方,直接用integer并不會有什麼實際的損失,而 DataInputStream也提供了一個readUnsignedByte()方法傳回的是int。是以真正的解決方案是忘掉byte,直接上 int。