天天看點

java讀c二進制檔案,c和java中的二進制檔案

最近需要寫一段程式,完成以下的工作,用java将資料以二進制的形式寫入檔案中,然後用C讀出此二進制檔案。

開始的時候沒有考慮機器的位元組序,直接搞出segment fault.想了很久,才明白原來是java和C的位元組序是不一樣的。

java中的位元組序是big endian的,它是與機器無關的。而c的字機序是機器相關的,而目前用的機器是x84_64結構,是little endian的,

是以出錯就不足為奇了。

背景知識:

主機位元組序

不同的CPU有不同的位元組序類型 這些位元組序是指整數在記憶體中儲存的順序 這個叫做主機序

最常見的有兩種

1. Little endian:将低序位元組存儲在起始位址

2. Big endian:将高序位元組存儲在起始位址

LE little-endian

最符合人的思維的位元組序

位址低位存儲值的低位

位址高位存儲值的高位

怎麼講是最符合人的思維的位元組序,是因為從人的第一觀感來說

低位值小,就應該放在記憶體位址小的地方,也即記憶體位址低位

反之,高位值就應該放在記憶體位址大的地方,也即記憶體位址高位

BE big-endian

最直覺的位元組序

位址低位存儲值的高位

位址高位存儲值的低位

為什麼說直覺,不要考慮對應關系

隻需要把記憶體位址從左到右按照由低到高的順序寫出

把值按照通常的高位到低位的順序寫出

兩者對照,一個位元組一個位元組的填充進去

例子:在記憶體中雙字0x01020304(DWORD)的存儲方式

記憶體位址

4000 4001 4002 4003

LE 04 03 02 01

BE 01 02 03 04

例子:如果我們将0x1234abcd寫入到以0x0000開始的記憶體中,則結果為

big-endian little-endian

0x0000 0x12 0xcd

0x0001 0x23 0xab

0x0002 0xab 0x34

0x0003 0xcd 0x12

x86系列CPU都是little-endian的位元組序.

網絡位元組序

網絡位元組順序是TCP/IP中規定好的一種資料表示格式,它與具體的CPU類型、作業系統等無關,進而可以保證資料在不同主機之間傳輸時能夠被正确解釋。網絡位元組順序采用big endian排序方式。

為了進行轉換 bsd socket提供了轉換的函數 有下面四個

htons 把unsigned short類型從主機序轉換到網絡序

htonl 把unsigned long類型從主機序轉換到網絡序

ntohs 把unsigned short類型從網絡序轉換到主機序

ntohl 把unsigned long類型從網絡序轉換到主機序

在使用little endian的系統中 這些函數會把位元組序進行轉換

在使用big endian類型的系統中 這些函數會定義成空宏

同樣 在網絡程式開發時 或是跨平�