天天看點

深入了解Java對象序列化

1. 什麼是Java對象序列化

Java平台允許我們在記憶體中建立可複用的Java對象,但一般情況下,隻有當JVM處于運作時,這些對象才可能存在,即,這些對象的生命周期不會比JVM的生命周期更長。但在現實應用中,就可能要求在JVM停止運作之後能夠儲存(持久化)指定的對象,并在将來重新讀取被儲存的對象。Java對象序列化就能夠幫助我們實作該功能。

使用Java對象序列化,在儲存對象時,會把其狀态儲存為一組位元組,在未來,再将這些位元組組裝成對象。必須注意地是,對象序列化儲存的是對象的"狀态",即它的成員變量。由此可知,對象序列化不會關注類中的靜态變量。

除了在持久化對象時會用到對象序列化之外,當使用RMI(遠端方法調用),或在網絡中傳遞對象時,都會用到對象序列化。Java序列化API為處理對象序列化提供了一個标準機制,該API簡單易用,在本文的後續章節中将會陸續講到。

2. 簡單示例

在Java中,隻要一個類實作了java.io.Serializable接口,那麼它就可以被序列化。此處将建立一個可序列化的類Person,本文中的所有示例将圍繞着該類或其修改版。

Gender類,是一個枚舉類型,表示性别

1

2

3

<code>public</code> <code>enum</code> <code>Gender {     </code>

<code> </code><code>MALE, FEMALE </code>

<code>  </code><code>}</code>

如果熟悉Java枚舉類型的話,應該知道每個枚舉類型都會預設繼承類java.lang.Enum,而該類實作了Serializable接口,是以枚舉類型對象都是預設可以被序列化的。

Person類,實作了Serializable接口,它包含三個字段:name,String類型;age,Integer類型;gender,Gender類型。另外,還重寫該類的toString()方法,以友善列印Person執行個體中的内容。

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

<code>public</code> <code>class</code> <code>Person </code><code>implements</code> <code>Serializable {       </code>

<code>    </code><code>private</code> <code>String name = </code><code>null</code><code>;       </code>

<code>    </code><code>private</code> <code>Integer age = </code><code>null</code><code>;       </code>

<code>    </code><code>private</code> <code>Gender gender = </code><code>null</code><code>;       </code>

<code>    </code> 

<code>    </code><code>public</code> <code>Person() {          </code>

<code>        </code><code>System.out.println(</code><code>"none-arg constructor"</code><code>);</code>

<code>    </code><code>}       </code>

<code>    </code><code>public</code> <code>Person(String name, Integer age, Gender gender) {</code>

<code>              </code><code>System.out.println(</code><code>"arg constructor"</code><code>);</code>

<code>              </code><code>this</code><code>.name = name;</code>

<code>              </code><code>this</code><code>.age = age;          </code>

<code>              </code><code>this</code><code>.gender = gender;</code>

<code>     </code><code>}       </code>

<code>     </code> 

<code>     </code><code>public</code> <code>String getName() {          </code>

<code>         </code><code>return</code> <code>name;      </code>

<code>     </code><code>public</code> <code>void</code> <code>setName(String name) {          </code>

<code>             </code><code>this</code><code>.name = name;      </code>

<code>             </code> 

<code>     </code><code>public</code> <code>Integer getAge() {          </code>

<code>     </code><code>return</code> <code>age;      </code>

<code>     </code><code>public</code> <code>void</code> <code>setAge(Integer age) {          </code>

<code>     </code><code>this</code><code>.age = age;      </code>

<code>     </code><code>public</code> <code>Gender getGender() {          </code>

<code>     </code><code>return</code> <code>gender;      </code>

<code>     </code><code>}      </code>

<code>     </code><code>public</code> <code>void</code> <code>setGender(Gender gender) {          </code>

<code>     </code><code>this</code><code>.gender = gender;      </code>

<code>     </code><code>@Override</code>     

<code>     </code><code>public</code> <code>String toString() {          </code>

<code>     </code><code>return</code> <code>"["</code> <code>+ name + </code><code>", "</code> <code>+ age + </code><code>", "</code> <code>+ gender + </code><code>"]"</code><code>;      </code>

<code>     </code><code>}  </code>

<code>}</code>

SimpleSerial,是一個簡單的序列化程式,它先将一個Person對象儲存到檔案person.out中,然後再從該檔案中讀出被存儲的Person對象,并列印該對象。

<code>public</code> <code>class</code> <code>SimpleSerial {       </code>

<code>      </code><code>public</code> <code>static</code> <code>void</code> <code>main(String[] args) </code><code>throws</code> <code>Exception {          </code>

<code>          </code><code>File file = </code><code>new</code> <code>File(</code><code>"person.out"</code><code>);           </code>

<code>          </code><code>ObjectOutputStream oout = </code><code>new</code> <code>ObjectOutputStream(</code><code>new</code> <code>FileOutputStream(file));</code>

<code>          </code><code>Person person = </code><code>new</code> <code>Person(</code><code>"John"</code><code>, </code><code>101</code><code>, Gender.MALE);          </code>

<code>          </code><code>oout.writeObject(person);          </code>

<code>          </code><code>oout.close();           </code>

<code>          </code><code>ObjectInputStream oin = </code><code>new</code> <code>ObjectInputStream(</code><code>new</code> <code>FileInputStream(file));</code>

<code>          </code><code>Object newPerson = oin.readObject(); </code><code>// 沒有強制轉換到Person類型          </code>

<code>          </code><code>oin.close();          </code>

<code>          </code><code>System.out.println(newPerson);      </code>

<code>      </code><code>}  </code>

上述程式的輸出的結果為:

此時必須注意的是,當重新讀取被儲存的Person對象時,并沒有調用Person的任何構造器,看起來就像是直接使用位元組将Person對象還原出來的。

當Person對象被儲存到person.out檔案中之後,我們可以在其它地方去讀取該檔案以還原對象,但必須確定該讀取程式的CLASSPATH中包含有Person.class(哪怕在讀取Person對象時并沒有顯示地使用Person類,如上例所示),否則會抛出ClassNotFoundException。

3. Serializable的作用

為什麼一個類實作了Serializable接口,它就可以被序列化呢?在上節的示例中,使用ObjectOutputStream來持久化對象,在該類中有如下代碼:

<code>private</code> <code>void</code> <code>writeObject0(Object obj, </code><code>boolean</code> <code>unshared) </code><code>throws</code> <code>IOException { </code>

<code>       </code><code>...    </code>

<code>       </code><code>if</code> <code>(obj </code><code>instanceof</code> <code>String) {          </code>

<code>               </code><code>writeString((String) obj, unshared);      </code>

<code>       </code><code>} </code><code>else</code> <code>if</code> <code>(cl.isArray()) {          </code>

<code>               </code><code>writeArray(obj, desc, unshared);      </code>

<code>       </code><code>} </code><code>else</code> <code>if</code> <code>(obj </code><code>instanceof</code> <code>Enum) {          </code>

<code>               </code><code>writeEnum((Enum) obj, desc, unshared);      </code>

<code>       </code><code>} </code><code>else</code> <code>if</code> <code>(obj </code><code>instanceof</code> <code>Serializable) {          </code>

<code>               </code><code>writeOrdinaryObject(obj, desc, unshared);      </code>

<code>       </code><code>} </code><code>else</code> <code>{          </code>

<code>               </code><code>if</code> <code>(extendedDebugInfo) {              </code>

<code>                   </code><code>throw</code> <code>new</code> <code>NotSerializableException(cl.getName() + </code><code>"\n"</code> <code>+ debugInfoStack.toString());          </code>

<code>               </code><code>} </code><code>else</code> <code>{             </code>

<code>                 </code><code>throw</code> <code>new</code> <code>NotSerializableException(cl.getName());          </code>

<code>               </code><code>}      </code>

<code>       </code><code>}      </code>

<code>      </code><code>...  </code>

<code> </code><code>}</code>

從上述代碼可知,如果被寫對象的類型是String,或數組,或Enum,或Serializable,那麼就可以對該對象進行序列化,否則将抛出NotSerializableException。

4. 預設序列化機制

如果僅僅隻是讓某個類實作Serializable接口,而沒有其它任何處理的話,則就是使用預設序列化機制。使用預設機制,在序列化對象時,不僅會序列化目前對象本身,還會對該對象引用的其它對象也進行序列化,同樣地,這些其它對象引用的另外對象也将被序列化,以此類推。是以,如果一個對象包含的成員變量是容器類對象,而這些容器所含有的元素也是容器類對象,那麼這個序列化的過程就會較複雜,開銷也較大。

5. 影響序列化

在現實應用中,有些時候不能使用預設序列化機制。比如,希望在序列化過程中忽略掉敏感資料,或者簡化序列化過程。下面将介紹若幹影響序列化的方法。

5.1 transient關鍵字

當某個字段被聲明為transient後,預設序列化機制就會忽略該字段。此處将Person類中的age字段聲明為transient,如下所示,

<code> </code><code>public</code> <code>class</code> <code>Person </code><code>implements</code> <code>Serializable {      </code>

<code>        </code><code>...      </code>

<code>        </code><code>transient</code> <code>private</code> <code>Integer age = </code><code>null</code><code>;      </code>

<code>        </code><code>...  </code>

再執行SimpleSerial應用程式,會有如下輸出:

可見,age字段未被序列化。

5.2 writeObject()方法與readObject()方法

對于上述已被聲明為transitive的字段age,除了将transitive關鍵字去掉之外,是否還有其它方法能使它再次可被序列化?方法之一就是在Person類中添加兩個方法:writeObject()與readObject(),如下所示:

<code>public</code> <code>class</code> <code>Person </code><code>implements</code> <code>Serializable {      </code>

<code>    </code><code>...      </code>

<code>    </code><code>transient</code> <code>private</code> <code>Integer age = </code><code>null</code><code>;      </code>

<code>    </code><code>...       </code>

<code>    </code><code>private</code> <code>void</code> <code>writeObject(ObjectOutputStream out) </code><code>throws</code> <code>IOException {          </code>

<code>        </code><code>out.defaultWriteObject();          </code>

<code>        </code><code>out.writeInt(age);</code>

<code>    </code><code>private</code> <code>void</code> <code>readObject(ObjectInputStream in) </code><code>throws</code> <code>IOException, ClassNotFoundException {          </code>

<code>        </code><code>in.defaultReadObject();          </code>

<code>        </code><code>age = in.readInt();      </code>

<code>    </code><code>}  </code>

在writeObject()方法中會先調用ObjectOutputStream中的defaultWriteObject()方法,該方法會執行預設的序列化機制,如5.1節所述,此時會忽略掉age字段。然後再調用writeInt()方法顯示地将age字段寫入到ObjectOutputStream中。readObject()的作用則是針對對象的讀取,其原理與writeObject()方法相同。再次執行SimpleSerial應用程式,則又會有如下輸出:

必須注意地是,writeObject()與readObject()都是private方法,那麼它們是如何被調用的呢?毫無疑問,是使用反射。詳情可以看看ObjectOutputStream中的writeSerialData方法,以及ObjectInputStream中的readSerialData方法。

5.3 Externalizable接口

無論是使用transient關鍵字,還是使用writeObject()和readObject()方法,其實都是基于Serializable接口的序列化。JDK中提供了另一個序列化接口--Externalizable,使用該接口之後,之前基于Serializable接口的序列化機制就将失效。此時将Person類作如下修改,

<code>public</code> <code>class</code> <code>Person </code><code>implements</code> <code>Externalizable {       </code>

<code>    </code><code>transient</code> <code>private</code> <code>Integer age = </code><code>null</code><code>;       </code>

<code>        </code><code>System.out.println(</code><code>"none-arg constructor"</code><code>);      </code>

<code>    </code><code>}      </code>

<code>    </code><code>public</code> <code>Person(String name, Integer age, Gender gender) {          </code>

<code>        </code><code>System.out.println(</code><code>"arg constructor"</code><code>);          </code>

<code>        </code><code>this</code><code>.name = name;          </code>

<code>        </code><code>this</code><code>.age = age;          </code>

<code>        </code><code>this</code><code>.gender = gender;      </code>

<code>        </code><code>out.writeInt(age);      </code>

<code>    </code><code>@Override</code>     

<code>    </code><code>public</code> <code>void</code> <code>writeExternal(ObjectOutput out) </code><code>throws</code> <code>IOException {</code>

<code>    </code><code>public</code> <code>void</code> <code>readExternal(ObjectInput in) </code><code>throws</code> <code>IOException, ClassNotFoundException {       </code>

<code>    </code><code>...  </code>

此時再執行SimpleSerial程式之後會得到如下結果:

從該結果,一方面,可以看出Person對象中任何一個字段都沒有被序列化。另一方面,如果細心的話,還可以發現這此次序列化過程調用了Person類的無參構造器。

Externalizable繼承于Serializable,當使用該接口時,序列化的細節需要由程式員去完成。如上所示的代碼,由于writeExternal()與readExternal()方法未作任何處理,那麼該序列化行為将不會儲存/讀取任何一個字段。這也就是為什麼輸出結果中所有字段的值均為空。

另外,使用Externalizable進行序列化時,當讀取對象時,會調用被序列化類的無參構造器去建立一個新的對象,然後再将被儲存對象的字段的值分别填充到新對象中。這就是為什麼在此次序列化過程中Person類的無參構造器會被調用。由于這個原因,實作Externalizable接口的類必須要提供一個無參的構造器,且它的通路權限為public。

對上述Person類進行進一步的修改,使其能夠對name與age字段進行序列化,但忽略掉gender字段,如下代碼所示:

<code>            </code><code>System.out.println(</code><code>"none-arg constructor"</code><code>);      </code>

<code>            </code><code>System.out.println(</code><code>"arg constructor"</code><code>);          </code>

<code>            </code><code>this</code><code>.name = name;          </code>

<code>            </code><code>this</code><code>.age = age;          </code>

<code>            </code><code>this</code><code>.gender = gender;      </code>

<code>    </code><code>private</code> <code>void</code> <code>writeObject(ObjectOutputStream out) </code><code>throws</code> <code>IOException {         </code>

<code>            </code><code>out.defaultWriteObject();          </code>

<code>            </code><code>out.writeInt(age);      </code>

<code>            </code><code>in.defaultReadObject();          </code>

<code>            </code><code>age = in.readInt();      </code>

<code>    </code><code>}     </code>

<code>    </code><code>public</code> <code>void</code> <code>writeExternal(ObjectOutput out) </code><code>throws</code> <code>IOException {          </code>

<code>            </code><code>out.writeObject(name);          </code>

<code>    </code><code>public</code> <code>void</code> <code>readExternal(ObjectInput in) </code><code>throws</code> <code>IOException, ClassNotFoundException {          </code>

<code>            </code><code>name = (String) in.readObject();          </code>

<code>    </code><code>... </code>

執行SimpleSerial之後會有如下結果:

5.4 readResolve()方法

當我們使用Singleton模式時,應該是期望某個類的執行個體應該是唯一的,但如果該類是可序列化的,那麼情況可能略有不同。此時對第2節使用的Person類進行修改,使其實作Singleton模式,如下所示:

<code>    </code><code>private</code> <code>static</code> <code>class</code> <code>InstanceHolder {          </code>

<code>        </code><code>private</code> <code>static</code> <code>final</code> <code>Person instatnce = </code><code>new</code> <code>Person(</code><code>"John"</code><code>, </code><code>31</code><code>, Gender.MALE);    }      </code>

<code>         </code> 

<code>    </code><code>public</code> <code>static</code> <code>Person getInstance() {          </code>

<code>        </code><code>return</code> <code>InstanceHolder.instatnce;      </code>

<code>    </code><code>private</code> <code>Person() {          </code>

<code>    </code><code>private</code> <code>Person(String name, Integer age, Gender gender) {          </code>

同時要修改SimpleSerial應用,使得能夠儲存/擷取上述單例對象,并進行對象相等性比較,如下代碼所示:

<code>    </code><code>public</code> <code>static</code> <code>void</code> <code>main(String[] args) </code><code>throws</code> <code>Exception {          </code>

<code>        </code><code>File file = </code><code>new</code> <code>File(</code><code>"person.out"</code><code>);          </code>

<code>        </code><code>ObjectOutputStream oout = </code><code>new</code> <code>ObjectOutputStream(</code><code>new</code> <code>FileOutputStream(file));          </code>

<code>        </code><code>oout.writeObject(Person.getInstance()); </code><code>// 儲存單例對象          </code>

<code>        </code><code>oout.close();           </code>

<code>        </code><code>ObjectInputStream oin = </code><code>new</code> <code>ObjectInputStream(</code><code>new</code> <code>FileInputStream(file));</code>

<code>        </code><code>Object newPerson = oin.readObject();          </code>

<code>        </code><code>oin.close();          </code>

<code>        </code><code>System.out.println(newPerson);           </code>

<code>        </code><code>System.out.println(Person.getInstance() == newPerson); </code><code>// 将擷取的對象與Person類中的單例對象進行相等性比較      </code>

執行上述應用程式後會得到如下結果:

值得注意的是,從檔案person.out中擷取的Person對象與Person類中的單例對象并不相等。為了能在序列化過程仍能保持單例的特性,可以在Person類中添加一個readResolve()方法,在該方法中直接傳回Person的單例對象,如下所示:

<code>        </code><code>private</code> <code>static</code> <code>final</code> <code>Person instatnce = </code><code>new</code> <code>Person(</code><code>"John"</code><code>, </code><code>31</code><code>, Gender.MALE);</code>

<code>    </code><code>private</code> <code>Object readResolve() </code><code>throws</code> <code>ObjectStreamException {          </code>

<code>        </code><code>return</code> <code>InstanceHolder.instatnce;</code>

再次執行本節的SimpleSerial應用後将如下輸出:

無論是實作Serializable接口,或是Externalizable接口,當從I/O流中讀取對象時,readResolve()方法都會被調用到。實際上就是用readResolve()中傳回的對象直接替換在反序列化過程中建立的對象。

本文轉自 ponpon_ 51CTO部落格,原文連結:http://blog.51cto.com/liuxp0827/1435181,如需轉載請自行聯系原作者