天天看点

Java 序列化笔记

1. 什么是java对象序列化

    java平台允许我们在内存中创建可复用的java对象,但一般情况下,只有当jvm处于运行时,这些对象才可能存在,即,这些对象的生命周期不会比jvm的生命周期更长。但在现实应用中,就可能要求在jvm停止运行之后能够保存(持久化)指定的对象,并在将来重新读取被保存的对象。java对象序列化就能够帮助我们实现该功能。

    使用java对象序列化,在保存对象时,会把其状态保存为一组字节,在未来,再将这些字节组装成对象。必须注意地是,对象序列化保存的是对象的"状态",即它的成员变量。由此可知,对象序列化不会关注类中的静态变量。

    除了在持久化对象时会用到对象序列化之外,当使用rmi(远程方法调用),或在网络中传递对象时,都会用到对象序列化。java序列化api为处理对象序列化提供了一个标准机制,该api简单易用,在本文的后续章节中将会陆续讲到。

2. 简单示例

在java中,只要一个类实现了java.io.serializable接口,那么它就可以被序列化。此处将创建一个可序列化的类person,本文中的所有示例将围绕着该类或其修改版。

    gender类,是一个枚举类型,表示性别

public enum gender {

    male, female

}

如果熟悉java枚举类型的话,应该知道每个枚举类型都会默认继承类java.lang.enum,而该类实现了serializable接口,所以枚举类型对象都是默认可以被序列化的。

    person类,实现了serializable接口,它包含三个字段:name,string类型;age,integer类型;gender,gender类型。另外,还重写该类的tostring()方法,以方便打印person实例中的内容。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

<code>public</code> <code>class</code> <code>person </code><code>implements</code> <code>serializable {</code>

<code>    </code><code>private</code> <code>string name = </code><code>null</code><code>;</code>

<code>    </code><code>private</code> <code>integer age = </code><code>null</code><code>;</code>

<code>    </code><code>private</code> <code>gender gender = </code><code>null</code><code>;</code>

<code>    </code><code>public</code> <code>person() {</code>

<code>        </code><code>system.out.println(</code><code>"none-arg constructor"</code><code>);</code>

<code>    </code><code>}</code>

<code>    </code><code>public</code> <code>person(string name, integer age, gender gender) {</code>

<code>        </code><code>system.out.println(</code><code>"arg constructor"</code><code>);</code>

<code>        </code><code>this</code><code>.name = name;</code>

<code>        </code><code>this</code><code>.age = age;</code>

<code>        </code><code>this</code><code>.gender = gender;</code>

<code>    </code><code>public</code> <code>string getname() {</code>

<code>        </code><code>return</code> <code>name;</code>

<code>    </code><code>public</code> <code>void</code> <code>setname(string name) {</code>

<code>    </code><code>public</code> <code>integer getage() {</code>

<code>        </code><code>return</code> <code>age;</code>

<code>    </code><code>public</code> <code>void</code> <code>setage(integer age) {</code>

<code>    </code><code>public</code> <code>gender getgender() {</code>

<code>        </code><code>return</code> <code>gender;</code>

<code>    </code><code>public</code> <code>void</code> <code>setgender(gender gender) {</code>

<code>    </code><code>@override</code>

<code>    </code><code>public</code> <code>string tostring() {</code>

<code>        </code><code>return</code> <code>"["</code> <code>+ name + </code><code>", "</code> <code>+ age + </code><code>", "</code> <code>+ gender + </code><code>"]"</code><code>;</code>

<code>}</code>

  

    simpleserial,是一个简单的序列化程序,它先将一个person对象保存到文件person.out中,然后再从该文件中读出被存储的person对象,并打印该对象。

<code>public</code> <code>class</code> <code>simpleserial {</code>

<code>    </code><code>public</code> <code>static</code> <code>void</code> <code>main(string[] args) </code><code>throws</code> <code>exception {</code>

<code>        </code><code>file file = </code><code>new</code> <code>file(</code><code>"person.out"</code><code>);</code>

<code>        </code><code>objectoutputstream oout = </code><code>new</code> <code>objectoutputstream(</code><code>new</code> <code>fileoutputstream(file));</code>

<code>        </code><code>person person = </code><code>new</code> <code>person(</code><code>"john"</code><code>, </code><code>101</code><code>, gender.male);</code>

<code>        </code><code>oout.writeobject(person);</code>

<code>        </code><code>oout.close();</code>

<code>        </code><code>objectinputstream oin = </code><code>new</code> <code>objectinputstream(</code><code>new</code> <code>fileinputstream(file));</code>

<code>        </code><code>object newperson = oin.readobject(); </code><code>// 没有强制转换到person类型</code>

<code>        </code><code>oin.close();</code>

<code>        </code><code>system.out.println(newperson);</code>

上述程序的输出的结果为:

arg constructor

[john, 31, male]

    此时必须注意的是,当重新读取被保存的person对象时,并没有调用person的任何构造器,看起来就像是直接使用字节将person对象还原出来的。

当person对象被保存到person.out文件中之后,我们可以在其它地方去读取该文件以还原对象,但必须确保该读取程序的classpath中包含有person.class(哪怕在读取person对象时并没有显示地使用person类,如上例所示),否则会抛出classnotfoundexception。

3. serializable的作用

    为什么一个类实现了serializable接口,它就可以被序列化呢?在上节的示例中,使用objectoutputstream来持久化对象,在该类中有如下代码:

<code>private</code> <code>void</code> <code>writeobject0(object obj, </code><code>boolean</code> <code>unshared) </code><code>throws</code> <code>ioexception {</code>

<code>    </code> 

<code>    </code><code>if</code> <code>(obj </code><code>instanceof</code> <code>string) {</code>

<code>        </code><code>writestring((string) obj, unshared);</code>

<code>    </code><code>} </code><code>else</code> <code>if</code> <code>(cl.isarray()) {</code>

<code>        </code><code>writearray(obj, desc, unshared);</code>

<code>    </code><code>} </code><code>else</code> <code>if</code> <code>(obj </code><code>instanceof</code> <code>enum) {</code>

<code>        </code><code>writeenum((enum) obj, desc, unshared);</code>

<code>    </code><code>} </code><code>else</code> <code>if</code> <code>(obj </code><code>instanceof</code> <code>serializable) {</code>

<code>        </code><code>writeordinaryobject(obj, desc, unshared);</code>

<code>    </code><code>} </code><code>else</code> <code>{</code>

<code>        </code><code>if</code> <code>(extendeddebuginfo) {</code>

<code>            </code><code>throw</code> <code>new</code> <code>notserializableexception(cl.getname() + </code><code>"\n"</code>

<code>                    </code><code>+ debuginfostack.tostring());</code>

<code>        </code><code>} </code><code>else</code> <code>{</code>

<code>            </code><code>throw</code> <code>new</code> <code>notserializableexception(cl.getname());</code>

<code>        </code><code>}</code>

从上述代码可知,如果被写对象的类型是string,或数组,或enum,或serializable,那么就可以对该对象进行序列化,否则将抛出notserializableexception。

4. 默认序列化机制

    如果仅仅只是让某个类实现serializable接口,而没有其它任何处理的话,则就是使用默认序列化机制。使用默认机制,在序列化对象时,不仅会序列化当前对象本身,还会对该对象引用的其它对象也进行序列化,同样地,这些其它对象引用的另外对象也将被序列化,以此类推。所以,如果一个对象包含的成员变量是容器类对象,而这些容器所含有的元素也是容器类对象,那么这个序列化的过程就会较复杂,开销也较大。

5. 影响序列化

    在现实应用中,有些时候不能使用默认序列化机制。比如,希望在序列化过程中忽略掉敏感数据,或者简化序列化过程。下面将介绍若干影响序列化的方法。

5.1 transient关键字

    当某个字段被声明为transient后,默认序列化机制就会忽略该字段。此处将person类中的age字段声明为transient,如下所示,

<code>    </code><code>transient</code> <code>private</code> <code>integer age = </code><code>null</code><code>;</code>

再执行simpleserial应用程序,会有如下输出:

[john, null, male]

可见,age字段未被序列化。

5.2 writeobject()方法与readobject()方法

    对于上述已被声明为transitive的字段age,除了将transitive关键字去掉之外,是否还有其它方法能使它再次可被序列化?方法之一就是在person类中添加两个方法:writeobject()与readobject(),如下所示:

<code>    </code><code>private</code> <code>void</code> <code>writeobject(objectoutputstream out) </code><code>throws</code> <code>ioexception {</code>

<code>        </code><code>out.defaultwriteobject();</code>

<code>        </code><code>out.writeint(age);</code>

<code>    </code><code>private</code> <code>void</code> <code>readobject(objectinputstream in) </code><code>throws</code> <code>ioexception, classnotfoundexception {</code>

<code>        </code><code>in.defaultreadobject();</code>

<code>        </code><code>age = in.readint();</code>

在writeobject()方法中会先调用objectoutputstream中的defaultwriteobject()方法,该方法会执行默认的序列化机制,如5.1节所述,此时会忽略掉age字段。然后再调用writeint()方法显示地将age字段写入到objectoutputstream中。readobject()的作用则是针对对象的读取,其原理与writeobject()方法相同。

    再次执行simpleserial应用程序,则又会有如下输出:

必须注意地是,writeobject()与readobject()都是private方法,那么它们是如何被调用的呢?毫无疑问,是使用反射。详情可见objectoutputstream中的writeserialdata方法,以及objectinputstream中的readserialdata方法。

5.3 externalizable接口

    无论是使用transient关键字,还是使用writeobject()和readobject()方法,其实都是基于serializable接口的序列化。jdk中提供了另一个序列化接口--externalizable,使用该接口之后,之前基于serializable接口的序列化机制就将失效。此时将person类修改成如下,

<code>public</code> <code>class</code> <code>person </code><code>implements</code> <code>externalizable {</code>

<code>    </code><code>public</code> <code>void</code> <code>writeexternal(objectoutput out) </code><code>throws</code> <code>ioexception {</code>

<code>    </code><code>public</code> <code>void</code> <code>readexternal(objectinput in) </code><code>throws</code> <code>ioexception, classnotfoundexception {</code>

此时再执行simpleserial程序之后会得到如下结果:

none-arg constructor

[null, null, null]

从该结果,一方面可以看出person对象中任何一个字段都没有被序列化。另一方面,如果细心的话,还可以发现这此次序列化过程调用了person类的无参构造器。

    externalizable继承于serializable,当使用该接口时,序列化的细节需要由程序员去完成。如上所示的代码,由于writeexternal()与readexternal()方法未作任何处理,那么该序列化行为将不会保存/读取任何一个字段。这也就是为什么输出结果中所有字段的值均为空。

    另外,若使用externalizable进行序列化,当读取对象时,会调用被序列化类的无参构造器去创建一个新的对象,然后再将被保存对象的字段的值分别填充到新对象中。这就是为什么在此次序列化过程中person类的无参构造器会被调用。由于这个原因,实现externalizable接口的类必须要提供一个无参的构造器,且它的访问权限为public。

    对上述person类作进一步的修改,使其能够对name与age字段进行序列化,但要忽略掉gender字段,如下代码所示:

<code>        </code><code>out.writeobject(name);</code>

<code>        </code><code>name = (string) in.readobject();</code>

执行simpleserial之后会有如下结果:

[john, 31, null]

5.4 readresolve()方法

    当我们使用singleton模式时,应该是期望某个类的实例应该是唯一的,但如果该类是可序列化的,那么情况可能会略有不同。此时对第2节使用的person类进行修改,使其实现singleton模式,如下所示:

<code>    </code><code>private</code> <code>static</code> <code>class</code> <code>instanceholder {</code>

<code>        </code><code>private</code> <code>static</code> <code>final</code> <code>person instatnce = </code><code>new</code> <code>person(</code><code>"john"</code><code>, </code><code>31</code><code>, gender.male);</code>

<code>    </code><code>public</code> <code>static</code> <code>person getinstance() {</code>

<code>        </code><code>return</code> <code>instanceholder.instatnce;</code>

<code>    </code><code>private</code> <code>person() {</code>

<code>    </code><code>private</code> <code>person(string name, integer age, gender gender) {</code>

同时要修改simpleserial应用,使得能够保存/获取上述单例对象,并进行对象相等性比较,如下代码所示:

<code>        </code><code>oout.writeobject(person.getinstance()); </code><code>// 保存单例对象</code>

<code>        </code><code>object newperson = oin.readobject();</code>

<code>        </code><code>system.out.println(person.getinstance() == newperson); </code><code>// 将获取的对象与person类中的单例对象进行相等性比较</code>

执行上述应用程序后会得到如下结果:

false

值得注意的是,从文件person.out中获取的person对象与person类中的单例对象并不相等。为了能在序列化过程仍能保持单例的特性,可以在person类中添加一个readresolve()方法,在该方法中直接返回person的单例对象,如下所示:

<code>    </code><code>private</code> <code>object readresolve() </code><code>throws</code> <code>objectstreamexception {</code>

再次执行本节的simpleserial应用后将有如下输出:

true

    无论是实现serializable接口,或是externalizable接口,当从i/o流中读取对象时,readresolve()方法都会被调用到。实际上就是用readresolve()中返回的对象直接替换在反序列化过程中创建的对象,而被创建的对象则会被垃圾回收掉。