What?
何为序列化与反序列化?
序列化:将对象转化为二进制序列的过程
反序列化:将二进制序列恢复为原始对象的过程
Why?
为什么需要序列化?
由于在系统底层,数据以简单的字节序列形式进行传递,即在底层,系统不认识对象,只认识字节序列,所以为了达到跨进程通讯的目的,需要先对数据进行序列化;其次,在进行网络数据传输或者activity间对象传递时,也需要先将对象转化为字节序列。
How?
如何进行序列化?
在Android中,序列化操作有两种方式:实现Serializabale接口或实现Parcelable接口。
Serializabale接口
Serializabale接口是一个空接口,实际上只提供标记的功能,标记实现了该接口的对象是可以进行序列化的,而具体的序列化与反序列化操作是由ObjectOutputStream和ObjectInputStream完成的。序列化与反序列化过程均对用户透明,其中需要保存许多额外的字段以保证反序列化过程能够顺利完成,同时,在这个过程中,还涉及到Java反射机制,所以整体时空开销比较大。
Parcelable接口
Parcelable是Android提供的接口,它主要是通过writeToParcel(),将需要持久化的字段保存到一个Parcel对象里面,然后通过CREATOR从Parcel对象中,取出相应的字段,完成对象的恢复过程。这整个过程均由用户自己控制,可以自定义保存和恢复的字段,所以存储代价小很多。
Serializabale VS Parcelable
实际开发中,推荐使用Parcelable接口,理由大致有如下三点:首先,Parcelable接口是Android提供使用的,Google提供了比较好的文档和技术支持;其次,Parcelable接口底层是内存的copy,而Serializable底层是文件IO操作,同时会使用到反射技术,所以效率上,Parcelable要远高于Serializable;最后,Parcelable具有更好地可控性,我们可以自己控制需要保存和恢复的字段,同时节省空间开销。Parcleable主要用于内存序列化,通过Parcelable将对象序列化到存储设备中或者将对象序列化后通过网络进行传输也是可以的,但是这个过程会稍显复杂,因此在这两种情况下,建议使用Serializable。
序列化相关知识
序列化 ID
当通过实现Serializable接口实现类的序列化操作时,需要提供一个序列化ID,即声明private static final long serialVersionUID,原则上序列化后的数据中的serialVersionUID只有和当前类的serialVersionUID相同时,才能够进行正常的反序列化操作,否则反序列化过程会失败。serialVersionUID的详细工作机制为:序列化的时候,系统会将当前类的serialVersionUID写入序列化文件/指定文件中,当反序列化的时候,系统会检测文件中的serialVersionUID与当前类中的serialVersionUID是否一致,若一致,说明序列化的类的版本与当前类的版本相同,这个时候可以成功进行反序列化操作;否则,说明当前类和序列化的类相比,发生了某些变化,如成员变量的数量、类型等发生变化,这时反序列化操作就无法正常完成。静态变量序列化
静态变量是类变量,不属于某个对象,而序列化操作保存的是对象的状态,即对象的成员变量,所以静态变量不会参与序列化过程。父类的序列化
如果希望一个类的父类也被序列化,则该父类也应实现序列化接口。Transient 关键字
Transient用于声明一个变量不参与序列化过程,所以当希望某些变量不被序列化时,就可以使用该关键字修饰这些变量。被Transient关键字声明的变量,在反序列化时,会被设置为初始值,即int类型变量为0,对象类型变量为null。对敏感字段加密
在消息传输的过程中,有些字段是敏感字段,不希望被泄露,如用户密码等,在这种情况下,进行序列化操作时,应先对敏感字段进行加密操作,反序列化时再进行解密。具体解决办法为:重写类中的writeObject和readObject方法。因为在序列化过程中,虚拟机会先调用待序列化类中的writeObject和readObject方法,若该方法存在,则使用该方法完成用户自定义的序列化和反序列化操作,否则,调用 ObjectOutputStream 的 defaultWriteObject 方法以及 ObjectInputStream 的 defaultReadObject 方法进行默认的序列化和反序列化操作。序列化存储规则
Java 序列化机制为了节省磁盘空间,具有特定的存储规则,当对同一对象进行多次序列化操作时,并不会对该对象的内容进行多次存储,而只存储多份引用,这样就只需要保存新增的引用及一些控制信息。
ArrayList的序列化
由上图一可知,ArrayList实现了Serializable接口,可以进行序列化操作,而由图二可知,其中保存内容的数组array被transient关键字修饰,不会被序列化,那么问题来了,这到底是咋回事呢?
原因如下图三所示:
ArrayList内部实现了writeObject和readObject方法,通过这两个方法自己控制序列化过程。
Why transient?
ArrayList为什么使用transient使array不被序列化,然后又自定义序列化过程呢?
因为ArrayList是一个动态数组,经常会成倍自增长长度,当数组中实际存放的元素很少,而申请的长度比较大时,直接进行序列化,就会生成很多null元素,所以为了避免不必要的null元素的生成,及提高时空效率,ArrayList将array用transient关键字进行声明,然后再自己控制元素的序列化过程。
总结
- 在进行跨进程通信、activity间数据传输以及网络数据传输时,需要将原始的对象类型转化为字节序列,这是就需要使用到对象的序列化与反序列化操作;
- 序列化即将对象或数据结构转化为字节序列的过程;反序列化即将字节序列恢复为原始对象的过程;序列化保存的是对象的“状态”,即对象的成员变量,所以静态变量、静态方法等属于类的属性以及被transient关键字声明的不用于序列化的属性,均不会被序列化;
- Android中序列化操作有两种方式:实现Serializable接口和实现Parcleable接口。Serialiable是Java提供的序列化接口,使用起来比较简单,但是开销很大,序列化和反序列化均需要大量I/O操作,而Parcelable是Android提供的序列化方式,因此更适合用于Android平台,所以在Android平台上,首选Parcelable接口。
- ArrayList的序列化过程比较特殊,需要注意。