一、基本概念
SparseArray
的用法和key
为int
类型,value
为Object
类型的HashMap
相同,和HashMap
相比,先简要介绍一下它的两点优势。
内存占用
在 Java&Android 基础知识梳理(8) - 容器类 我们已经学习过HashMap
的内部实现,它内部是采用数组的形式保存每个Entry
,并采用链地址法来解决Hash
冲突的问题。但是采用数组会遇到扩容的问题,默认情况下当数组内的元素达到loadFactor
的时候,会将其扩大为目前大小的两倍,那么就有可能造成空间的浪费。
SparseArray
虽然也是采用数组的方式来保存Key/Value
private int[] mKeys;
private Object[] mValues;
但是与HashMap
使用普通数组不同,它对存放Value
的mValues
数组进行了优化,其创建方式为:
public SparseArray(int initialCapacity) {
if (initialCapacity == 0) {
mKeys = EmptyArray.INT;
mValues = EmptyArray.OBJECT;
} else {
//默认情况下,创建的 initialCapacity 大小为 10。
mValues = ArrayUtils.newUnpaddedObjectArray(initialCapacity);
mKeys = new int[mValues.length];
}
mSize = 0;
}
其中ArrayUtils.newUnpaddedObjectArray(initialCapacity)
用于创建优化后的数组,该方法实际上是一个Native
方法,它解决了当数组中的元素没有填满时造成的空间浪费。
在 SparseArray 浅析 一文中介绍了SparseArray
对于数组的优化方式,假设有一个9 x 7
的数组,在一般情况下它的存储模型可以表示如下:
可以看到这种模型下的数组当中存在大量无用的0
值,内存利用率很低。而优化后的方案用两个部分来表示数组:
- 第一部分:存放的是数组的行数、列数、当前数组中有效元素的个数
- 第二部分:存放的是所有有效元素的行、列数、元素的值
mKeys
则是用普通数组实现的,通过查找Key
值所在的位置,再根据mValues
数组的属性找到对应元素的行、列值,从而得到对应的元素值。
避免自动装箱
对于HashMap
来说,当我们采用put(1, Object)
这样的形式来放入一个元素时,会进行自动装箱,即创建一个Integer
对象放入到Entry
当中。
SparseArray
则不会存在这一问题,因为我们声明的就是int[]
类型的mKeys
数组。
二、源码解析
2.1 存放过程
public void put(int key, E value) {
//通过二分查找法进行查找插入元素所在位置。
int i = ContainerHelpers.binarySearch(mKeys, mSize, key);
//如果大于0,那么直接插入。
if (i >= 0) {
mValues[i] = value;
} else {
//找到插入的位置。
i = ~i;
//如果插入的位置之前已经分配,但是该位置上的元素已经被标记为删除,那么直接替换。
if (i < mSize && mValues[i] == DELETED) {
mKeys[i] = key;
mValues[i] = value;
return;
}
//首先回收掉之前标记为删除位置的元素。
if (mGarbage && mSize >= mKeys.length) {
gc();
// Search again because indices may have changed.
i = ~ContainerHelpers.binarySearch(mKeys, mSize, key);
}
//重新分配数组,并插入新的 Key,Value。
mKeys = GrowingArrayUtils.insert(mKeys, mSize, i, key);
mValues = GrowingArrayUtils.insert(mValues, mSize, i, value);
mSize++;
}
}
2.2 读取过程
public E get(int key, E valueIfKeyNotFound) {
//通过二分查找,在 Key 数组中得到对应 Value 的下标。
int i = ContainerHelpers.binarySearch(mKeys, mSize, key);
//取出下标对应的元素。
if (i < 0 || mValues[i] == DELETED) {
return valueIfKeyNotFound;
} else {
return (E) mValues[i];
}
}
2.3 删除过程
public void delete(int key) {
//二分查找所在位置。
int i = ContainerHelpers.binarySearch(mKeys, mSize, key);
//将该位置的元素置为 DELETED,它是内部预先定义好的一个对象。
if (i >= 0) {
if (mValues[i] != DELETED) {
mValues[i] = DELETED;
mGarbage = true;
}
}
}
可以看到,在删除元素的时候,它是用一个空的Object
来标记该位置。在合适的时候(例如上面的put
方法),才通过下面的gc()
方法对mKeys
和mValues
数组 重新排列。
private void gc() {
int n = mSize;
int o = 0;
int[] keys = mKeys;
Object[] values = mValues;
for (int i = 0; i < n; i++) {
Object val = values[i];
if (val != DELETED) {
if (i != o) {
keys[o] = keys[i];
values[o] = val;
values[i] = null;
}
o++;
}
}
mGarbage = false;
mSize = o;
}
2.4 二分查找
static int binarySearch(int[] array, int size, int value) {
int lo = 0;
int hi = size - 1;
while (lo <= hi) {
final int mid = (lo + hi) >>> 1;
final int midVal = array[mid];
if (midVal < value) {
lo = mid + 1;
} else if (midVal > value) {
hi = mid - 1;
} else {
return mid; // value found
}
}
//如果没有找到,那么返回的是低位指针的取反坐标。
return ~lo; // value not present
}
这里用的是~
,由于lo>=0
,所以当无法查找到对应元素的时候,返回值~lo
一定<0
。(~lo=-(lo+1)
)
这也是我们在2.1
中看到,为什么在i>=0
时就可以直接替换的原因,因为只要i>=0
,就说明之前已经存在一个Key
相同的元素了。
而在返回值小于0
时,对它再一次取~
,就刚好可以得到 要插入的位置。
三、SparseArray 的效率问题
了解了SparseArray
的原理之后,我们可以分析出有以下几方面有可能会影响SparseArray
插入的效率:
- 插入的效率。插入的效率其实主要跟
Key
值插入的先后顺序有关,假如Key
值是按 递减顺序 插入的,那么每次我们都是在mValues
的[0]
位置插入元素,这就要求把原来Values
和mKeys
数组中[0, xxx]
位置元素复制到[1, xxx+1]
的位置,而如果是 递增插入 的则不会存在该问题,直接扩大数组数组的范围之后再插入即可。 - 查找的效率。这点很明显,因为采用了二分查找,如果查找的
Key
值位于折半处,那么将会更快地找到对应的元素。
也就是说SparseArray
在插入和查找上,相对于HashMap
并不存在明显的优势,甚至在某些情况下,效率还要更差一些。
Google
之所以推荐我们使用SparseArray
来替换HashMap
,是因为在移动端我们的数据集往往都是比较小的,而在这种情况下,这两者效率的差别几乎可以忽略。但是在内存利用率上,由于采用了优化的数组结构,并且避免了自动装箱,SparseArray
明显更高,因此更推荐我们使用SparseArray
。
四、SparseArray 的衍生
SparseArray
还有几个衍生的类,它们的基本思想都是一样的,即:
- 用两个数组分别存储
key
和value
,通过下标管理映射关系。 - 采用二分查找法查找现在
mKeys
数组中对应找到所在元素的下标,再去mValues
数组中取出元素。
我们在平时使用的时候,可以根据实际的应用场景选取相应的集合类型。
Key 类型不同
假如key
为long
型:
-
LongSparseArray
:key
为long
,value
为Object
Value 类型不同
假如key
为int
,而value
为下面三种基本数据类型之一,那么可以采用以下三种集合来避免value
的自动装箱来进一步优化。
-
SparseLongArray
:key
为int
,value
为long
-
SparseBooleanArray
:key
为int
,value
为boolean
-
SparseIntArray
:key
为int
,value
为int
Key 和 Value 类型都不同
假如key
和value
都不为基本数据类型,那么可以采用:
-
ArrayMap
:key
为Object
,value
为Object
更多文章,欢迎访问我的 Android 知识梳理系列:
- Android 知识梳理目录:http://www.jianshu.com/p/fd82d18994ce
- Android 面试文档分享:http://www.jianshu.com/p/8456fe6b27c4