Android内存优化-----使用ArrayMap:ArraySet代替HashMap:HashSet

[TOC]

1. 为什么要用ArrayMap/ArraySet

在Android开发中，经常会用到HashMap/HashSet等集合类，但是Java在设计集合类的时候并没有考虑到内存宝贵场景下优化。而对Android系统来说内存是非常宝贵的资源，所以Google针对Android系统的特性提供了 HashMap/HashSet的代替品，即ArrayMap/ArraySet。这几个类位于android.util.*包下面。

2. 简单回忆下HashMap<K, V>的实现

2.1 数据接口

在Java中，HashMap是通过数组加引用组合实现的数据结构，结构图如下：

注：图片来自网络 )

从图中我们看到，数组的每个元素之后会跟着一条链表。我们应该很容易想到这是为了解决HashCode冲突而设计的，使用链地址法解决冲突。

顺便提一下解决冲突的常用四个方法：

链地址法

再Hash法

开放地址发

建立公共溢出区

2.2 HashMap的数据结构

HashMap有三个构造方法：

1
2
3

HaspMap()
HaspMap(int initialCapacity)
HashMap(int initialCapacity, float loadFactor)

其中 initialCapacity是一个初始化容量大小，指的是table数组的初始大小。
loadFactor是负载因子，当table数组的实际容量超过（initialCapacity*loadFactor）的时候，table数组就会扩容。
initialCapacity默认值是15 而loadFactor的默认值是0.75 他俩都是影响HashMap性能的重要因素。

首先看下构造函数的源码：

public HashMap(int initialCapacity, float loadFactor) {
        // 首先检查各个参数的合法性
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: "
                    + initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: "
                    + loadFactor);

        // 计算出大于 initialCapacity 的最小的 2 的 n 次方值。
        // HashMap的实际数组大小都是2^n，是为了优化而设计
        int capacity = 1;
        while (capacity < initialCapacity)
            capacity <<= 1;
       
        this.loadFactor = loadFactor;
        // 计算极限容量 超过后将会进行扩容
        threshold = (int) (capacity * loadFactor);
        //初始化table数组
        table = new Entry[capacity];
        init();
    }

其中有一个Entry是HashMap的内部类：

Entry() {
     K key;                           
     V value;
     Entry<K, V> next;
     int hash;
}

它是实际储存Key和Value的实体。next是指向下一个元素的引用，hash是key的hash值。

2.3 数据的存放

再来看下put方法的源码：

public V put(K key, V value) {
        // 如果key的值是null，直接将其放在null位置上，也就是第一个位置上
        if (key == null)
            return putForNullKey(value);
        //计算key的hash值
        int hash = hash(key.hashCode());
        //计算key hash 值在 table 数组中的位置
        int i = indexFor(hash, table.length);
        //从i出开始迭代 e,找到 key 保存的位置
        for (Entry<K, V> e = table[i]; e != null; e = e.next) {
            Object k;
            //判断该条链上是否有hash值相同的(key相同)
            //若存在相同，则直接覆盖value，返回旧value
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;    //旧值 = 新值
                e.value = value;
                e.recordAccess(this);
                return oldValue;     //返回旧值
            }
        }
        //修改次数增加1
        modCount++;
        //将key、value添加至i位置处
        addEntry(hash, key, value, i);
        return null;
    }

首先判断key值是否为null，如果是null，则将hash值当成0处理否则
根据key对象的hashCode()方法计算出hash值，然后再将hash值转化成在table中的索引然后
查找该索引处的链表中是否存在key相同的对象，如果有则将其覆盖，并且返回旧值否则
将key、value存放于该数组索引处链表的第一个位置上，其中这一步是在addEntry()方法中完成的

void addEntry(int hash, K key, V value, int bucketIndex) {
        //获取bucketIndex处的Entry
        Entry<K, V> e = table[bucketIndex];
        //将新创建的 Entry 放入 bucketIndex 索引处，并让新的 Entry 指向原来的 Entry 
        table[bucketIndex] = new Entry<K, V>(hash, key, value, e);
        //若HashMap中元素的个数超过极限了，则容量扩大两倍
        if (size++ >= threshold)
            resize(2 * table.length);
    }

2.4 数据的取出

对于HashMap，取出值是相对简单的：

public V get(Object key) {
        // 若为null，调用getForNullKey方法返回相对应的value
        if (key == null)
            return getForNullKey();
        // 根据该 key 的 hashCode 值计算它的 hash 码  
        int hash = hash(key.hashCode());
        // 取出 table 数组中指定索引处的值
        for (Entry<K, V> e = table[indexFor(hash, table.length)]; e != null; e = e.next) {
            Object k;
            //若搜索的key与查找的key相同，则返回相对应的value
            if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
                return e.value;
        }
        return null;
    }

2.5 HashMap的小结

从上面的分析中可以看出，HashMap的存取速度都是相对比较快的，在一般情况下都能实现O(1)的速度，但是从初始容量和负载因子都可以看出，这种快速的读取都是通过内存来换取，而对于移动设备来讲，内存又是很重要的，所以，Google为我们提供了Arraymap来代替它。

3. ArrayMap的简单分析

在ArrayMap的内部，使用一个hash数组加一个kay，value数组来储存。

Google官方图

当你想获取某个value的时候，ArrayMap会计算输入key转换过后的hash值，然后对hash数组使用二分查找法寻找到对应的index，然后我们可以通过这个index在另外一个数组中直接访问到需要的键值对。如果在第二个数组键值对中的key和前面输入的查询key不一致，那么就认为是发生了碰撞冲突。为了解决这个问题，我们会以该key为中心点，分别上下展开，逐个去对比查找，直到找到匹配的值（开放地址法）。如下图所示：

Google官网图

可以看出，ArrayMap将内存的使用率提高了很多，但是读取的复杂度却是O(lgN)（因为二分法查找）。所以在数据量不是很大（千级以内）的时候，我们使用ArrapMap可以优化内存，并且存取速度几乎是不受什么影响的。

其实这里还有一点，就是自动装箱问题，假设我们把一个key是int类型的数据存储时，HashMap会将int值自动装箱成Integer对象，一个对象和一个基本类型所占的内存大小是差别很大的，所以为了避免这样情况，Google提供了SparseIntArray,SparseBoolArray等一系列大礼包供我们使用。

4. 总结

总结一句话，在数据量千级以内，使用ArrayMap ArraySet或者SparseIntMap等来代替HashMap，以此节约宝贵的内存资源。