天天看点

Java集合类性能分析

1.java 集合框架图

Java集合类性能分析
-集合接口:6个接口(短虚线表示),表示不同集合类型,是集合框架的基础。  -抽象类:5个抽象类(长虚线表示),对集合接口的部分实现。可扩展为自定义集合类。  -实现类:8个实现类(实线表示),对接口的具体实现。

2.java容器类介绍 

① java容器类都可以自动地调整自己的尺寸。 

② collection 接口是一组允许重复的对象。 

③ set 接口继承 collection,不允许重复,使用自己内部的一个排列机制。 

④ list 接口继承 collection,允许重复,以元素安插的次序来放置元素,不会重新排列。 

⑤ map接口是一组成对的键-值对象,即所持有的是key-value pairs。map中不能有重复的key。拥有自己的内部排列机制。

java 2简化集合框架图 

Java集合类性能分析

3.collection接口

基本操作 

-增加元素add(object obj); addall(collection c); 

-删除元素 remove(object obj); removeall(collection c); 

-求交集 retainall(collection c); 

    collection是最基本的集合接口,所有实现collection接口的类都必须提供两个标准的构造函数:无参数的构造函数用于创建一个空的collection,有一个 collection参数的构造函数用于创建一个新的collection,这个新的collection与传入的collection有相同类型的元素。

结果: 1,2,3,4,5,6,7,8,9,10,

    这里展示了collection接口的2个用法,首先,collection构造函数接受另一个collection(list)作为参数,使其初始化。接着,调用addall()方法添加元素,注意,该方法只接受另一个collection作为参数。 此外,必须注意,collection接口不提供随机访问元素的get()方法。因为collection包括set,而set自己维护内部顺序。如果想检查collection中的元素,那就必须使用迭代器。

4.list接口

list接口

   list是有序的collection,使用此接口能够精确的控制每个元素插入的位置。用户能够使用索引(元素在list中的位置,类似于数组下标)来访问list中的元素,这类似于java的数组。 

    和下面要提到的set不同,list允许有相同的元素。 

    除了具有collection接口必备的iterator()方法外,list还提供一个listiterator()方法,返回一个 listiterator接口,和标准的iterator接口相比,listiterator多了一些add()之类的方法,允许添加,删除,设定元素, 还能向前或向后遍历。

linkedlist类

    linkedlist实现了list接口,允许null元素。此外linkedlist提供额外的get,remove,insert方法在 linkedlist的首部或尾部。这些操作使linkedlist可被用作堆栈(stack),队列(queue)或双向队列(deque)。此实现不是同步的。

arraylist类

    arraylist实现了可变大小的数组。它允许所有元素,包括null。

    size,isempty,get,set方法运行时间为常数。但是add方法开销为分摊的常数,添加n个元素需要o(n)的时间。其他的方法运行时间为线性。

    每个arraylist实例都有一个容量(capacity),即用于存储元素的数组的大小。这个容量可随着不断添加新元素而自动增加,但是增长算法并没有定义。当需要插入大量元素时,在插入前可以调用ensurecapacity方法来增加arraylist的容量以提高插入效率。此实现不是同步的。

5.set接口

set接口

    set具有和collection完全一样的接口,没有任何额外的功能。它是一种不包含重复的元素的collection,即任意的两个元素e1和e2都有e1.equals(e2)=false,set最多有一个null元素。 

很明显,set的构造函数有一个约束条件,传入的collection参数不能包含重复的元素。 请注意:必须小心操作可变对象(mutable object)。

如果一个set中的可变元素改变了自身状态导致object.equals(object)=true将导致一些问题。

hashset

    此类实现set 接口,由哈希表(实际上是一个 hashmap 实例)支持。它不保证 set 的迭代顺序;特别是它不保证该顺序恒久不变。此类允许使用 null 元素。此类为基本操作提供了稳定性能,此实现不是同步的。

linkedhashset

    具有可预知迭代顺序的set 接口的哈希表和链接列表实现。此实现与hashset的不同之处在于,它维护着一个运行于所有条目的双重链接列表。此链接列表定义了迭代顺序,即按照将元素插入到set中的顺序(插入顺序)进行迭代。注意,插入顺序不受在set中重新插入的元素影响。此实现不是同步的。

treeset

基于treemap的navigableset实现。使用元素的自然顺序对元素进行排序,或者根据创建set时提供的 comparator 进行排序,具体取决于使用的构造方法。此实现为基本操作(add、remove 和 contains)提供受保证的 log(n) 时间开销。此实现不是同步的。

6.map接口

请注意,map没有继承collection接口,map提供key到value的映射。一个map中不能包含相同的key,每个key只能映射一个 value。map接口提供3种集合的视图,map的内容可以被当作一组key集合,一组value集合,或者一组key-value映射。

weakhashmap

    以弱键实现的基于哈希表的map。在weakhashmap中,当某个键不再正常使用时,将自动移除其条目。更精确地说,对于一个给定的键,其映射的存在并不阻止垃圾回收器对该键的丢弃,这就使该键成为可终止的,被终止,然后被回收。丢弃某个键时,其条目从映射中有效地移除,因此,该类的行为与其他的map实现有所不同。此实现不是同步的。

treemap

    该映射根据其键的自然顺序进行排序,或者根据创建映射时提供的comparator进行排序,具体取决于使用的构造方法。此实现不是同步的。

hashmap

    基于哈希表的map接口的实现。此实现提供所有可选的映射操作,并允许使用 null 值和 null 键。(除了非同步和允许使用null之外,hashmap 类与 hashtable 大致相同。)此类不保证映射的顺序,特别是它不保证该顺序恒久不变。此实现不是同步的。

sortedmap

    进一步提供关于键的总体排序的map。该映射是根据其键的自然顺序进行排序的,或者根据通常在创建有序映射时提供的comparator进行排序。对有序映射的collection 视图(由 entryset、keyset 和 values 方法返回)进行迭代时,此顺序就会反映出来。要采用此排序方式,还需要提供一些其他操作(此接口是 sortedset 的对应映射)。

7.集合类性能效率总结

    注意,这里展示的类都是非线程安全的。如果需要考虑线程安全,应该使用concurrentmap,copyonwritearraylist,copyonwritearrayset等。

接口 

实现类  

保持插入顺序 

可重复 

排序 

使用说明  

list 

arraylist  

y  

n  

长于随机访问元素;但插入、删除元素较慢(数组特性)。  

linkedlist

 n

插入、删除元素较快,但随即访问较慢(链表特性)。 

set  

hashset  

使用散列,最快的获取元素方法。  

n

y

将元素存储在红-黑树数据结构中。默认为升序。  

使用散列,同时使用链表来维护元素的插入顺序。 

map  

hashmap  

使用散列,提供最快的查找技术。  

默认按照比较结果的升序保存键。  

linkedhashmap  

按照插入顺序保存键,同时使用散列提高查找速度。

总结 

① 如果涉及到堆栈,队列等操作,应该考虑用list。如果要进行大量的随机访问,应使用arraylist;如果经常进行插入与删除操作,用使用linkedlist。 

② hashmap设计用来快速访问;而treemap保持“键”始终处于排序状态,所以没有hashmap快。linkedhashmap保持元素插入的顺序,但是也通过散列提供了快速访问能力。 

③ set不接受重复元素。hashset提供最快的查询速度,而treeset保持元素处于排序状态。linkedhashset以插入顺序保存元素。 

④ 对哈希表的操作,作为key的对象要正确重写equals和hashcode方法。

⑤ 尽量返回接口而非实际的类型(针对抽象编程),如返回list而非arraylist,这样如果以后需要将arraylist换成linkedlist时,客户端代码不用改变。 

⑥ 程序中不应该使用过时的vector\hashtable\stack。