天天看点

疯狂Java讲义-Java集合Java集合

Java集合

本章思维导图

疯狂Java讲义-Java集合Java集合

Java集合概述

为了保存数量不确定的数据,以及保存具有映射关系的数据(也被称为关联数组),Java提供了集合类。集合类主要负责保存、盛装其他数据,因此集合类也被称为容器类。

集合和数组不一样,数组元素既可以是基本类型的值,也可以是对象(实际上保存的是对象的引用变量);而集合里只能保存对象(实际上只是保存对象的引用变量)。

Java的集合类主要由两个接口派生而出:Collection和Map,Collection和Map是Java集合框架的根接口,这两个接口又包含了一些子接口或实现类。

Set和List接口是Collection接口派生出的两个子接口,它们分别代表了无序集合和有序集合;Queue是java提供的队列实现,类似于List。

Map实现类用于保存具有映射关系的数据(关联数组);Map保存的每项数据都是

key-value

对;Map里的key是不可重复的,key用于标识集合里的每项数据。

可以把Java所有集合分成三大类

  • Set

    :把一个对象添加到Set集合时,Set集合无法记住添加这个元素的顺序,所以Set里的元素不能重复。
  • List

    :非常像一个数组,它可以记住每次添加元素的顺序、且List的长度可变。
  • Map

    :也像一个罐子,只是它里面的每项数据都由两个值组成。

Collection和Iterator接口

Collection体系图

疯狂Java讲义-Java集合Java集合

Collection接口是List、Set和Queue接口的父接口,该接口里定义的方法既可以用于操作Set集合,也可用于操作List和Queue集合。

Collection接口里定义了如下操作集合元素的方法:

  • boolean add(Object o)

    :该方法用于向集合里添加一个元素。如果集合对象被添加操作改变了,则返回true。
  • boolean addAll(Collection c)

    :该方法把集合c里的所有元素添加到指定集合里。如果集合对象被添加操作改变了,则返回true。
  • void clear()

    :清除集合里的所有元素,将集合长度变为0.
  • boolean contains(Object o)

    :返回集合里是否包含指定元素。
  • boolean containsAll(Collection c)

    :返回集合里是否包含集合c里的所有元素。
  • boolean isEmpty()

    :返回集合是否为空。当集合长度为0时返回true,否则返回false。
  • Iterator iterator()

    :返回一个Iterator对象,用于遍历集合里的元素。
  • boolean remove(Object o)

    :删除集合中指定元素o,当集合中包含了一个或多个元素o时,该方法只删除第一个符合条件的元素,该方法将返回true。
  • boolean removeAll(Collection c)

    :从集合中删除集合c里包含的所有元素(相当于调用该方法的集合减集合c),如果删除了一个或一个以上的元素,则该方法返回true。
  • boolean retainAll(Collection c)

    :从集合中删除集合c里不包含的元素(相当于把调用该方法的集合变成该集合和集合c的交集),如果该操作改变了调用该方法的集合,则该方法返回true。
  • int size()

    :该方法返回集合里元素的个数。
  • Object[] toArray()

    :该方法把集合转换成一个数组,所有的集合元素变成对应的数组元素。

使用Lambda表达式遍历集合

Java8为Iterable接口新增了一个

forEach(Consumer action)

默认方法,该方法所需参数的类型是一个函数式接口,而Iterable接口是Collection接口的父接口,因此Collection集合也可直接调用该方法。

当程序调用Iterable的

forEach(Consumer action)

遍历集合时,程序会依次将集合元素传给Consumer的

accept(T t)

方法(该接口中唯一的抽象方法)。正因为Consumer是函数式接口,因此可以使用Lambda表达式来遍历集合元素。

使用Java8增强的Iterator遍历集合元素

Iterator接口也是Java集合框架的成员,但它与Collection系列、Map系列的集合不一样:Collection系列集合、Map系列集合主要用于盛装其他对象,而Iterator则主要用于遍历(即迭代访问)Collection集合中的元素,Iterator对象也被称为迭代器。

Iterator接口隐藏了各种Collection实现类的底层细节,向应用程序提供了遍历Collection集合元素的统一编程接口。

Iterator接口里定义了如下4个方法:

  • boolean hasNext()

    :如果被迭代的集合元素还没有被遍历完,则返回true。
  • Object next()

    :返回集合里的下一个元素。
  • void remove()

    :删除集合里的上一次next方法返回的元素。
  • void forEachRemainning(Consumer action)

    :这是Java8为Iterator新增的默认方法,该方法可使用Lambda表达式来遍历集合元素。

Iterator必须依附于Collection对象,若有一个Iterator对象,则必然有一个与之关联的Collection对象。

当使用Iterato迭代访问Collection集合时,Collection集合里的元素不能被改变,只能通过Iterator的

remove()

方法删除上一次

next()

方法返回的集合元素才可以;否则将会引发

java.util.ConcurrentModificationException

异常。

Iterator迭代器采用的是**快速失败(fail-fast)**机制,一旦在迭代过程中检测到该集合已经被修改(通常是程序中的其他线程修改),程序立即引发

ConcurrentModificationException

异常,而不是显示修改后的结果,这样可以避免共享资源而引发的潜在问题。

使用Lambda表达式遍历Iterator

Java8起为Iterator接口新增了一个

forEachRemaining(Consumer action)

方法,该方法所需的Consumer参数同样也是函数式接口。当程序调用Iterator的

forEachRemaining(Consumer action)

遍历集合元素时,程序会依次将集合元素传给Consumer的

accept(T t)

方法(该接口中唯一的抽象方法)。

使用foreach循环遍历集合元素

除可以使用Iterator接口迭代访问Collection集合里的元素之外,使用Java5提供的foreach循环迭代访问集合元素更加便捷。

与使用Ierator接口迭代访问集合元素类似的是,foreach循环中的迭代变量也不是集合元素本身,系统只是依次把集合元素的值赋给迭代变量。

同样,当使用foreach循环迭代访问集合元素时,该集合也不能被改变,否则将引发

ConcurrentModificationException

异常。

使用Java8新增的Predicate操作集合

Java8起为Collection集合新增了一个

removeIf(Predicate filter)

方法,该方法将会批量删除符合filter条件的所有元素。该方法需要一个Predicate谓词对象作为参数,Predicate也是函数式接口,因此可使用Lambda表达式作为参数。

使用Java8新增的Stream操作集合

Java8还新增了Stream、IntStream、LongStream、DoubleStream等流式API,这些API代表多个支持串行和并行聚集操作的元素。Stream是一个通用的流接口,而IntStream、LongStream、DoubleStream则代表元素为int、long、double的流。

Java8还为上面的每个流式API提供了对应的Builder,例如Stream.Builder、IntStream.Builder、LongStream.Builder、DoubleStream.Builder,开发者可以通过这些Builder来创建对应的流。

独立使用Stream的步骤如下:

  1. 使用Stream或XxxStream的

    builder()

    类方法创建该Stream对应Builder。
  2. 重复调用Builder的add()方法向该流中添加多个元素。
  3. 调用Builder的build()方法获取对应的Stream。
  4. 调用Stream的聚集方法。

Stream提供了大量的方法进行聚集操作,这些方法既可以是中间的(intermediate),也可以是末端的(terminal)。

中间方法:中间操作允许流保持打开状态,并允许直接调用后继方法。

末端方法:末端方法是对流的最终操作。当某个Stream执行末端方法后,该流将会被消耗且不可再用。

除此之外,关于流的方法好有如下两个特征:

  • 有状态的方法:这种方法会给流增加一些新的属性,比如元素的唯一性、元素的最大数量、保证元素以排序的方式被处理等。有状态的方法往往需要更大的性能开销。
  • 短路方法:短路方法可以尽早结束对流的操作,不必检查所有的元素。

Stream常用的中间方法:

  • filter(Predicate predicate)

    :过滤Stream中所有不符合predicate的元素。
  • mapToXxx(ToXxxFunction mapper)

    :使用ToXxxFunction对流中的元素执行一对一的转换,该方法返回新流中包含了ToXxxFunction转换生成的所有元素。
  • peek(Consumer action)

    :依次对每个元素执行一些操作,该方法返回的流与原有流包含相同的元素。该方法主要用于调试。
  • distinct()

    :该方法用于排序流中所有重复的元素(判断元素重复的标准是使用

    equals()

    比较返回true)。这是一个有状态的方法。
  • sorted()

    :该方法用于保证流中的元素在后继的访问中处于有序状态。这是一个有状态的方法。
  • limit(long maxSize)

    :该方法用于保证对该流的后继访问中最大允许访问的元素个数。这是一个有状态的、短路方法。

Stream常用的末端方法:

  • forEach(Consumer action)

    :遍历流中所有元素,对每个元素执行action。
  • toArray()

    :将流中所有元素转换为一个数组。
  • reduce()

    :该方法有三个重载的版本,都用于通过某种操作来合并流中的元素。
  • max()

    :返回流中所有元素的最大值。
  • count()

    :返回流中所有元素的数量。
  • anyMatch(Predicate predicate)

    :判断流中是否至少包含一个元素符合Predicate条件。
  • allMatch(Predicate predicate)

    :判断流中是否每个元素都符合Predicate条件。
  • noneMatch(Predicate predicate)

    :判断流中是否所有元素都不符合Predicate条件。
  • findFirst()

    :返回流中的第一个元素。
  • findAny()

    :返回流中的任意一个元素。

Java8允许使用流式API来操作集合,Collection接口提供了一个

stream()

默认方法,该方法返回该集合对应的流,接下来就即可通过流式API来操作集合元素。由于Stream可以对集合元素进行整体的聚集操作,因此Stream极大地丰富了集合的功能。

Set集合

Set集合与Collection基本相同,没有提供任何额外的方法。实际上Set就是Collection,只是行为略有不同(Set不允许包含重复元素)。

Set集合不允许包含相同的元素,如果试图把两个相同的元素加入同一个Set集合中,则添加操作失败,add()方法返回false,且新元素不会被加入。

HashSet类

HashSet是Set接口的典型实现,大多数时候使用Set集合时就是使用这个实现类。HashSet按Hash算法来存储集合中的元素,因此具有很好的存取和查找性能。

HashSet具有以下特点:

  • 不能保证元素的排列顺序,顺序可能与添加顺序不同,顺序也有可能发生变化。
  • HashSet是不同步的,如果多个线程同时访问一个HashSet,假设有两个或两个以上线程同时修改了HashSet集合时,则必须通过代码来保证其同步。
  • 集合元素值可以是null。

当向HashSet集合中存入一个元素时,HashSet会调用该对象的

hashCode()

方法来得到该对象的hashCode值,然后根据该hashCode值决定该对象在HashSet中的存储位置。

如果两个元素通过

equals()

方法比较返回true,但它们的

hashCode()

方法返回值不相等,HashSet将会把它们存储到不同的位置,依然可以添加成功。

也就是说,HashSet集合判断两个元素相等的标准是两个对象通过

equals()

方法比较相等,并且两个对象的

hashCode()

方法返回值也相等。

当把一个对象放入HashSet中时,如果需要重写该对象对应类的

equals()

方法,则也应该重写其

hashCode()

方法。规则是:如果两个对象通过

equals()

方法比较返回true,这两个对象的hashCode值也应该相同。

如果两个对象通过

equals()

方法比较返回true,但这两个对象的

hashCode()

方法返回不同的hashCode值时,这将导致HashSet会把这两个对象保存在Hash表的不同位置,从而使两个对象都可以添加成功,这就与Set集合规则冲突了。

如果两个对象的

hashCode()

方法返回相同的hashCode值,但它们通过

equals()

方法比较返回false时将更麻烦:因为两个对象的hashCode值相同,HashSet将试图把他们保存到同一个位置,但又不行(否则将只剩下一个对象),所及实际上会在这个位置用链式结构来保存多个对象;而HashSet访问集合元素时也是根据元素的hashCode来快速定位的,如果HashSet中两个以上的元素具有相同的hashCode值,将会导致性能下降。

HashSet中每个能存储元素的槽位(slot)通常称为桶(bucket),如果有多个元素的hashCode值相同,但它们通过

equals()

方法比较返回false,就需要在一个“桶”里放多个元素,这样会导致性能下降。

重写hashCode()方法的基本规则:

  • 在程序运行过程中,同一个对象多次调用

    hashCode()

    方法应该返回相同的值。
  • 当两个对象通过

    equals()

    方法比较返回true时,这两个对象的

    hashCode()

    方法应该返回相等的值。
  • 对象中用作

    equals()

    方法比较标准的实例变量,都应该用于计算hashCode值。

重写hashCode()方法的一般步骤:

  1. 把对象内每个有意义的实例变量(即每个参与

    equals()

    方法比较标准的实例变量)计算出一个int类型的hashCode值。
  • hashCode值的计算方式:
    • boolean:

      hashCode = (f ? 0 : 1);

    • (byte、short、char、int):

      hashCode = (int)f;

    • long:

      hashCode = (int)(f >>> 32));

    • float:

      hashCode = Float.floatToIntBits(f);

    • double:

      long l = Double.doubleToLongBits(f); hashCode = (int)(l ^ (l >>> 32));

    • 引用类型:

      hashCode = f.hashCode();

  1. 用第1步计算出的多个hashCode值组合计算除一个hashCode值返回。

为了避免直接相加产生偶然相等(两个对象的f1、f2实例变量并不相等,但它们的hashCode的和恰好相等),可以通过为各实例变量的hashCode值乘以任意一个质数后再相加。

如果向HashSet中添加一个可变对象后,后面程序修改了该可变对象的实例变量,则可能导致它与集合中的其他元素相同,这就有可能导致HashSet中包含两个相同的对象。

当程序把可变对象添加到HashSet中之后,尽量不要去修改该集合元素中参与计算的

hashCode()

equals()

的实例变量,否则将会导致HashSet无法正确操作这些集合元素。

当向HashSet中添加可变对象时,必须十分小心。如果修改HashSet集合中的对象,有可能导致该对象与集合中的其他对象相等,从而导致HashSet无法精确访问该对象。

LinkedHashSet类

HashSet类还有一个子类LibkedHashSet,LinkedHashSet集合也是根据元素的hashCode值来决定元素的存储位置,但它同时使用链表维护元素的次序,当遍历LinkedHashSet集合里的元素时,LinkedHashSet将会按元素的添加顺序来访问集合里的元素。

LinkedHashSet需要维护元素的插入顺序,因此性能略低于HashSet性能,但在迭代访问Set里的全部元素时将有很好的性能,因此它以链表来维护内部顺序。

TreeSet类

TreeSet是SortedSet接口的实现类,TreeSet可以确保集合元素处于排序状态。与HashSet集合相比,TreeSet还提供了如下几个额外的方法:

  • Comparator comparator()

    :如果TreeSet采用了定制排序,则该方法返回定制排序所使用的Comparator;如果TreeSet采用了自然排序,则返回null。
  • Object first()

    :返回集合中的第一个元素。
  • Object last()

    :返回集合中的最后一个元素。
  • Object lower(Object e)

    :返回集合中位于指定元素之前的元素(即小于指定元素的最大元素,参考元素不需要是TreeSet集合里的元素)。
  • Object higher(Object e)

    :返回集合中位于指定元素之后的元素(即大于指定元素的最大元素,参考元素不需要是TreeSet集合里的元素)。
  • SortedSet subSet(Object fromElement, Object toElement)

    :返回此Set的子集合,范围从fromElement(包含)到toElement(不包含)。
  • SortedSet headSet(Object toElement)

    :返回此Set集合的子集,由小于toElement的元素组成。
  • SortedSet tailSet(Object fromElement)

    :返回此Set的子集,由大于或等于fromElement的元素组成。

TreeSet并不是根据元素的插入顺序进行排序,而是根据元素实际值的大小进行排序的。

HashSet集合采用hash算法来决定元素的存储位置不同,TreeSet采用红黑树的数据结构来存储集合的元素。

TreeSet支持两种排序方式:自然排序和定制排序。默认情况下,TreeSet采用自然排序。

自然排序

TreeSet会调用集合元素的

compareTo(Object obj)

方法来比较元素之间的大小关系,然后将集合元素升序排序。

Java提供了一个Comparable接口,该接口里定义了一个

compareTo(Object obj)

方法,该方法返回一个整数值,实现该接口的类必须实现该方法,实现了该接口的类的对象就可以比较大小。当一个对象obj1调用该方法与另一个对象obj2进行比较时,如果该方法返回0,则表明这两个对象相等;如果该方法返回一个正整数,则表明ob1大于obj2;如果该方法返回一个负整数,则表明ob1小于obj2。

Java的一些常用类已经实现的Comparable接口,并提供了比较大小的标准。下面是实现了Comparable接口的常用类:

  • BigDecimal、BigInteger以及所有的数值型对应的包装类:按它们对应的数值大小进行比较。
  • Character:按字符的UNICODE值进行比较。
  • Boolean:true对应包装类实例大于false对应的包装类实例。
  • String:按字符串中字符的UNICODE值进行比较。
  • Date、Time:后面的时间、日期比前面的时间、日期大。

如果试图把一个对象添加到TreeSet时,该对象的类必须实现Comparable接口,否则程序将会抛出异常。

大部分类在实现

compareTo(Object obj)

方法时,都需要将被比较对象obj强制类型转换成相同类型,因为只有相同类的两个实例才会比较大小。

如果希望TreeSet能正常运作,TreeSet只能添加同一种类型的对象。

当把一个对象加入TreeSet集合中时,TreeSet调用该对象的

compareTo(Object obj)

方法与容器中的其他对象比较大小,然后根据红黑树结构找到它的存储位置。如果两个对象通过

compareTo(Object obj)

方法比较相等,新对象将无法添加到TreeSet集合中。

TreeSet集合判断两个对象唯一标准就是

compareTo(Object obj)

方法。

当需要把一个对象放入TreeSet中,重写该对象对应类的

equals()

方法时,应保证该方法与

compareTo(Object obj)

方法有一致的结果,其规则是:如果两个对象通过

equals()

方法比较返回true时,这两个对象通过

compareTo(Object obj)

方法比较应返回0。

当执行了删除元素代码成功后,TreeSet会对集合中的元素重新索引(不是重新排序),接下来就可以删除TreeSet中的所有元素了,包括那些被修改过实例变量的值。与HashSet类似的是,如果TreeSet中包含了可变对象,当可变对象的实例变量被修改时,TreeSet在处理这些对象时将会非常复杂,而且容易出错。

定制排序

TreeSet的自然排序是根据集合元素的大小,TreeSet将它们以升序排序。

如果需要实现定制排序,例如以降序排序,则可以通过Comparable接口的帮助。该接口里包含了一个

int compare(T o1, T o2)

方法,该方法用于比较o1和o2的大小:如果该方法返回正整数,则表明o1大于o2;如果该方法返回0,则表明o1等于o2;如果该方法返回负整数,则表明o1小于o2。

如果需要实现定制排序,则需要在创建TreeSet集合对象时,提供一个Comparator对象与该TreeSet集合关联,由该Comparator对象负责集合元素的排序逻辑。由于Comparator是一个函数式接口,因此可使用Lambda表达式来代替Comparator对象。

当通过Comparator对象(或Lambda表达式)来实现TreeSet的定制排序时,依然不可以向TreeSet中添加类型不同的对象,否则还会引发

ClassCastException

异常。使用定制排序时,TreeSet对集合元素排序不管集合元素本身的大小,而是由Comparator对象(或Lambda表达式)负责集合元素的排序规则。

TreeSet判断两个集合元素的相等的标准是:通过Comparator(或Lambda表达式)比较两个元素返回了0,这样TreeSet不会把第二个元素添加到集合中。

EnumSet类

EnumSet是一个转为枚举类设计的集合类,EnumSet中的所有元素都必须是指定枚举类型的枚举值,该枚举类型在创建EnumSet时显示或隐式地指定。EnumSet的集合元素也是有序的,EnumSet以枚举值在Enum类内定义顺序来决定集合元素的顺序。

EnumSet在内部以位向量的形式存储,这种存储形式非常紧凑、高效,因此EnumSet对象占用内存很小,而且运行效率很好。尤其是进行批量操作(如调用

containsAll()

retainAll()

方法)时,如果其参数也是EnumSet集合,则该批量操作的执行速度也非常快。

EnumSet集合不允许加入null元素,如果试图插入null元素,EnumSet将抛出

NullPointerException

异常。如果只是想判断EnumSet是否包含null元素或试图删除null元素都不会抛出异常,只是删除操作将返回false,因为没有任何null元素被删除。

EnumSet类没有暴露任何构造器来创建该类的实例,程序应该通过它提供的类方法来创建EnumSet对象。EnumSet类它提供了如下常用的类方法来创建EnumSet对象:

  • EnumSet allOf(Class elementType)

    :创建一个包含指定枚举类里所有枚举值的EnumSet集合。
  • EnumSet complementOf(EnumSet s)

    :创建一个其元素类型与指定EnumSet里元素类型相同的EnumSet集合,新EnumSet集合包含原EnumSet集合所不包含的、此枚举类剩下的枚举值(即新EnumSet集合和原EnumSet集合的集合元素加起来就是该枚举类的所有枚举值)。
  • EnumSet copyOf(Collection c)

    :使用一个普通集合来创建EnumSet集合。
  • EnumSet copyOf(EnumSet s)

    :创建一个与指定EnumSet具有相同元素类型、相同集合元素的EnumSet集合。
  • EnumSet noneOf(Class elementType)

    :创建一个元素类型为指定枚举类型的空EnumSet。
  • EnumSet Of(E first, E... rest)

    :创建一个包含一个或多个枚举值的EnumSet集合,传入的多个枚举值必须属于同一个枚举类。
  • EnumSet range(E from, E to)

    :创建一个包含从from枚举值到to枚举值范围内所有枚举值的EnumSet集合。

当试图复制Collection集合里的元素来创建EnumSet集合时,必须保证Collection集合里的所有元素都是同一个枚举类的枚举值。

各Set实现类的性能分析

HashSet和TreeSet是Set的两个典型实现,到底如何选择HashSet和TreeSet?HashSet的性能总是比TreeSet好(特别是最常用的添加、查询元素等操作),因为TreeSet需要额外的红黑树算法来维护集合元素的次序。只有当需要一个保持排序的Set时,才应该使用TreeSet,否则都应该使用HashSet。

HashSet还有一个子类:LinkedHashSet,对于普通的插入、删除操作,LinkedHashSet比HashSet要略微慢一点,这是由维护链表所带来的额外开销造成的,但由于有了链表,遍历LinkedHashSet会更快。

EnumSet是所有Set实现类中性能最好的,但它只能保存同一个枚举类的枚举值作为集合元素。

Set的三个实现类HashSet、TreeSet和EnumSet都是线程不安全的。如果有多个线程同时访问一个Set集合,并且有超过一个线程修改了该Set集合,则必须手动保证该Set集合的同步性。通常可以通过Collection工具类的synchronizedSortedSet方法来“包装”该Set集合。此操作最好再创建时进行,以防止对Set集合的意外非同步访问。例如:

SortedSet s = Collections.synchronizedSortedSet(new TreeSet(...));

List集合

List集合代表一个元素有序、可重复的集合,集合中每个元素都有其对应的顺序索引。List集合允许使用重复元素,可以通过索引来访问指定位置的集合元素。List集合默认按元素的添加顺序设置元素的索引。

Java8改进的List接口和ListIterator接口

List作为Collection接口的子接口,当然可以使用Collection接口里的全部方法。而且由于List是有序集合,因此List集合里增加了一些根据索引来操作集合元素的方法。

  • void add(int index, Object element)

    :将元素element插入到List集合的index处。
  • boolean addAll(int index, Collection c)

    :将集合c所包含的所有元素都插入到List集合的index处。
  • Object get(int index)

    :返回集合index索引处的元素。
  • int indexOf(Object o)

    :返回对象o在List集合中第一次出现的位置索引。
  • int lastIndexOf(Object o)

    :返回对象o在List集合中最后一次出现的位置索引。
  • Object remove(int index)

    :删除并返回index索引处的元素。
  • Object set(int index, Object element)

    :将index索引处的元素替换成element对象,返回被替换的旧元素。
  • List subList(int fromIndex, int toIndex)

    :返回从索引fromIndex(包含)到索引toIndex(不包含)处所有集合元素组成的子集合。

所有的List实现类都可以调用这些方法来操作集合元素。与Set集合相比,List增加了根据索引来插入、替换和删除集合元素的方法。除此之外,Java8还为List接口添加了如下两个默认方法。

  • void replaceAll(UnaryOperator operator)

    :根据operator指定的计算规则重新设置List集合的所有元素。
  • void sort(Comparator c)

    :根据Comparator参数对List集合的元素排序。

Lisi判断两个对象相等只要通过

equals()

方法比较返回true即可。

remove(new A());

程序试图删除一个A对象,Lit将会调用该A对象的

equals()

方法依次与集合元素进行比较,如果该

equals()

方法以某个集合元素作为参数时返回true。

当调用List的

set(int index, Object element)

方法来改变List集合指定索引处的元素时,指定的索引必须是List集合的有效索引。

set(int index, Object element)

方法不会改变List集合的长度。

Java8为List集合增加了

sort()

replaceAll()

两个常用的默认方法,其中

sort()

方法需要一个Comparator对象来控制元素排序,程序可使用Lambda表达式来作为参数;而

replaceAll()

方法则需要一个UnaryOperator来替换所有集合元素,UnaryOperator也是一个函数式接口,因此也可使用Lambda表示作为参数。

与Set只提供了一个

iterator()

方法不同,List还额外提供了一个

listIterator()

方法,该方法返回一个ListIterator对象,ListIterator接口继承了Iterator接口,提供了专门操作List的方法。ListIterator接口在Iterator接口基础上增加了如下方法。

  • boolean hasPrevious()

    :返回该迭代器关联的集合是否还有上一个元素。
  • Object previous()

    :返回该迭代器的上一个元素。
  • void add(Object o)

    :在指定位置插入一个元素。

拿ListIterator与普通的Iterator进行对比,不难发现ListIterator增加了向前迭代的功能(Iterator只能向后迭代),而且ListIterator还可通过

add()

方法向List集合中添加元素(Iterator只能删除元素)。

ArrayList和Vector实现类

ArrayList和Vector类都是基于数组实现的List类,所以ArrayList和Vector类封装了一个动态的、允许再分配的Object[]数组。ArrayList和Vector对象使用

initialCapacity

参数来设置该数组的长度,当向ArrayList或Vector中添加元素超出了该数组的长度时,它们的initialCapacity会自动增加。

当向ArrayList或Vector集合中添加大量元素时,可使用

ensureCapacity(int minCapacity)

方法一次性地增加initialCapacity。这可以减少重分配的次数,从而提高性能。

除此之外,ArrayList和Vector还提供了如下两个方法来重新分配Object[]数组。

  • void ensureCapacity(int minCapasity)

    :将ArrayList或Vector集合的Object[]数组长度增加大于或等于minCapacity。
  • void trimToSize()

    :调整ArrayList或Vector集合的Object[]数组长度为当前元素的个数。调用该方法可减少ArrayList或Vector集合对象占用的存储空间。

ArrayList和Vector的显著区别是:ArrayList是线程不安全的,当多个线程访问同一个ArrayList集合时,如果有超过一个线程修改了ArrayList集合,则程序必须手动保证该集合的同步性;但Vector集合则是线程安全的,无须程序保证该集合的同步性。因为Vector是线程安全的,所以Vector的性能比ArrayList的性能要低。实际上,即使需要保证List集合线程安全的,也同样不推荐使用Vector实现类。会有一个Collections工具类,它可以将一个ArrayList变成线程安全的。

Vector还提供了一个Stack子类,它用于模拟栈这种数据结构,“栈”通常是指后进先出(LIFO)的容器。最后“push”进栈的元素,将最先被“pop”出栈。与Java中的其他集合一样,进栈出栈都是Object,因此从栈中取出元素后必须进行类型转换,除非是使用Object具有的操作。所以Stack类里提供了如下几个方法。

  • Object peek()

    :返回“栈”的第一个元素,但并不将该元素“pop”出栈。
  • Object pop()

    :返回“栈”的第一个元素,并将该元素“pop”出栈。
  • void push(Object item)

    :将一个元素“push”进栈,最后一个进“栈”的元素总是位于“栈“顶。

由于Stack继承了Vector,因此它也是一个非常古老的Java集合类,它同样是线程安全的、性能较差的,因此应该尽量少用Stack类。如果程序需要使用”栈“这种数据结构,则可以考虑ArrayDeque。

ArrayDeque也是List的实现类,ArrayDeque即实现了List接口,也实现了Deque接口,由于实现了Deque接口,因此可以作为栈来使用;而且ArrayDeque底层也是基于数组的实现,因此性能也很好。

固定长度的List

操作数组的工具类:Arrays,该工具类提供了

asList(Object... a)

方法,该方法可以把一个数组或指定个数的对象转换成一个List集合,这个List集合既不是ArrayList实现类的实例,也不是Vector实现类的实例,而是Arrays的内部类ArrayList的实例。

Arrays.ArrayList是一个固定长度的List集合,程序只能遍历访问该集合里的元素,不可增加、删除该集合里的元素。

Queue集合

Queue用于模拟队列这种数据结构,队列通常是指**先进先出(FIFO)**的容器。队列的头部保存在队列存放时间最长的元素,队列的尾部保存在队列中存放时间最短的元素。新元素插入(offer)到队列的尾部,访问元素(poll)操作会返回队列头部的元素。通常,队列不允许随机访问队列中的元素。

Queue接口中定义了如下几个方法。

  • void add(Object e)

    :将指定元素加入此队列的尾部。
  • Object element()

    :获取队列头部的元素,但是不删除该元素。
  • boolean offer(Object e)

    :将指定元素加入此队列的尾部。当使用有容量限制的队列时,此方法通常比

    add(Object e)

    方法更好。
  • Object peek()

    :获取队列头部的元素,但是不删除该元素。如果此队列为空,则返回null。
  • Object poll()

    :获取队列头部的元素,并删除该元素。如果此队列为空,则返回null。
  • Object remove()

    :获取队列头部的元素,并删除该元素。

Queue接口有一个PriorityQueue实现类。除此之外,Queue还有一个Deque接口,Deque代表一个双端队列,双端队列可以同时从两端来添加、删除元素,因此Deque的实现类即可当成队列使用,也可当成栈使用。Java为Deque提供了ArrayDeque和LinlkedList两个实现类。

PriorityQueue实现类

PriorityQueue是一个比较标准的队列实现类。之所以说它是比较标准的队列实现,而不是绝对标准的队列实现,是因为PriorityQueue保存队列元素的顺序并不是按加入队列的顺序,而是按队列元素的大小进行重新排序。因此当调用

peek()

方法或者

poll()

方法取出队列中的元素时,并不是取出最先进入队列的元素,而是去除队列中最小的元素。

PriorityQueue不允许插入null元素,它还需要对队列元素进行排序,PriorityQueue的元素有两种排序方式。

  • 自然排序:采用自然排序的PriorityQueue集合中的元素必须实现了Comparable接口,而且应该是同一个类的多个实例,否则可能导致ClassCastException异常。
  • 定制排序:创建PriorityQueue队列时,传入一个Comparable对象,该对象负责对队列中的所有元素进行排序。采用定制排序时不要求队列元素实现Comparable接口。

PriorityQueue队列对元素的要求与TreeSet对元素的要求基本一致。

Deque接口与ArrayDeque实现类

Deque接口是Queue接口的子接口,它代表一个双端队列,Deque接口里定义了一些双端队列的方法,这些方法允许从两端来操作队列的元素。

  • void addFirst(Object e)

    :将指定元素插入该双端队列的开头。
  • void addLast(Object e)

    :将指定元素插入该队列的末尾。
  • Iterator descendingIterator()

    :返回该双端队列对应的迭代器,该迭代器将以逆向顺序来迭代队列中的元素。
  • Object getFirst()

    :获取但不删除双端队列的第一个元素。
  • Object getLast()

    :获取但不删除双端队列的最后一个元素。
  • boolean offerFirst(Object e)

    :将指定元素插入该双端队列的开头。
  • boolean offerLast(Object e)

    :将指定元素插入该双端队列的末尾。
  • Object peekFirst()

    :获取但不删除该双端队列的第一个元素;如果双端队列为空,则返回null。
  • Object peekLast()

    :获取但不删除该双端队列的最后一个元素;如果双端队列为空,则返回null。
  • Object pollFirst()

    :获取并删除该双端队列的第一个元素;如果此双端队列为空,则返回null。
  • Object pollLast()

    :获取并删除该双端队列的最后一个元素;如果此双端队列为空,则返回null。
  • Object pop()

    :栈方法,pop出该双端队列所表示的栈的栈顶元素。相当于

    removeFirst()

  • void push(Object e)

    :栈方法,将一个元素push进该双端队列所表示的栈的栈顶。相当于

    addFirst(e)

  • Object removeFirst(Object e)

    :获取并删除该双端队列的第一个元素。
  • Object removeFirstOccurrence(Object o)

    :删除该双端队列的第一次出现的元素o。
  • Object removeLast(Object e)

    :获取并删除该双端队列的最后一个元素。
  • Object removeLastOccurrence(Object o)

    :删除该双端队列的最后一次出现的元素o。

Deque不仅可以当成双端队列使用,而且可以被当成栈来使用,因为该类还包含了pop(出栈)、push(入栈)两个方法。

Deque的方法与Queue的方法对照表

Queue的方法 Deque的方法
add(e)/offer(e) addLast(e)/offerLast(e)
remove()/poll() removeFirst()/pollFirst()
element()/peek() getFirst()/peekFirst()

Deque的方法与Stack的方法对照表

Stack的方法 Deque的方法
push(e) addFirst(e)/offerFirst(e)
pop() removeFirst()/pollFirst()
peek() getFirst()/peekFirst()

Deque接口提供了一个典型的实现类:ArrayDeque,从该名称就可以看出,它是一个基于数组实现的双端队列,创建Deque时同样可指定一个numElements参数,该参数用于指定Object[]数组的长度;如果不指定numElements参数,Deque底层的数组长度为16。

ArrayList和ArrayDeque两个集合类的实现机制基本相似,它们底层都采用一个动态的、可重分配的Object[]数组来存储集合元素,当集合元素超出了该数组的容量时,系统会在底层重新分配一个Object[]数组来存储集合元素。

因此程序中需要使用栈这种数据结构时,推荐使用ArrayDeque,尽量避免使用Stack——因为Stack是古老的集合,性能较差。

LinkedList实现类

LinkedList类是List接口的实现类,可以根据索引来随机访问集合中的元素。除此之外,LinkedList还实现了Deque接口,可以被当成双端队列来使用,因此既可以被当成栈来使用,也可以当成队列使用。

LinkedList与ArrayList、ArrayDeque的实现机制完全不同,ArrayList、ArrayDeque内部以数组的形式来保存集合中的元素,因此随机访问集合元素时有较好的性能;而LinkedList内部以链表的形式来保存集合中的元素,因此随机访问集合元素时性能较差,但在插入、删除元素时性能比较出色(只需改变指针所指的地址即可)。虽然Vector也是以数组的形式来存储集合元素的,但因为它实现了线程的同步功能(而且实现机制也不好),所以各方面性能都比较差。

对于所有的内部基于数组的集合实现,例如ArrayList、ArrayDeque等,使用随机访问的性能比使用Iterator迭代访问的性能要好,因为随机访问会被映射成对数组元素的访问。

各种线性表的性能分析

Java提供的List就是一个线性表接口,而ArrayList、LinkedList又是线性表的两种典型实现:基于数组的线性表和基于链的线性表。Queue代表队列,Deque代表了双端队列(既可作为队列使用,也可作为栈使用)。

一般来说,由于数组以一块连续内存区来保存所有的数组元素,所以数组在随机访问时性能最好,所有的内部以数组作为底层实现的集合在随机访问时性能都比较好;而内部以链表作为底层实现的集合在执行插入、删除操作时有较好的性能。但总体来说,ArrayList的性能比LinkedList的性能要好,因此大部分时候应该考虑使用ArrayList。

关于使用List集合的建议。

  • 如果需要遍历List集合元素,对于ArrayList、Vector集合,应该使用随机访问方法(get)来遍历集合元素,这样性能更好;对于LinkedList集合,则应该采用迭代器(Iterator)来遍历集合元素。
  • 如果需要经常执行插入、删除操作来改变包含大量数据的List集合的大小,可考虑使用LinkedList集合。使用ArrayList、Vector集合可能需要经常重新分配内部数组的大小,效果可能较差。
  • 如果有多个线程需要同时访问List集合中的元素,可考虑使用Collections将集合包装成线程安全的集合。

Java8增强的Map集合

Map体系图

疯狂Java讲义-Java集合Java集合

Map用于保存具有映射关系的数据,因此Map集合里保存着两组值,一组值用于保存Map里的key,另外一组值用于保存Map里的value,key和value都可以是任何引用类型的数据。Map里的key不允许重复,即同一个Map对象的任何两个key通过

equals()

方法比较总是返回false。

key和value之间存在单向一对一关系,即通过指定的key,总能找到唯一的、确定的value。

如果把Map里的所有key放在一起来看,它们就组成了Set集合(所有的key没有顺序,key与key之间不能重复),实际上Map包含了一个

keySet()

方法,用于返回Map里的所有key组成的Set集合。

Map里key集和Set集合里的元素的存储形式很像,Map子类和Set子类在名字上也惊人地相似,比如Set接口下有HashSet、LinkedHashSet、SortedSet(接口)、TreeSet、EnumSet等子接口和实现类,而Map接口下则有HashMap、LinkedHashMap、SortedMap(接口)、TreeMap、EnumMap等子接口和实现类。Map的这些实现类和子接口中key集的存储形式和对应Set集合中元素的存储形式完全相同。

Set和Map之间的关系非常密切。虽然Map中存放的元素是key-value对,Set集合中放的元素是单个对象,但如果把key-value对中的value当成key的附庸:key在哪里,value就跟在哪里。Map提供了一个Entry内部类来封装key-value对,而计算Entry存储时则只考虑Entry封装的key。从Java源码来看,Java是先实现了Map,然后通过包装一个所有value都为null的Mao就实现了Set。

如果把Map里的所有value放在一起来看,它们有非常类似于一个List:元素与元素之间可以重复,每个元素可以根据索引来查找,只是Map中的索引不再使用整数值,而是以另一个对象作为索引。Map有时也被称为字典,或关联数组。Map接口中定义了如下常用的方法。

  • void clear()

    :删除该Map对象中的所有key-value对。
  • boolean containsKey(Object key)

    :查询Map中是否包含指定的key,如果包含则返回true。
  • boolean containsValue(Object value)

    :查询Map中是否包含一个或多个value,如果包含则返回true。
  • Set entrySet()

    :返回Map中包含的key-value对所组成的Set集合,每个集合元素都是Map.Entry(Entry是Map的内部类)对象。
  • Object get(Object key)

    :返回指定key所对应的value;如果此Map中不包含该key,则返回null。
  • boolean isEmpty()

    :查询该Map是否为空(即不包含任何key-value对),如果为空则返回true。
  • Set keySet()

    :返回该Map中所有key组成的Set集合。
  • Object put(Object key, Object value)

    :添加一个key-value对,如果当前Map中已有一个与该key相等的key-value对,则新的key-value对会覆盖原来的key-value对。
  • void putAll(Map m)

    :将指定Map中的key-value对复制到本Map中。
  • Object remove(Object key)

    :删除指定key所对应的key-value对,返回删除key所关联的value,如果该key不存在,则返回null。
  • Object remove(Object key, Object value)

    :这是Java8新增的方法,删除指定key、value所对应的key-value对。如果该Map中成功地删除该key-value对,该方法返回true,否则返回false。
  • int size()

    :返回该Map里的key-value对的个数。
  • Collection values()

    :返回该Map里所有value组成的Collection。

Map接口提供了大量的实现类,典型实现如HashMap和Hashtable等、HashMap的子类LinkedHashMap,还有SortedMap子接口及该接口的实现类TreeMap,以及WeakHashMap、IdentityHashMap等。

Map里包括了一个内部类Entry,该类封装了一个key-value对。Entry包含如下三个方法。

  • Object getKey()

    :返回该Entry里包含的key值。
  • Object getValue()

    :返回该Entry里包含的value值。
  • Object setValue(V value)

    :设置该Entry里包含的value值,并返回新设置的value值。

Map集合最典型的用法就是成对地添加、删除key-value对,接下来即可判断该Map中是否包含指定key,是否包含指定value,也可以通过Map提供的

keySet()

方法获取所有key组成的集合,进而遍历Map中所有的key-value对。

添加key-value对时,Map允许多个value重复,但如果添加key-value对时Map中已有重复的key,那么新添加的value会覆盖原来对应的value,该方法会返回被覆盖的value。

Java8为Map新增的方法

Java8除为Map增加了

remove(Object key, Object value)

默认方法之外,还增加了如下方法。

  • Object compute(Object key, BiFunction remappingFunction)

    :该方法使用remappingFunction根据原key-value对计算一个新的value。只要新的value不为null,就是用新的value覆盖原value;如果原value不为null,但新的value为null,则删除原key-value对;如果原value、新value同时为null,那么该方法不改变任何key-value对,直接返回null。
  • Object computeIfAbsent(Object key, Function mappingFunction)

    :如果传给该方法的key参数在Map中对应的value为null,则使用mappingFunction根据key计算一个新的结果,如果计算结果不为null,则用计算结果覆盖原有的value。如果原Map原来不包括该key,那么该方法可能会添加一组key-value。
  • Object computeIfPresent(Object key, BiFunction remappingFcuntion)

    :如果传给该方法的key参数在Map中对应的value不为null,该方法将使用remappingFunction根据原key-value计算一个新的结果,如果计算结果不为null,则使用该结果覆盖原来的value;如果计算结果为null,则删除原key-value对。
  • void forEach(BiConsumer action)

    :该方法是Java8为Map新增的一个遍历key-value对的方法,通过该方法可以更简洁地遍历Map的key-value对。
  • Object getOrDefault(Object key, V defaultValue)

    :获取指定key对应的value。如果该key不存在,则返回defaultValue。
  • Object merge(Object key, Object value, BiFunction remappingFunction)

    :该方法会根据key参数获取该Map中对应的value。如果获取的value为null,则直接用传入的value覆盖原有的value(在这种情况下,可能要添加一组key-value对);如果获取的value不为null,则使用remappingFunction函数根据原value、新value计算一个新的结果,并用得到的结果去覆盖原有的value。
  • Object putIfAbsent(Object key, Object value)

    :该方法会自动检测指定key对应的value是否为null,如果该key对应的value为null,该方法会用新的value代替原来的null值。
  • Object replace(Object key, Object value)

    :将Map中指定key对应的value替换成新value。与传统

    put()

    方法不同的是,该方法不可能添加新的key-value对。如果尝试替换的key在原Map中不存在,该方法不会添加key-value,而是返回null。
  • boolean replace(K key, V oldValue, V newValue)

    :将Map中指定key-value对原value替换成新value。如果在Map中找到指定的key-value对,则执行替换并返回true,否则返回false。
  • replaceAll(BiFunction function)

    :该方法使用BiFunction对原key-value对执行计算,并将计算结果作为该key-value对的valu值。

Java8改进的HashMap和Hashtable实现类

HashMap和Hashtable都是Map接口的典型实现类,它们之间的关系完全类似于ArrayList和Vector的关系:Hashtable是一个古老的Map实现类,它从JDK1.0起就已经出现了,所以它包含了两个烦琐的方法,即

elements()

(类似于Map接口定义的

values()

方法)和

keys()

(类似于Map接口定义的

keySet()

方法),现在很少使用这两个方法。

Java8改进了HashMap的实现,使用HashMap存在key冲突时依然具有较好的性能。

除此之外,Hashtable和HashMap存在两点典型区别。

  • Hashtable是一个线程安全的Map实现,但HashMap是线程不安全的实现,所以HashMap比Hashtable的性能高一点;但如果有多个线程访问同一个Map对象时,使用Hashtable实现类会更好。
  • Hashtable不允许使用null作为key和value,如果试图把null值放进Hashtable中,将会引发NullPointerException异常;但HashMap可以使用null作为key或value。

由于HashMap里的key不能重复,所以HashMap里最多只有一个key-value对key为null,但可以有无数多个key-value对的value为null。

Hashtable是一个古老的类,它的命名甚至没有遵守Java的命名规范;与Vector类似的是,尽量少用Hashtable实现类,即使需要创建线程安全的Map实现类,也无须使用Hashtable实现类,可以通过Collections集合工具类把HashMap变成线程安全的。

为了成功地在HashMap、Hashtable中存储、获取对象,用作key的对象必须实现

hashCode()

方法和

equals()

方法。

与HashSet集合不能保证元素的顺序一样,HashMap、Hashtable也不能保证其中key-value对的顺序。类似于HashSet,HashMap、Hashtable判断两个key相等的标准也是:两个key通过

equals()

方法比较返回true,两个key的

hashCode()

值也相等。

除此之外,HashMap、Hashtable中还包含一个

containsValue()

方法,用于判断是否包含指定的value。

Hashtable判断value相等的标准是:value与另外一个对象通过

equals()

方法比较返回true即可。

自定义类作为HashMap、Hashtable的key时,如果重写该类的

equals(Object obj)

hashCode()

方法,则应该保证两个方法判断标准一致——当两个key通过

equals()

方法比较返回true时,两个key的

hashCode()

返回值也应该相同。

与HashSet类似的是,如果使用可变对象作为HashMap、Hashtable的key,并且程序修改了作为key的可变对象,则也可能出现于HashSet类似的情形:程序再无法准确访问到Map中被修改过的key。

LinkedHashMap实现类

HashSet有一个LinkedHashSet子类,HashMap也有一个LinkedHashMap子类;LinkedHashMap也使用双向链表来维护key-value对的次序(其实只需要考虑key的次序),该链表复制维护Map的迭代顺序,迭代顺序与key-value对的插入顺序保持一致。

LinkedHashMap可以避免对HashMap、Hashtable里的key-value对进行排序(只要插入key-value对时保持顺序即可),同时又可避免使用TreeMap所增加的成本。

LinkedHashMap需要维护元素的插入顺序,因此性能略低于HashMap的性能;但因为它以链表来维护内部顺序,所以在迭代访问Map里的全部元素时将有较好的性能。

使用Properties读写属性文件

Properties类是Hashtable类的子类,该对象在处理属性文件时特别方便(Windows操作平台上的ini文件就是一种属性文件)。Properties类可以把Map对象和属性文件关联起来,从而把Map对象中的key-value对写入属性文件中,也可以把属性文件中的“属性名=属性值”加载到Map对象中。由于属性文件里的属性名、属性值都是字符串类型,所以Properties里的key、value都是字符串类型。该类提供了如下三个方法来修改Properties里的key、value值。Properties相当于一个key、value都是String类型的Map。

  • String getProperty(String key)

    :获取Properties中指定属性名对应的属性值,类似于Map的

    get(Object key)

    方法。
  • String getProperty(String key, String defaultValue)

    :如果Properties中不存在指定的key时,则该方法指定默认值。
  • Object setProperty(String key, String value)

    :设置属性值,类似于Hashtable的

    put()

    方法。

除此之外,它还提供了两个读写属性文件的方法。

  • void load(InputStream inStream)

    :从属性文件(以输入流表示)中加载key-value对,把加载到key-value对追加到Properties里(Properties是Hashtable的子类,它不保证key-value对之间的次序)。
  • void store(OutputStream out, String comments)

    :将Properties中的key-value对输出到指定的属性文件(以输出流表示)中。

SortedMap接口和TreeMap实现类

正如Set接口派生出SortedSet子接口,SortedSet接口有一个TreeSet实现类一样,Map接口也派生出一个SortedMap子接口,SortedMap接口也有一个TreeMap实现类。

TreeMap就是一个红黑树数据结构,每个key-value对即作为红黑树的一个节点。TreeMap存储key-value对(节点)时,需要根据key对节点进行排序。TreeMap可以保证所有的key-value对处于有序状态。TreeMap也有两种排序方式。

  • 自然排序:TreeMap的所有key必须实现Comparable接口,而且所有的key应该是同一个类的对象,否则将抛出ClassCastException异常。
  • 定制排序:创建TreeMap时,传入一个Comparator对象,该对象负责对TreeMap中的所有key进行排序。采用定制排序时不要求Map的key实现Comparable接口。

类似于TreeSet中判断两个元素相等的标准,TreeMap中判断两个key相等的标准是:两个key通过

compareTo()

方法时应保持一致的返回结果:两个key通过

equals()

方法比较返回true时,它们通过

compareTo()

方法比较应该返回0。如果

equals()

方法与

compareTo()

方法的返回结果不一致,TreeMap与Map接口的规则就会冲突。

Set和Map的关系十分密切,Java源码就是先实现了HashMap、TreeMap等集合,然后通过包装一个所有的value都为null的Map集合实现了Set集合类。

与TreeSet类似的是,TreeMap中也提供了一系列根据key顺序访问key-value对的方法。

  • Map.Entry firstEntry()

    :返回该Map中最小key所对应的key-value对,如果该Map为空,则返回null。
  • Object firsrtKey()

    :返回该Map中的最小key值,如果该Map为空,则返回null。
  • Map.Entry lastEntry()

    :返回该Map中最大key所对应的key-value对,如果该Map为空或不存在这样的key-value对,则返回null。
  • Object lastKey()

    :返回该Map中的最大key值,如果该Map为空或不存在这样的key-value对,则返回null。
  • Map.Entry higherEntry(Object key)

    :返回该Map中位于key后一位的key-value对(即大于指定key的最小key所对应的key-value对)。如果该Map为空,则返回null。
  • Object higherKey(Object key)

    :返回该Map中位于key后一位的key值(即大于指定key的最小key值)。如果该Map为空或不存在这样的key-value对,则都返回null。
  • Map.Entry lowerEntry(Object key)

    :返回该Map中位于key前一位的key-value对(即小于指定key的最大key所对应的key-value对)。如果该Map为空或不存在这样的key-value对,则返回null。
  • Object lowerKey(Object key)

    :返回该Map中位于key前一位的key值(即小于指定key的最大key值)。如果该Map为空或不存在这样的key-value对,则都返回null。
  • NavigableMap subMap(Object fromKey, boolean fromInclusive, Object toKey, boolean toInclusive)

    :返回该Map的子Map,其key的范围是从fromKey(是否包括取决于第二个参数)到toKey(是否包括取决于第四个参数)。
  • SortedMap subMap(Object key, Object toKey)

    :返回该Map的子Map,其key的范围是从fromKey(包括)到toKey(不包括)。
  • SortedMap tailMap(Object fromKey)

    :返回该Map的子Map,其key的范围是大于fromKey(包括)到所有key。
  • NavigableMap tailMap(Object fromKey, boolean inclusive)

    :返回该Map的子Map,其key的范围是大于fromKey(是否包括取决于第二个参数)的所有key。
  • SortedMap headMap(Object toKey)

    :返回该Map的子Map,其key的范围是小于toKey(不包括)的所有key。
  • NavigableMap headMap(Object toKey, boolean inclusive)

    :返回该Map的子Map,其key的范围是小于toKey(是否包括取决于第二个参数)的所有key。

WeakHashMap实现类

WeakHashMap与HashMap的用法基本相似。与HashMap的区别在于,HashMap的key保留了对实际对象的强引用,这意味着只要该HashMap对象不被销毁,该HashMap的所有key所引用的对象就不会被垃圾回收,HashMap也不会自动删除这些key所对应的key-value对;但WeakHashMap的key只保留了对实际对象的弱引用,这意味着如果WeakHashMap对象的key所引用的对象没有被其他强引用变量所引用,则这些key所引用的对象可能被垃圾回收,WeakHashMap也可能自动删除这些key所对应的key-value对。

WeakHashMap中的每个key对象只持有对实际对象的弱引用,因此,当垃圾回收了该key所对应的实际对象之后,WeakHashMap会自动删除该key对应的key-value对。

如果需要使用WeakHashMap的key来保留对象的弱引用,则不要让该key所引用的对象具有任何强引用,否则将失去WeakHashMap的意义。

IdentityHashMap实现类

这个Map实现类的实现机制与HashMap基本相似,但它在处理两个key相等时比较特殊:在IndentityHashMap中,当且仅当两个key严格相等(key1==key2)时,IdentityHashMap才认为两个key相等;对于普通的HashMap而言,只要key1和key2通过

equals()

方法比较返回true,且它们的hashCode值相等即可。

IdentityHashMap提供了与HashMap基本相似的方法,也允许使用null作为key和value。与HashMap相似:IdentityHashMap也不保证key-value对之间的顺序,更不能保证它们的顺序随时间的推移保持不变。

EnumMap实现类

EnumMap是一个与枚举类一起使用的Map实现,EnumMap中的所有key都必须是单个枚举类的枚举值。创建EnumMap时必须显示或隐式指定它对应的枚举类。EnumMap具有如下特征。

  • EnumMap在内部以数组形式保存,所以这种实现形式非常紧凑、高效。
  • EnumMap根据key的自然顺序(即枚举值在枚举类中的定义顺序)来维护key-value对的顺序。当程序通过

    keySet()

    entrySet()

    values()

    等方法遍历EnumMap时可以看到这种顺序。
  • EnumMap不允许使用null作为key,但允许使用null作为value。如果试图使用null作为key时将抛出NullPointerException异常。如果只是查询是否包含值为null的key,或只是删除值为null的key,都不会抛出异常。

与创建普通的Map所有区别的是,创建EnumMap时必须指定一个枚举类,从而将该EnumMap和指定枚举类关联起来。

各Map实现类的性能分析

对于Map常用实现类而言,虽然HashMap和Hashtable的实现机制几乎一样,但由于Hashtable是一个古老的、线程安全的集合,因此HashMap通常比Hashtable要快。

TreeMap通常比HashMap、Hashtable要慢(尤其在插入、删除key-value对时更慢),因为TreeMap底层采用红黑树来管理key-value对(红黑树的每个结点就是一个key-value对)。

使用TreeMap有一个好处:TreeMap中的key-value对总是处于有序状态,无序专门进行排序操作。当TreeMap被填充之后,就可以调用

keySet()

,取得由key组成的Set,然后使用

toArray()

方法生成key的数组,接下来使用Arrays的

binarySearch()

方法在已排序的数组中快速地查询对象。

对于一般的应用场景,程序应该多考虑使用HashMap,因为HashMap正是为快速查询设计的(HashMap底层其实也是采用数组来存储key-value对)。但如果程序需要一个总是排好序的Map时,则可以考虑使用TreeMap。

LinkedHashMap比HashMap慢一点,因为它需要维护链表来保持Map中的key-value时的添加顺序。IdentityHashMap性能没有特别出色之处,因为它采用HashMap基本相似的实现,只是它使用

==

而不是

equals()

方法来判断元素相等。EnumMap的性能最好,但它只能使用同一个枚举类的枚举值作为key。

HashSet和HashMap的性能选项

对于HashSet及其子类而言,他们采用hash算法来决定集合中元素的存储位置,并通过hash算法来控制集合的大小;对于HashMap、Hashtable及其子类而言,它们采用hash算法来决定Map中key的存储,并通过hash算法来增加key集合的大小。

hsh表里可以存储元素的位置被称为桶(bucket),在通常情况,单个“桶”里存储一个元素,此时有最好的性能:hash算法可以根据hashCode值计算出“桶”存储位置,接着从“桶”中取出元素。但hahs表的状态时open的:在发生hash冲突的情况下,单个桶会存储多个元素。这些元素以链表形式存储。

因为HashSet和HashMap、Hashtable都是用hash算法来决定其元素(HashMap则只考虑key)的存储,因此HashSet、HashMap的hash表包含如下属性。

  • 容量(capacity):hash表中桶的数量
  • 初始化容量(initial capacity):创建hash表时桶的数量。HashMap和HashSet都允许在构造器中指定初始化容量。
  • 尺寸(size):当前hash表中记录的数量。
  • 负载因子(load factor):负载因子等于size/capacity。负载因子为0时,表示空的hash表,0.5表示半满的hash表,以此类推。轻负载的hash表具有冲突少、适宜插入与查询的特点(但是使用Iterator迭代元素时比较慢)。

除此之外,hash表里还有一个负载极限,负载极限是一个0~1的数值,负载极限决定了hash表的最大填满程度。当hash表中的负载因子达到指定的负载极限时,hash表会自动成倍地增加容量(桶的数量),并将原有的对象重新分配,放入新的桶内,这称为rehashing。

HashSet和HashMap、Hashtable的构造器允许指定一个负载极限,HashSet和HashMap、Hashtable默认的负载极限为0.75。

负载极限的默认值(0.75)是时间和空间成本上的一种折中:较高的负载极限可以降低hash表所占用的内存空间,但会增加查询数据的时间开销,而查询是最频繁的操作(HashMap的

get()

put()

方法都要用到查询);较低的负载极限会提高查询数据的性能,但会增加hash表所占用的内存开销。

如果开始就知道HashSet和HashMap、Hashtable会保存很多记录,则可以在创建时就是用较大的初始化容量,如果初始化容量始终大于HashSet和HashMap、Hashtable所包含的最大记录数除以负载极限,就不会发生rehashing,使用足够大的初始化容量创建HashSet和HashMap、Hashtable时,可以更高效地增加记录,当将初始化容量设置太高可能会浪费空间。

操作集合的工具类:Collections

Java提供了一个操作Set、List和Map等集合的工具类:Collctions,该工具类里提供了大量方法对集合元素进行排序、查询和修改等操作。

排序操作

Collections提供了如下常用的类方法用于对List集合元素进行排序。

  • void reverse(List list)

    :反转指定List集合中的元素顺序。
  • void shuffle(List list)

    :对List集合元素进行随机排序(shuffle方法模拟了”洗牌“动作)。
  • void sort(List list)`:根根据元素的自然顺序对指定List集合的元素按升序进行排序。
  • void sort(List list, Comparator c)

    :根据指定Comparator产生的顺序对List集合元素进行排序。
  • void swap(List list, int i, int j)

    :将指定List集合中的i处元素和j处元素进行交换。
  • void rotate(List list, int distance)

    :当distance为正数时,将list集合的后distance个元素”整体“移到前面;当distance为负数时,将list集合的前distance个元素”整体“移到后面。

查找、替换操作

Collections还提供了如下常用的用于查找、替换集合元素的类方法。

  • int binarySearch(List list, Object key)

    :使用二分搜索法搜索指定的List集合,以获得指定对象在List集合中的索引。如果要使用该方法可以正常工作,则必须保证List中的元素已经处于有序状态。
  • Object max(Collection coll)

    :根据元素的自然排序,返回给定集合中的最大元素。
  • Object max(Collection coll, Comparator comp)

    :根据Comparator指定的顺序,返回给定集合中的最大元素。
  • Object min(Collection coll)

    :根据元素的自然排序,返回给定集合中的最小元素。
  • Object min(Collection coll, Comparator comp)

    :根据Comparator指定的顺序,返回给定集合中的最小元素。
  • void fill(List list, Object obj)

    :使用指定元素obj替换指定List集合中的所有元素。
  • int frequency(Collection c, Object o)

    :返回指定集合中指定元素的出现次数。
  • int indexOfSubList(List source, List target)

    :返回子List对象在父List对象中第一次出现的位置索引;如果父List中没有出现这样的子List,则返回-1。
  • int lastIndexOfSubList(List source, List target)

    :返回子List对象在父List对象中最后一次出现的位置索引;如果父List中没有出现这样的子List,则返回-1。
  • bollean replaceAll(List list, Object oldVal, Object newVal)

    :使用一个新值newVal替换List对象的所有旧值oldVal。

同步控制

Collections类中提供了多个

synchronizedXxx()

方法,该方法将指定集合包装成线程同步的集合,从而可以解决多线程并发访问集合时的线程安全问题。

Java中常用的集合框架中的实现类HashSet、TreeSet、ArrayList、ArrayDeque、LinkedList、HashMap和TreeMap都是线程不安全的。如果有多个线程访问它们,而且有超过一个的线程试图修改它们,则存在线程安全的问题。Collections提供了多个类方法可以把它们包装成线程同步的集合。

设置不可变集合

COllections提供了如下三类方法来返回一个不可变的集合。

  • emptyXxx()

    :返回一个空的、不可变的集合对象,此处的集合既可以是List,也可以是SortedSet、Set,还可以是Map、SortedMap等。
  • singletonXxx()

    :返回一个只包含指定对象(只有一个或一项元素)的、不可变的集合对象,此处的集合既可以是List,还可以是Map。
  • unmodifiableXxx()

    :返回指定集合对象的不可变试图,此处的集合既可以是List,也可以是Set、SortedSet,还可以是Map、SortedMap等。

上面三类方法的参数是原有的集合对象,返回值是该集合的只读版本。

Java9新增的不可变集合

Java9以前要创建一个包含6个元素的Set集合,程序需要先创建Set集合,然后6次调用

add()

方法向Set集合中添加元素。Java9对此进行了简化,程序直接调用Set、List、Map的

of()

方法即可创建包含N个元素的不可变的集合。

不可变意味着程序不能向集合中添加元素,也不能从集合中删除元素。

创建不可变的Map集合有两个方法:使用

of()

类方法时只要依次传入多个key-value对即可;还可使用

ofEntries()

类方法,该方法可接受多个Entry对象,因此程序显示使用

Map.entry()

方法来创建Map.Entry对象。

烦琐的接口:Enumeration

Enumeration接口是Iterator迭代器的古老版本,从JDK1.0开始,Enumeration接口就已经存在了(Iterator从JDK1.2出现)。Enumeration接口只有两个名字很长的方法。

  • boolean hasMoreElements()

    :如果次迭代器还有剩下的元素,则返回true。
  • Object nextElement()

    :返回该迭代器的下一个元素,如果还有的话(否则将抛出异常)。

Enumeration接口中的方法名称冗长,难以记忆,而且没有提供Iterator的

remove()

方法。如果现在编写Java程序,应该尽量采用Iterator迭代器。

Java之所以保留Enumeration接口,主要是为了照顾以前那些“古老”的程序,那些程序里大量使用了Enumeration接口,如果新版本的Java里直接删除Enumeration接口,将会导致那些程序全部出错。在计算机行业有一条规则:加入任何规则都必须谨慎,因为以后无法删除规则。

实际上,Vector(包括其子类Stack)、Hashtable两个集合类,以及另一个极少使用的BitSet,都是从JDK1.0遗留下来的集合类,而Enumeration接口可用于遍历这些“古老”的集合类。对于ArrayList、HashMap等集合类,不再支持使用Enumeration。