天天看点

Set,List,Map的关系 Set,List,Map的区别

java集合的主要分为三种类型:

set(集)

list(列表)

map(映射)

要深入理解集合首先要了解下我们熟悉的数组:

数组是大小固定的,并且同一个数组只能存放类型一样的数据(基本类型/引用类型),而java集合可以存储和操作数目不固定的一组数据。 所有的java集合都位于 java.util包中! java集合只能存放引用类型的的数据,不能存放基本数据类型。

简单说下集合和数组的区别:(参考文章:《thinking in algorithm》03.数据结构之数组)

[html]

view plaincopyprint?

Set,List,Map的关系 Set,List,Map的区别
Set,List,Map的关系 Set,List,Map的区别

<span style="font-family:microsoft yahei;font-size:12px;">世间上本来没有集合,(只有数组参考c语言)但有人想要,所以有了集合  

有人想有可以自动扩展的数组,所以有了list  

有的人想有没有重复的数组,所以有了set  

有人想有自动排序的组数,所以有了treeset,treelist,tree**  

而几乎有有的集合都是基于数组来实现的.  

因为集合是对数组做的封装,所以,数组永远比任何一个集合要快  

但任何一个集合,比数组提供的功能要多  

一:数组声明了它容纳的元素的类型,而集合不声明。这是由于集合以object形式来存储它们的元素。  

二:一个数组实例具有固定的大小,不能伸缩。集合则可根据需要动态改变大小。  

三:数组是一种可读/可写数据结构---没有办法创建一个只读数组。然而可以使用集合提供的readonly方法,以只读方式来使用集合。该方法将返回一个集合的只读版本。</span>  

java所有“存储及随机访问一连串对象”的做法,array是最有效率的一种。

1、

效率高,但容量固定且无法动态改变。

array还有一个缺点是,无法判断其中实际存有多少元素,length只是告诉我们array的容量。

2、java中有一个arrays类,专门用来操作array。

     arrays中拥有一组static函数,

equals():比较两个array是否相等。array拥有相同元素个数,且所有对应元素两两相等。

fill():将值填入array中。

sort():用来对array进行排序。

binarysearch():在排好序的array中寻找元素。

system.arraycopy():array的复制。

若撰写程序时不知道究竟需要多少对象,需要在空间不足时自动扩增容量,则需要使用容器类库,array不适用。所以就要用到集合。

那我们开始讨论java中的集合。

集合分类:

collection:list、set

map:hashmap、hashtable

collection是最基本的集合接口,声明了适用于java集合(只包括set和list)的通用方法。 set 和list 都继承了conllection,map。

Set,List,Map的关系 Set,List,Map的区别
Set,List,Map的关系 Set,List,Map的区别

<span style="font-weight: normal;">boolean add(object o)      :向集合中加入一个对象的引用   

void clear():删除集合中所有的对象,即不再持有这些对象的引用   

boolean isempty()    :判断集合是否为空   

boolean contains(object o) : 判断集合中是否持有特定对象的引用   

iterartor iterator()  :返回一个iterator对象,可以用来遍历集合中的元素   

boolean remove(object o) :从集合中删除一个对象的引用   

int size()       :返回集合中元素的数目   

object[] toarray()    : 返回一个数组,该数组中包括集合中的所有元素 </span>  

关于:iterator() 和toarray() 方法都用于集合的所有的元素,前者返回一个iterator对象,后者返回一个包含集合中所有元素的数组。

Set,List,Map的关系 Set,List,Map的区别
Set,List,Map的关系 Set,List,Map的区别

hasnext():判断集合中元素是否遍历完毕,如果没有,就返回true   

next() :返回下一个元素   

remove():从集合中删除上一个有next()方法返回的元素。  

set是最简单的一种集合。集合中的对象不按特定的方式排序,并且没有重复对象。 set接口主要实现了两个实现类:

hashset: hashset类按照哈希算法来存取集合中的对象,存取速度比较快 

treeset :treeset类实现了sortedset接口,能够对集合中的对象进行排序。 

set 的用法:存放的是对象的引用,没有重复对象

set set=new hashset();  

string s1=new string("hello");  

string s2=s1;  

string s3=new string("world");  

set.add(s1);  

set.add(s2);  

set.add(s3);  

system.out.println(set.size());//打印集合中对象的数目 为 2。  

set 的 add()方法是如何判断对象是否已经存放在集合中? 

boolean isexists=false;  

iterator iterator=set.iterator();  

while(it.hasnext())           {  

string oldstr=it.next();  

if(newstr.equals(oldstr)){  

isexists=true;  

}  

set的功能方法 

set具有与collection完全一样的接口,因此没有任何额外的功能,不像前面有两个不同的list。实际上set就是collection,只 是行为不同。(这是继承与多态思想的典型应用:表现不同的行为。)set不保存重复的元素(至于如何判断元素相同则较为负责) 

set : 存入set的每个元素都必须是唯一的,因为set不保存重复元素。加入set的元素必须定义equals()方法以确保对象的唯一性。set与collection有完全一样的接口。set接口不保证维护元素的次序。 

hashset:为快速查找设计的set。存入hashset的对象必须定义hashcode()。 

treeset: 保存次序的set, 底层为树结构。使用它可以从set中提取有序的序列。 

linkedhashset:具有hashset的查询速度,且内部使用链表维护元素的顺序(插入的次序)。于是在使用迭代器遍历set时,结果会按元素插入的次序显示。

list的特征是其元素以线性方式存储,集合中可以存放重复对象。 

list接口主要实现类包括:(参考文章:arraylist与linkedlist的区别)

arraylist() : 代表长度可以改变得数组。可以对元素进行随机的访问,向arraylist()中插入与删除元素的速度慢。 

linkedlist(): 在实现中采用链表数据结构。插入和删除速度快,访问速度慢。 

对于list的随机访问来说,就是只随机来检索位于特定位置的元素。 list 的 get(int index) 方法放回集合中由参数index指定的索引位置的对象,下标从“0” 开始。最基本的两种检索集合中的所有对象的方法: 

      1: for循环和get()方法: 

for(int i=0; i<list.size();i++){  

system.out.println(list.get(i));  

2: 使用 迭代器(iterator): 

iterator it=list.iterator();  

while(it.hashnext()){  

system.out.println(it.next());  

list的功能方法 

实际上有两种list:一种是基本的arraylist,其优点在于随机访问元素,另一种是更强大的linkedlist,它并不是为快速随机访问设计的,而是具有一套更通用的方法。

list:次序是list最重要的特点:它保证维护元素特定的顺序。list为collection添加了许多方法,使得能够向list中间插入与移除元素(这只推 荐linkedlist使用。)一个list可以生成listiterator,使用它可以从两个方向遍历list,也可以从list中间插入和移除元 素。 

arraylist:由数组实现的list。允许对元素进行快速随机访问,但是向list中间插入与移除元素的速度很慢。listiterator只应该用来由后向前遍历 arraylist,而不是用来插入和移除元素。因为那比linkedlist开销要大很多。 

linkedlist :对顺序访问进行了优化,向list中间插入与删除的开销并不大。随机访问则相对较慢。(使用arraylist代替。)还具有下列方 法:addfirst(), addlast(), getfirst(), getlast(), removefirst() 和 removelast(), 这些方法 (没有在任何接口或基类中定义过)使得linkedlist可以当作堆栈、队列和双向队列使用。

map 是一种把键对象和值对象映射的集合,它的每一个元素都包含一对键对象和值对象。 map没有继承于collection接口 从map集合中检索元素时,只要给出键对象,就会返回对应的值对象。 

map 的常用方法: 

1 添加,删除操作: 

Set,List,Map的关系 Set,List,Map的区别
Set,List,Map的关系 Set,List,Map的区别

object put(object key, object value): 向集合中加入元素   

   object remove(object key): 删除与key相关的元素   

   void putall(map t):  将来自特定映像的所有元素添加给该映像   

   void clear():从映像中删除所有映射   

2 查询操作: 

object get(object key):获得与关键字key相关的值 。map集合中的键对象不允许重复,也就说,任意两个键对象通过equals()方法比较的结果都是false.,但是可以将任意多个键独享映射到同一个值对象上。 

map的功能方法

方法put(object key, object value)添加一个“值”(想要得东西)和与“值”相关联的“键”(key)(使用它来查找)。方法get(object key)返回与给定“键”相关联的“值”。可以用containskey()和containsvalue()测试map中是否包含某个“键”或“值”。 标准的java类库中包含了几种不同的map:hashmap, treemap, linkedhashmap,

weakhashmap, identityhashmap。它们都有同样的基本接口map,但是行为、效率、排序策略、保存对象的生命周期和判定“键”等价的策略等各不相同。 

执行效率是map的一个大问题。看看get()要做哪些事,就会明白为什么在arraylist中搜索“键”是相当慢的。而这正是hashmap提高速 度的地方。hashmap使用了特殊的值,称为“散列码”(hash code),来取代对键的缓慢搜索。“散列码”是“相对唯一”用以代表对象的int值,它是通过将该对象的某些信息进行转换而生成的。所有java对象都 能产生散列码,因为hashcode()是定义在基类object中的方法。 

hashmap就是使用对象的hashcode()进行快速查询的。此方法能够显着提高性能。 

map : 维护“键值对”的关联性,使你可以通过“键”查找“值”

hashmap:map基于散列表的实现。插入和查询“键值对”的开销是固定的。可以通过构造器设置容量capacity和负载因子load factor,以调整容器的性能。 

linkedhashmap: 类似于hashmap,但是迭代遍历它时,取得“键值对”的顺序是其插入次序,或者是最近最少使用(lru)的次序。只比hashmap慢一点。而在迭代访问时发而更快,因为它使用链表维护内部次序。 

treemap : 基于红黑树数据结构的实现。查看“键”或“键值对”时,它们会被排序(次序由comparabel或comparator决定)。treemap的特点在 于,你得到的结果是经过排序的。treemap是唯一的带有submap()方法的map,它可以返回一个子树。 

weakhashmao :弱键(weak key)map,map中使用的对象也被允许释放: 这是为解决特殊问题设计的。如果没有map之外的引用指向某个“键”,则此“键”可以被垃圾收集器回收。 

identifyhashmap: : 使用==代替equals()对“键”作比较的hash map。专为解决特殊问题而设计。

容器内每个为之所存储的元素个数不同。

collection类型者,每个位置只有一个元素。

map类型者,持有 key-value pair,像个小型数据库。

collection

     --list:将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同。

           --arraylist / linkedlist / vector

     --set : 不能含有重复的元素

           --hashset / treeset

      map

     --hashmap

     --hashtable

     --treemap

list,set,map将持有对象一律视为object型别。

collection、list、set、map都是接口,不能实例化。

    继承自它们的 arraylist, vector, hashtable, hashmap是具象class,这些才可被实例化。

vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。

总结

1. 如果涉及到堆栈,队列等操作,应该考虑用list,对于需要快速插入,删除元素,应该使用linkedlist,如果需要快速随机访问元素,应该使用arraylist。

2. 如果程序在单线程环境中,或者访问仅仅在一个线程中进行,考虑非同步的类,其效率较高,如果多个线程可能同时操作一个类,应该使用同步的类。

3. 在除需要排序时使用treeset,treemap外,都应使用hashset,hashmap,因为他们 的效率更高。

4. 要特别注意对哈希表的操作,作为key的对象要正确复写equals和hashcode方法。

5. 容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。一旦将对象置入容器内,便损失了该对象的型别信息。

6. 尽量返回接口而非实际的类型,如返回list而非arraylist,这样如果以后需要将arraylist换成linkedlist时,客户端代码不用改变。这就是针对抽象编程。

注意:

1、collection没有get()方法来取得某个元素。只能通过iterator()遍历元素。

2、set和collection拥有一模一样的接口。

3、list,可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个,get(0)...。(add/get)

4、一般使用arraylist。用linkedlist构造堆栈stack、队列queue。

5、map用 put(k,v) / get(k),还可以使用containskey()/containsvalue()来检查其中是否含有某个key/value。

      hashmap会利用对象的hashcode来快速找到key。

6、map中元素,可以将key序列、value序列单独抽取出来。

使用keyset()抽取key序列,将map中的所有keys生成一个set。

使用values()抽取value序列,将map中的所有values生成一个collection。

为什么一个生成set,一个生成collection?那是因为,key总是独一无二的,value允许重复。