
集合大緻分為Set、List、Queue、Map四種體系,其中List,Set,Queue繼承自Collection接口,Map為獨立接口
Set的實作類有:HashSet,LinkedHashSet,TreeSet...
List下有ArrayList,Vector,LinkedList...
Map下有Hashtable,LinkedHashMap,HashMap,TreeMap...
list
有序,可重複
ArrayList:數組,查詢快,增删慢。線程不安全. Vector:數組,查詢快,增删慢。線程安全. LinkedList:連結清單,查詢慢,增删快。線程不安全
set
無序(不嚴謹),唯一
HashSet:無序,唯一,哈希表實作,通過hashCode()和equals()保證唯一。 LinkedHashSet:繼承自hashset,底層是連結清單和哈希表。(FIFO插入有序,唯一) TreeSet:底層是紅黑樹。(唯一,有序)
map
KV形式的鍵值對
TreeMap:有序,不是線程安全的。 HashMap:無序,不是線程安全的,HashMap允許null值(key和value都允許) HashTable:無序,線程安全的,不允許null值,
Set 接口繼承Collection,用于存儲不含重複元素的集合。
HashSet
底層是哈希表,當插入元素時,HashSet會調用該對象的hashCode()方法得到hashCode,然後根據hashCode決定該對象在哈希表中的存儲位置。 (這裡有個問題,如果hashcode不是均勻分布的,而是集中在一個區域,極端情況下,hash表會變成連結清單)
HashSet去重原理:通過equals()方法比較,且其hashCode()方法傳回值也相等。 (可以通過覆寫hashCode和equals方法改變其去重規則,進行自定義去重)
TreeSet
TreeSet底層是紅黑樹;加入元素時,必須加入同類型的對象,否則會發生ClassCastException異常,因為TreeSet會調用集合元素的compareTo()方法來比較元素之間的大小關系(自然排序)。
compareTo()方法的傳回值決定了順序:
-1 表示放在紅黑樹的左邊,即逆序輸出;
1 表示放在紅黑樹的右邊,即順序輸出;
0 表示元素相同,僅存放第一個元素自然排序(treeset去重的原理);
其次,TreeSet也可以通過比較器排序。
LinkedHashSet
繼承自HashSet,底層是連結清單和哈希表。
由連結清單保證元素有序(插入順序)。
由哈希表保證元素唯一
TreeSet, LinkedHashSet and HashSet 的差別
都實作Set接口,不包含重複元素
都不是線程安全的,如果要使用線程安全可以Collections.synchronizedSet()
TreeSet的主要功能用于排序
LinkedHashSet的主要功能用于保證FIFO,即有序的集合(先進先出)
HashSet隻是通用的存儲資料的集合
插入速度: HashSet>LinkHashSet>TreeSet(内部實作排序)
HashSet不保證順序,LinkHashSet保證FIFO(先進先出),TreeSet安裝内部實作排序,也可以自定義排序規則
HashSet和LinkHashSet允許null, (隻能有一個null) 但TreeSet中插入null時會報NullPointerException
list的實作類有ArrayList,Vector,LinkedList...其中ArrayList和Vector很相似,均是以數組作為底層實作,不同之處在于Vector是線程安全的。
ArrayList
ArrayList基于數組實作,不是線程安全的,内部維護了一個可變長的對象數組,集合内所有元素存儲于這個數組中,并實作該數組長度的動态伸縮。
ArrayList使用數組拷貝來實作指定位置的插入和删除。
LinkedList
LinkedList内部以連結清單的形式來儲存元素,是以随機通路集合時性能較差,但插入,删除元素時性能較好。
LinkedList不僅實作了List接口,還實作了Deque接口,可以被當成雙端隊列來使用,即可被當成“棧”來使用,也可以當成隊列使用。
ArrayList 和LinkedList比較
兩者都是List接口的實作類,都不是線程安全。List的另外一個實作類vector是線程安全的。
ArrayList是基于動态數組的資料結構,而LinkedList是基于連結清單的資料結構。
對于随機通路get和set(查詢操作),ArrayList要優于LinkedList.(LinkedList要移動指針)
對于增删操作(add和remove),LinkedList優于ArrayList。
Map集合用于儲存映射關系的資料,Map集合中儲存了兩組值,一組是 key, 一組是 value。
Map的key不能重複。
key和value之間存在單向一對一的關系, 通過key,能找到唯一确定的value。
Map将key和value封裝至一個叫做Entry的對象中,Map中存儲的元素實際是Entry。隻有在keySet()和values()方法被調用時,Map才會将keySet和values對象執行個體化。
HashMap
key 是通過hash表來存儲,value是通過連結清單來存儲。
HashMap将Entry對象存儲在一個數組中,并通過哈希表來實作對Entry的快速通路。 (通過key的哈希值計算Entry在數組中的index,以此通路value) (拉鍊法,解決hash碰撞)
HashTable
幾乎和HashMap一樣,都是通過數組存儲Entry,以key的哈希值計算Entry在數組中的index,用拉鍊法解決哈希沖突。二者最大的不同在于, Hashtable是線程安全的,其提供的方法幾乎都是同步的。
ConcurrentHashMap
ConcurrentHashMap是HashMap的線程安全版,提供比Hashtable更高效的并發性能。
Hashtable 在進行讀寫操作時會鎖住整個Entry數組,這就導緻資料越多性能越差。
ConcurrentHashMap使用分離鎖的思路解決并發性能,其将 Entry數組拆分至16個Segment中,以雜湊演算法決定Entry應該存儲在哪個Segment。這樣就可以實作在寫操作時隻對一個Segment 加鎖,大幅提升了并發寫的性能。
在進行讀操作時,ConcurrentHashMap在絕大部分情況下都不需要加鎖,其Entry中的value是volatile的,這保證了value被修改時的線程可見性,無需加鎖便能實作線程安全的讀操作。
ConcurrentHashMap它不能保證讀操作的絕對一緻性。ConcurrentHashMap保證讀操作能擷取到已存在Entry的value的最新值,同時也能保證讀操作可擷取到已完成的寫操作的内容,但如果寫操作是在建立一個新的Entry,那麼在寫操作沒有完成時,讀操作是有可能擷取不到這個Entry的。
HashMap和HashTable,ConcurrentHashMap的差別
三者在資料存儲層面的機制原理基本一緻
HashMap不是線程安全的
Hashtable是線程安全的,能保證絕對的資料一緻性
ConcurrentHashMap 也是線程安全的,使用分離鎖和volatile等方法極大地提升了讀寫性能,同時也能保證在絕大部分情況下的資料一緻性。但其不能保證絕對的資料一緻性,在一個線程向Map中加入Entry的操作沒有完全完成之前,其他線程有可能讀不到新加入的Entry
HashTable不允許使用null作為key和value,如果放入null将引發NullPointerException異常,但HashMap可以使用null作為key或value(隻能有一個key為null,可以多個value為null)。
如果在周遊的同時,修改HashTable的大小,容易應發異常。可以用代替,ConcurrentHashMap是HashMap的線程安全版,提供比Hashtable更高效的并發性能