Java中的HashSet和TreeSet和LinkedHashSet差別
Set接口與三種實作之間的關系
Set是一個不包含重複元素的 collection。無序且唯一。
- HashSet
- LinkedHashSet
- TreeSet
HashSet是使用哈希表(hash table)實作的,其中的元素是無序的。HashSet的add、remove、contains方法 的時間複雜度為常量O(1)。
TreeSet使用樹形結構(算法書中的紅黑樹red-black tree)實作的。TreeSet中的元素是可排序的,但add、remove和contains方法的時間複雜度為O(log(n))。TreeSet還提供了first()、last()、headSet()、tailSet()等方法來操作排序後的集合。
LinkedHashSet介于HashSet和TreeSet之間。它基于一個由連結清單實作的哈希表,保留了元素插入順序。LinkedHashSet中基本方法的時間複雜度為O(1)。
~ HashSet
此類實作 Set 接口,由哈希表(實際上是一個 HashMap 執行個體)支援。它不保證 set 的疊代順序;特别是它不保證該順序恒久不變。此類允許使用 null 元素。
注意,此實作不是同步的。如果多個線程同時通路一個哈希 set,而其中至少一個線程修改了該 set,那麼它必須 保持外部同步。
HashSet底層資料結構是哈希表(HashMap),哈希表依賴于哈希值存儲,添加功能底層依賴兩個方法:int hashCode(),boolean equals(Object obj)。
*構造方法
*常用方法
HashSet唯一性的解釋,源碼剖析:添加功能底層依賴兩個方法:int hashCode(),boolean equals(Object obj)
//HashSet類
class HashSet implements Set{
private static final Object PRESENT = new Object();
private transient HashMap<E,Object> map;
// 構造方法,傳回了一個HashMap
public HashSet() {
map = new HashMap<>();
}
//add方法
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
}
//HashMap類
class HashMap implements Map{
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
}
一個執行個體問題,在這種添加自定義對象的時候,兩個類的屬性值相等,但是依然會被判定為不同的元素,因為沒有重寫hashCode(),是以預設調用的是Object類的hashCode(),而不同類的hashCode一般是不同的。
HashSet<Student> hashSet = new HashSet<>();
Student s1 = new Student("劉亦菲", 22);
Student s2 = new Student("章子怡", 25);
Student s3 = new Student("劉亦菲", 22);
hashSet.add(s1);
hashSet.add(s2);
hashSet.add(s3);
System.out.println(hashSet);
解決方法就是自己重寫hashCode() 和 equals()方法,使用idea的alt+insert可以自動生成。
public class Student {
private String name;
private Integer age;
Student(String name,int age)
{
this.name=name;
this.age=age;
}
@Override
public int hashCode() {
// return 0;<br> return this.name.hashCode()+this.age*11;
}
@Override
public boolean equals(Object obj) {
if(this == obj)
return true;
if(!(obj instanceof Student))
return false;
Student s = (Student) obj;
return this.name.equals(s.name) && this.age.equals(s.age);
}
}
這裡用到了instanceof操作符,這個操作符和== ,>=是同種性質的,隻是是用英文描述的,是二進制操作符,用來判斷左邊的是否為這個特定類或者是它的子類的一個執行個體。
~ LinkedHashSet
具有可預知疊代順序的 Set 接口的哈希表和連結清單實作。此實作與 HashSet 的不同之外在于,後者維護着一個運作于所有條目的雙重連結清單。此連結清單定義了疊代順序,即按照将元素插入到 set 中的順序(插入順序)進行疊代。注意,插入順序不 受在 set 中重新插入的 元素的影響。
哈希表保證元素的唯一性,連結清單保證元素有序,也就是存入順序和取出順序相同。
~ TreeSet
基于
TreeMap
的
NavigableSet
實作。使用元素的自然順序對元素進行排序,或者根據建立 set 時提供的
Comparator
進行排序,具體取決于使用的構造方法。
注意,此實作不是同步的。如果多個線程同時通路一個 TreeSet,而其中至少一個線程修改了該 set,那麼它必須 外部同步。
有兩種排序方式:A-自然排序,也是預設排序(實作Comparable),B-比較器排序。取決于構造方法。
*構造方法
*常用方法
// 會自動排序
TreeSet<Integer> treeSet = new TreeSet<>();
treeSet.add(12);
treeSet.add(13);
treeSet.add(2);
treeSet.add(4);
for(int i:treeSet) System.out.println(i);
TreeSet的唯一性解釋,源碼剖析:唯一性根據比較的傳回值是否為0,如果為零,則相等;排序的方式有兩種,自然排序和比較器排序。
//TreeSet類
class TreeSet implements Set{
private static final Object PRESENT = new Object();
private transient NavigableMap<E,Object> m;
TreeSet(NavigableMap<E,Object> m) {
this.m = m;
}
public TreeSet() {
this(new TreeMap<>());
}
public boolean add(E e) {
return m.put(e, PRESENT)==null;
}
}
//TreeMap類
class TreeMap implements Map{
<br>//紅黑樹實作
public V put(K key, V value) {
Entry<K,V> t = root;<br> //建立根節點
if (t == null) {
compare(key, key); // type (and possibly null) check
root = new Entry<>(key, value, null);
size = 1;
modCount++;
return null;
}
int cmp;
Entry<K,V> parent;
// split comparator and comparable paths
Comparator<? super K> cpr = comparator;
if (cpr != null) {
do {
parent = t;
cmp = cpr.compare(key, t.key);
if (cmp < 0)
t = t.left;
else if (cmp > 0)
t = t.right;
else
return t.setValue(value);
} while (t != null);
}
else {
if (key == null)
throw new NullPointerException();
@SuppressWarnings("unchecked")
Comparable<? super K> k = (Comparable<? super K>) key;
do {
parent = t;
cmp = k.compareTo(t.key);
if (cmp < 0)
t = t.left;
else if (cmp > 0)
t = t.right;
else
return t.setValue(value);
} while (t != null);
}
Entry<K,V> e = new Entry<>(key, value, parent);
if (cmp < 0)
parent.left = e;
else
parent.right = e;
fixAfterInsertion(e);
size++;
modCount++;
return null;
}
}
對象中的執行個體,自然排序:具體類實作Comparable接口,重寫Comparable方法。構造方法為預設構造
public class Student implements Comparable<Student>{
private String name;
private Integer age;
Student(String name,int age)
{
this.name=name;
this.age=age;
}
// @Override
// public int hashCode() {
// return 0;
// }
//
// @Override
// public boolean equals(Object obj) {
// if(this == obj)
// return true;
//
// if(!(obj instanceof Student))
// return false;
//
// Student s = (Student) obj;
// return this.name.equals(s.name) && this.age.equals(s.age);
// }
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
Student student = (Student) o;
if (name != null ? !name.equals(student.name) : student.name != null) return false;
return age != null ? age.equals(student.age) : student.age == null;
}
@Override
public int hashCode() {
int result = name != null ? name.hashCode() : 0;
result = 31 * result + (age != null ? age.hashCode() : 0);
return result;
}
@Override
// 從小到大
public int compareTo(Student o) {
int num = this.age-o.age;
return num==0?this.name.compareTo(o.name):num;
}
}
對象中的執行個體,比較器排序:自定義比較器,實作Comparator接口。構造方法為帶比較器的構造
class MyComparator implements Comparator<Student>{
@Override
public int compare(Student o1, Student o2) {
int num = o1.age-o2.age;
return num==0?o1.name.compareTo(o2.name):num;
}
}
總結:
HashSet
HashSet有以下特點
不能保證元素的排列順序,順序有可能發生變化
不是同步的
集合元素可以是null,但隻能放入一個null
當向HashSet結合中存入一個元素時,HashSet會調用該對象的hashCode()方法來得到該對象的hashCode值,然後根據 hashCode值來決定該對象在HashSet中存儲位置。
簡單的說,HashSet集合判斷兩個元素相等的标準是兩個對象通過equals方法比較相等,并且兩個對象的hashCode()方法傳回值相等
注意,如果要把一個對象放入HashSet中,重寫該對象對應類的equals方法,也應該重寫其hashCode()方法。其規則是如果兩個對象通過equals方法比較傳回true時,其 hashCode也應該相同。另外,對象中用作equals比較标準的屬性,都應該用來計算 hashCode的值。
TreeSet
TreeSet類型是J2SE中唯一可實作自動排序的類型
TreeSet是SortedSet接口的唯一實作類,TreeSet可以確定集合元素處于排序狀态。TreeSet支援兩種排序方式,自然排序 和定制排序,其中自然排序為預設的排序方式。向 TreeSet中加入的應該是同一個類的對象。
TreeSet判斷兩個對象不相等的方式是兩個對象通過equals方法傳回false,或者通過CompareTo方法比較沒有傳回0
自然排序
自然排序使用要排序元素的CompareTo(Object obj)方法來比較元素之間大小關系,然後将元素按照升序排列。
Java提供了一個Comparable接口,該接口裡定義了一個compareTo(Object obj)方法,該方法傳回一個整數值,實作了該接口的對象就可以比較大小。
obj1.compareTo(obj2)方法如果傳回0,則說明被比較的兩個對象相等,如果傳回一個正數,則表明obj1大于obj2,如果是 負數,則表明obj1小于obj2。
如果我們将兩個對象的equals方法總是傳回true,則這兩個對象的compareTo方法傳回應該傳回0
定制排序
自然排序是根據集合元素的大小,以升序排列,如果要定制排序,應該使用Comparator接口,實作 int compare(To1,To2)方法
LinkedHashSet
LinkedHashSet集合同樣是根據元素的hashCode值來決定元素的存儲位置,但是它同時使用連結清單維護元素的次序。這樣使得元素看起 來像是以插入順 序儲存的,也就是說,當周遊該集合時候,LinkedHashSet将會以元素的添加順序通路集合的元素。
LinkedHashSet在疊代通路Set中的全部元素時,性能比HashSet好,但是插入時性能稍微遜色于HashSet。
參考資料:
https://www.cnblogs.com/TIMHY/p/7763219.html
http://www.cnblogs.com/wl0000-03/p/6019627.html