天天看點

說一下 ArrayList 和 LinkedList 的差別?

作者:彭旭銳
本文已收錄到 AndroidFamily,技術和職場問題,請關注公衆号 [彭旭銳] 提問。

前言

大家好,我是小彭。

在上一篇文章裡,我們聊到了基于動态數組 ArrayList 線性表,今天我們來讨論一個基于連結清單的線性表 —— LinkedList。

小彭的 Android 交流群 02 群已經建立啦,掃描文末二維碼進入~

思維導圖:

說一下 ArrayList 和 LinkedList 的差別?

1. LinkedList 的特點

1.1 說一下 ArrayList 和 LinkedList 的差別?

  • 1、資料結構: 在資料結構上,ArrayList 和 LinkedList 都是 “線性表”,都繼承于 Java 的 List 接口。另外 LinkedList 還實作了 Java 的 Deque 接口,是基于連結清單的棧或隊列,與之對應的是 ArrayDeque 基于數組的棧或隊列;
  • 2、線程安全: ArrayList 和 LinkedList 都不考慮線程同步,不保證線程安全;
  • 3、底層實作: 在底層實作上,ArrayList 是基于動态數組的,而 LinkedList 是基于雙向連結清單的。事實上,它們很多特性的差別都是因為底層實作不同引起的。比如說:
  1. 在周遊速度上: 數組是一塊連續記憶體空間,基于局部性原理能夠更好地命中 CPU 緩存行,而連結清單是離散的記憶體空間對緩存行不友好;
  2. 在通路速度上: 數組是一塊連續記憶體空間,支援 O(1) 時間複雜度随機通路,而連結清單需要 O(n) 時間複雜度查找元素;
  3. 在添加和删除操作上: 如果是在數組的末尾操作隻需要 O(1) 時間複雜度,但在數組中間操作需要搬運元素,是以需要 O(n)時間複雜度,而連結清單的删除操作本身隻是修改引用指向,隻需要 O(1) 時間複雜度(如果考慮查詢被删除節點的時間,複雜度分析上依然是 O(n),在工程分析上還是比數組快);
  4. 額外記憶體消耗上: ArrayList 在數組的尾部增加了閑置位置,而 LinkedList 在節點上增加了前驅和後繼指針。

1.2 LinkedList 的多面人生

在資料結構上,LinkedList 不僅實作了與 ArrayList 相同的 List 接口,還實作了 Deque 接口(繼承于 Queue 接口)。

Deque 接口表示一個雙端隊列(Double Ended Queue),允許在隊列的首尾兩端操作,是以既能實作隊列行為,也能實作棧行為。

Queue 接口:

拒絕政策抛異常傳回特殊值入隊(隊尾)add(e)offer(e)出隊(隊頭)remove()poll()觀察(隊頭)element()peek()

Queue 的 API 可以分為 2 類,差別在于方法的拒絕政策上:

  • 抛異常:向空隊列取資料,會抛出 NoSuchElementException 異常;向容量滿的隊列加資料,會抛出 IllegalStateException 異常。
  • 傳回特殊值:向空隊列取資料,會傳回 null;向容量滿的隊列加資料,會傳回 false。

Deque 接口:

Java 沒有提供标準的棧接口(很好奇為什麼不提供),而是放在 Deque 接口中:

拒絕政策抛異常等價于入棧push(e)addFirst(e)出棧pop()removeFirst()觀察(棧頂)peek()peekFirst()

除了标準的隊列和棧行為,Deque 接口還提供了 12 個在兩端操作的方法:

拒絕政策抛異常傳回值增加addFirst(e)/ addLast(e)offerFirst(e)/ offerLast(e)删除removeFirst()/ removeLast()pollFirst()/ pollLast()觀察getFirst()/ getLast()peekFirst()/ peekLast()

2. LinkedList 源碼分析

這一節,我們來分析 LinkedList 中主要流程的源碼。

2.1 LinkedList 的屬性

  • LinkedList 底層是一個 Node 雙向連結清單,Node 節點中會持有資料 E 以及 prev 與next 兩個指針;
  • LinkedList 用 first 和 last 指針指向連結清單的頭尾指針。

LinkedList 的屬性很好了解的,不出意外的話又有小朋友出來舉手提問了:

  • ‍♀️ 疑問 1:為什麼字段都不聲明 private 關鍵字?

這個問題直接回答吧。我的了解是:因為内部類在編譯後會生成獨立的 Class 檔案,如果外部類的字段是 private 類型,那麼編譯器就需要通過方法調用,而 non-private 字段就可以直接通路字段。

  • ‍♀️ 疑問 2:為什麼字段都聲明 transient 關鍵字?

這個問題我們在分析源碼的過程中回答。

疑問比 ArrayList 少很多,LinkedList 真香(還是别高興得太早吧)。

public class LinkedList<E>
    extends AbstractSequentialList<E>
    implements List<E>, Deque<E>, Cloneable, java.io.Serializable {

    // 疑問 1:為什麼字段都不聲明 private 關鍵字?
    // 疑問 2:為什麼字段都聲明 transient 關鍵字?
    // 元素個數
    transient int size = 0;

    // 頭指針
    transient Node<E> first;

    // 尾指針
    transient Node<E> last;

    // 連結清單節點
    private static class Node<E> {
        // 節點資料
        // (類型擦除後:Object item;)
        E item;
        // 前驅指針
        Node<E> next;
        // 後繼指針
        Node<E> prev;

        Node(Node<E> prev, E element, Node<E> next) {
            this.item = element;
            this.next = next;
            this.prev = prev;
        }
    }
}
           

2.2 LinkedList 的構造方法

LinkedList 有 2 個構造方法:

  • 1、無參構造方法: no-op;
  • 2、帶集合的構造: 在連結清單末尾添加整個集合,内部調用了 addAll 方法将整個集合添加到數組的末尾。
// 無參構造方法
public LinkedList() {
}

// 帶集合的構造方法
public LinkedList(Collection<? extends E> c) {
    this();
    addAll(c);
}

// 在連結清單尾部添加集合
public boolean addAll(Collection<? extends E> c) {
    // 索引為 size,等于在連結清單尾部添加
    return addAll(size, c);
}
           

2.3 LinkedList 的添加方法

LinkedList 提供了非常多的 addXXX 方法,内部都是調用一系列 linkFirst、linkLast 或 linkBefore 完成的。如果在連結清單中間添加節點時,會用到 node(index) 方法查詢指定位置的節點。

其實,我們會發現所有添加的邏輯都可以用 6 個步驟概括:

  • 步驟 1: 找到插入位置的後繼節點(在頭部插入就是 first,在尾部插入就是 null);
  • 步驟 2: 構造新節點;
  • 步驟 3: 将新節點的 prev 指針指向前驅節點(在頭部插入就是 null,在尾部插入就是 last);
  • 步驟 4: 将新節點的 next 指針指向後繼節點(在頭部插入就是 first,在尾部插入就是 null);
  • 步驟 5: 将前驅節點的 next 指針指向新節點(在頭部插入沒有這個步驟);
  • 步驟 6: 将後繼節點的 prev 指針指向新節點(在尾部插入沒有這個步驟)。

分析一下添加方法的時間複雜度,區分在連結清單兩端或中間添加元素的情況共:

  • 如果是在連結清單首尾兩端添加: 隻需要 O(1) 時間複雜度;
  • 如果在連結清單中間添加: 由于需要定位到添加位置的前驅和後繼節點,是以需要 O(n) 時間複雜度。如果事先已經獲得了添加位置的節點,就隻需要 O(1) 時間複雜度。

添加方法

public void addFirst(E e) {
    linkFirst(e);
}

public void addLast(E e) {
    linkLast(e);
}

public boolean add(E e) {
    linkLast(e);
    return true;
}

public void add(int index, E element) {
    checkPositionIndex(index);
    if (index == size)
        // 在尾部添加
        linkLast(element);
    else
        // 在指定位置添加
        linkBefore(element, node(index));
}

public boolean addAll(Collection<? extends E> c) {
    return addAll(size, c);
}

// 在連結清單頭部添加
private void linkFirst(E e) {
    // 1. 找到插入位置的後繼節點(first)
    final Node<E> f = first;
    // 2. 構造新節點
    // 3. 将新節點的 prev 指針指向前驅節點(null)
    // 4. 将新節點的 next 指針指向後繼節點(f)
    // 5. 将前驅節點的 next 指針指向新節點(前驅節點是 null,是以沒有這個步驟)
    final Node<E> newNode = new Node<>(null, e, f);
    // 修改 first 指針
    first = newNode;
    if (f == null)
        // f 為 null 說明首個添加的元素,需要修改 last 指針
        last = newNode;
    else
        // 6. 将後繼節點的 prev 指針指向新節點
        f.prev = newNode;
    size++;
    modCount++;
}

// 在連結清單尾部添加
void linkLast(E e) {
    final Node<E> l = last;
    // 1. 找到插入位置的後繼節點(null)
    // 2. 構造新節點
    // 3. 将新節點的 prev 指針指向前驅節點(l)
    // 4. 将新節點的 next 指針指向後繼節點(null)
    final Node<E> newNode = new Node<>(l, e, null);
    // 修改 last 指針
    last = newNode;
    if (l == null)
        // l 為 null 說明首個添加的元素,需要修改 first 指針
        first = newNode;
    else
        // 5. 将前驅節點的 next 指針指向新節點
        l.next = newNode;
    // 6. 将後繼節點的 prev 指針指向新節點(後繼節點是 null,是以沒有這個步驟)
    size++;
    modCount++;
}

// 在指定節點前添加
// 1. 找到插入位置的後繼節點
void linkBefore(E e, Node<E> succ) {
    final Node<E> pred = succ.prev;
    // 2. 構造新節點
    // 3. 将新節點的 prev 指針指向前驅節點(pred)
    // 4. 将新節點的 next 指針指向後繼節點(succ)
    final Node<E> newNode = new Node<>(pred, e, succ);
    succ.prev = newNode;
    if (pred == null)
        first = newNode;
    else
        // 5. 将前驅節點的 next 指針指向新節點
        pred.next = newNode;
    size++;
    modCount++;
}

// 在指定位置添加整個集合元素
// index 為 0:在連結清單頭部添加
// index 為 size:在連結清單尾部添加
public boolean addAll(int index, Collection<? extends E> c) {
    checkPositionIndex(index);
    // 事實上,c.toArray() 的實際類型不一定是 Object[],有可能是 String[] 等
    // 不過,我們是通過 Node中的item 承接的,是以不用擔心 ArrayList 中的 ArrayStoreException 問題
    Object[] a = c.toArray();
    // 添加的數組為空,跳過
    int numNew = a.length;
    if (numNew == 0)
        return false;

    // 1. 找到插入位置的後繼節點
    // pred:插入位置的前驅節點
    // succ:插入位置的後繼節點
    Node<E> pred, succ;
    if (index == size) {
        succ = null;
        pred = last;
    } else {
        // 找到 index 位置原本的節點,插入後變成後繼節點
        succ = node(index);
        pred = succ.prev;
    }
    // 插入集合元素
    for (Object o : a) {
        E e = (E) o;
        // 2. 構造新節點
        // 3. 将新節點的 prev 指針指向前驅節點
        Node<E> newNode = new Node<>(pred, e, null);
        if (pred == null)
            // pred 為 null 說明是在頭部插入,需要修改 first 指針
            first = newNode;
        else
            // 5. 将前驅節點的 next 指針指向新節點
            pred.next = newNode;
        // 修改前驅指針
        pred = newNode;
    }

    if (succ == null) {
        // succ 為 null 說明是在尾部插入,需要修改 last 指針
        last = pred;
    } else {
        // 4. 将新節點的 next 指針指向後繼節點
        pred.next = succ;
        // 6. 将後繼節點的 prev 指針指向新節點
        succ.prev = pred;
    }
    // 數量增加 numNew
    size += numNew;
    modCount++;
    return true;
}

// 将 LinkedList 轉化為 Object 數組
public Object[] toArray() {
    Object[] result = new Object[size];
    int i = 0;
    for (Node<E> x = first; x != null; x = x.next)
        result[i++] = x.item;
    return result;
}
           

在連結清單中間添加節點時,會用到 node(index) 方法查詢指定位置的節點。可以看到維持 first 和 last 頭尾節點的作用又發揮出來了:

  • 如果索引位置小于 size/2,則從頭節點開始找;
  • 如果索引位置大于 size/2,則從尾節點開始找。

雖然,我們從複雜度分析的角度看,從哪個方向查詢是沒有差別的,時間複雜度都是 O(n)。但從工程分析的角度看還是有差別的,從更靠近目标節點的位置開始查詢,實際執行的時間會更短。

查詢指定位置節點

// 尋找指定位置的節點,時間複雜度:O(n)
Node<E> node(int index) {
    if (index < (size >> 1)) {
        // 如果索引位置小于 size/2,則從頭節點開始找
        Node<E> x = first;
        for (int i = 0; i < index; i++)
            x = x.next;
        return x;
    } else {
        // 如果索引位置大于 size/2,則從尾節點開始找
        Node<E> x = last;
        for (int i = size - 1; i > index; i--)
            x = x.prev;
        return x;
    }
}
           

LinkedList 的删除方法其實就是添加方法的逆運算,我們就不重複分析了。

// 删除頭部元素
public E removeFirst() {
    final Node<E> f = first;
    if (f == null)
        throw new NoSuchElementException();
    return unlinkFirst(f);
}

// 删除尾部元素
public E removeLast() {
    final Node<E> l = last;
    if (l == null)
        throw new NoSuchElementException();
    return unlinkLast(l);
}

// 删除指定元素
public E remove(int index) {
    checkElementIndex(index);
    return unlink(node(index));
}
           

2.4 LinkedList 的疊代器

Java 的 foreach 是文法糖,本質上也是采用 iterator 的方式。由于 LinkedList 本身就是雙向的,是以 LinkedList 隻提供了 1 個疊代器:

  • ListIterator listIterator(): 雙向疊代器

與其他容器類一樣,LinkedList 的疊代器中都有 fail-fast 機制。如果在疊代的過程中發現 expectedModCount 變化,說明資料被修改,此時就會提前抛出 ConcurrentModificationException 異常(當然也不一定是被其他線程修改)。

public ListIterator<E> listIterator(int index) {
    checkPositionIndex(index);
    return new ListItr(index);
}

// 非靜态内部類
private class ListItr implements ListIterator<E> {
    private Node<E> lastReturned;
    private Node<E> next;
    private int nextIndex;
    // 建立疊代器時會記錄外部類的 modCount
    private int expectedModCount = modCount;

    ListItr(int index) {
        next = (index == size) ? null : node(index);
        nextIndex = index;
    }

    public E next() {
        // 更新 expectedModCount
        checkForComodification();
        ...
    }
    ...
}
           

2.5 LinkedList 的序列化過程

  • ‍♀️ 疑問 2:為什麼字段都聲明 transient 關鍵字?

LinkedList 重寫了 JDK 序列化的邏輯,不序列化連結清單節點,而隻是序列化連結清單節點中的有效資料,這樣序列化産物的大小就有所降低。在反序列時,隻需要按照對象順序依次添加到連結清單的末尾,就能恢複連結清單的順序。

// 序列化和反序列化隻考慮有效資料

// 序列化過程
private void writeObject(java.io.ObjectOutputStream s)
    throws java.io.IOException {
    // Write out any hidden serialization magic
    s.defaultWriteObject();

    // 寫傳入連結表長度
    s.writeInt(size);

    // 寫入節點上的有效資料
    for (Node<E> x = first; x != null; x = x.next)
        s.writeObject(x.item);
}

// 反序列化過程
private void readObject(java.io.ObjectInputStream s)
    throws java.io.IOException, ClassNotFoundException {
    // Read in any hidden serialization magic
    s.defaultReadObject();

    // 讀取連結清單長度
    int size = s.readInt();
  
    // 讀取有效元素并用 linkLast 添加到連結清單尾部
    for (int i = 0; i < size; i++)
        linkLast((E)s.readObject());
}
           

2.6 LinkedList 的 clone() 過程

LinkedList 中的 first 和 last 指針是引用類型,是以在 clone() 中需要實作深拷貝。否則,克隆後兩個 LinkedList 對象會互相影響:

private LinkedList<E> superClone() {
    try {
        return (LinkedList<E>) super.clone();
    } catch (CloneNotSupportedException e) {
        throw new InternalError(e);
    }
}

public Object clone() {
    LinkedList<E> clone = superClone();

    // Put clone into "virgin" state
    clone.first = clone.last = null;
    clone.size = 0;
    clone.modCount = 0;

    // 将原連結清單中的資料依次添加到新立案表中
    for (Node<E> x = first; x != null; x = x.next)
        clone.add(x.item);

    return clone;
}
           

2.7 LinkedList 如何實作線程安全?

有 5 種方式:

  • 方法 1 - 使用 Collections.synchronizedList 包裝類: 原理也是在所有方法上增加 synchronized 關鍵字;
  • 方法 2 - 使用 ConcurrentLinkedQueue 容器類: 基于 CAS 無鎖實作的線程安全隊列;
  • 方法 3 - 使用 LinkedBlockingQueue 容器: 基于加鎖的阻塞隊列,适合于帶阻塞操作的生産者消費者模型;
  • 方法 4 - 使用 LinkedBlockingDeque 容器: 基于加鎖的阻塞雙端隊列,适合于帶阻塞操作的生産者消費者模型;
  • 方法 5 - 使用 ConcurrentLinkedDeque 容器類: 基于 CAS 無鎖實作的線程安全雙端隊列。

3. 總結

  • 1、LinkedList 是基于連結清單的線性表,同時具備 List、Queue 和 Stack 的行為;
  • 2、在查詢指定位置的節點時,如果索引位置小于 size/2,則從頭節點開始找,否則從尾節點開始找;
  • 3、LinkedList 重寫了序列化過程,隻處理連結清單節點中有效的元素;
  • 4、LinkedList 和 ArrayList 都不考慮線程同步,不保證線程安全。

在上一篇文章裡,我們提到了 List 的數組實作 ArrayList,而 LinkedList 不僅是 List 的連結清單實作,同時還是 Queue 和 Stack 的連結清單實作。那麼,在 Java 中的 Queue 和 Stack 的數組實作是什麼呢,這個我們在下篇文章讨論,請關注。

小彭的 Android 交流群 02 群