天天看點

arraylist取前五個元素_ArrayList實作原理(JDK1.8)

arraylist取前五個元素_ArrayList實作原理(JDK1.8)
arraylist取前五個元素_ArrayList實作原理(JDK1.8)

img

ArrayList 繼承于AbstractList,實作了List接口,其實AbstractList 已經實作過List接口,這裡重複實作使得接口功能更加清晰,JDK中很多類都是如此。

其中Cloneable接口是克隆标記接口,Serializable序列化标記接口,需要clone和序列化功能必須實作這兩個接口,而RandomAccess,單純是一個标志接口 ,該接口表示該類支援快速随機通路,且在循環周遊時for循環的方式會優于用疊代器。

1.成員變量

在ArrayList中,主要有五個成員變量。DEFAULT_CAPACITY表示初始容量大小,即在我們初始化ArrayList時不指定容量大小, 預設容量将會是10,Object[] elementData 則是ArrayList内部實際存儲對象的容易,也就是我們常說的ArrayList是數組實作的。

在1.8中,空數組分為了兩類情況,EMPTY_ELEMENTDATA 與 DEFAULTCAPACITY_EMPTY_ELEMENTDATA,在标記空數組的時候區分了不同的情況。

2.構造方法

ArrayList有三個構造方法,指定容量的ArrayList(int initialCapacity) ,無參構造ArrayList() 以及傳入集合的ArrayList(Collection extends E> c)。

最簡單的莫過于無參構造,直接指派為空數組DEFAULTCAPACITY_EMPTY_ELEMENTDATA。其實對于常說的預設容量10,是在第一次添加元素調用add()方法時處理的,并不是構造方法中。

對于傳入容量的構造方法,當傳入參數 > 0時,直接初始化對應容量的數組,參數類型為int,也即ArrayList的最大初始容量不能超過Integer.MAX_VALUE,事實上ArrayList的最大容量也隻能是Integer.MAX_VALUE。而初始容量傳入0,會指派為空數組EMPTY_ELEMENTDATA。如果 < 0,這個顯然的不允許了,直接IllegalArgumentException

集合構造時,沒有進行null校驗,也就是說如果傳入null,直接就會NPE異常。集合構造的邏輯也很簡單,當傳入集合不為空時,調用Arrays.copyOf進行複制,并且容量 size為傳入大小,而傳入集合為空,則指派為空數組EMPTY_ELEMENTDATA。

3.添加元素

ArrayList在添加元素時,都會進行容量确認,可能會涉及到擴容,數組複制,是以效率相對較低。同時在添加元素時,ArrayList并未對元素本身進行校驗,是以是允許集合中存在null的情況。

3.1.尾部添加元素

在add()方法中,最主要的是确定容量ensureCapacityInternal(int minCapacity)方法。

首先會調用calculateCapacity(Object[] elementData, int minCapacity) 計算容量然後再ensureExplicitCapacity(int minCapacity)

這裡僅僅判斷了是否是空數組DEFAULTCAPACITY_EMPTY_ELEMENTDATA(== 位址比較),如果前面還有印象的話,這個隻會在無參構造時,才會初始化為DEFAULTCAPACITY_EMPTY_ELEMENTDATA,這時候會取DEFAULT_CAPACITY(10)與傳入minCapacity的較大值,常說的預設容量大小10也就是在這裡誕生的。

而其他的情況,都直接但會minCapacity,也即 size + 1,如果首次添加,那就是1。

modCount是一個操作計數器,add與remove都會 + 1。當我們需要在循環中删除ArrayList元素時,需要使用疊代器Iterator的remove()方法,此時直接使用List的删除有針對modCount的校驗,會抛出 ConcurrentModificationException異常。

如果minCapacity大于數組容量,則調用grow(int minCapacity)進行擴容。

擴容時,新的容量為原容量 + 原容量的一半,也就是0.5倍增長。如果增長後的新容量比計算出來的容量minCapacity小,則指派為minCapacity,如果大于MAX_ARRAY_SIZE(Integer.MAX_VALUE - 8),則進入hugeCapacity(int minCapacity)方法。

這裡可以看到,當minCapacity < 0 時,會産生OutOfMemoryError,這是一個Error子類,這是需要避免的。什麼時候minCapacity會小于0呢,當ArrayList大小為Integer.MAX_VALUE後,還需要擴容,則會發生錯誤。

這個方法,我們可以看出,當ArrayList需要的容量首次大于MAX_ARRAY_SIZE時,會設定為MAX_ARRAY_SIZE,然後再次擴容時會變成Integer.MAX_VALUE,如果還不夠,那就會發生錯誤。

擴容的最後一步是調用Arrays.copyOf進行元素的複制,這個最終也是調用System.arraycopy進行操作的。同時size++,實際元素的數量也增加 1。

3.2.中間添加元素

在中間添加元素的邏輯和尾部添加元素基本一樣。

添加元素前,首先要進行範圍檢查,添加的範圍隻能在[0,size]之間,index == size時,其實就是尾部插入。然後确認容量新的容量,這個方法尾部添加時已經講過,接着數組複制,這步複制會跳過index位置的處理,最後再對index位置指派,即完成了index位置的添加。

可以看到最後調用了size++,add(int index, E element)方法總是會添加元素,即使該index位置存在資料,隻是會将原來的index位置資料往後擠動一位,并不會進行覆寫。

arraylist取前五個元素_ArrayList實作原理(JDK1.8)

img

3.3.批量添加

ArrayList除了add()與add(int index, E element),還有兩個批量添加的方法。

有了前面單個元素的添加基礎,批量添加就很好懂了,唯一的差別就是在數組複制時,是複制整個待添加的集合。對于index位置的批量添加,中間插入的話(numMoved > 0),第一次複制會騰出中間要添加集合長度的位置,第二次将添加的集合複制到index位置。

4.修改元素

對于ArrayList中元素的修改,如果是對象屬性的修改,可以直接修改引用對象,但對于基本類型包裝類或者String呢,并沒有辦法通過引用修改,亦或者我們要更換對象引用,這時候就需要調用set(int index, E element)。

這個方法實作很容易,ArrayList的修改本質就是對數組的值進行更改。首先進行範圍檢查,防止數組越界,這個很好了解,ArrayList内部就是數組,然後對index位置的值進行替換即可。

elementData(int index)擷取了原來的值,用于set傳回值,elementData實作更加簡單,就是數組取值。

5.移除元素

ArrayList中移除元素的方法有三個,按索引删除remove(int index)、按元素删除remove(Object o)以及批量删除removeAll(Collection> c)等。

5.1.索引删除

由于移除元素,并不涉及内部數組大小變化,是以實作相對較簡單。必須要的範圍檢查,這個已經絲毫不陌生了,然後判斷是否是尾部删除,如果不是尾部删除,則進行System.arraycopy複制,複制的目的是将index後的元素向前挪動 1 位元素以覆寫要删除的index位置,然後size減 1。

在移除方法中,可以看到modCount進行增加。同時對移除後尾部的元素指派為null了,讓GC生效。

arraylist取前五個元素_ArrayList實作原理(JDK1.8)

img

5.2.按元素删除

按元素删除的時候,首先判斷了元素是否為null,因為ArrayList中是可以添加null的,這裡不同分支的邏輯是一樣的,都是周遊集合比較是否和傳入元素相同,隻是比較一個是 == null 一個是 equals。如果相同則删除,然後return了,是以remove(Object o)方法隻會删除集合第一個與傳入對象相同的元素。

重點就是這個fastRemove了。

看到這個方法第一感覺是什麼?是不是似曾相識,沒錯,fastRemove和按指針删除基本上市一樣的,隻是少了範圍校驗和擷取删除前的元素這兩步。

5.3.批量删除

對于removeAll(Collection< ? > c),校驗非空後調用了batchRemove(Collection< ? > c, boolean complement)。

這個方法看着可能有一點點繞,但明白其原理後就很清晰了,首先周遊數組,找出在要移除數組中不包含的元素,從原數組頭部開始放,這樣的數有w個,即最終數組前w個元素都是在集合c中包含的,而剩下的位置的元素則不關心,最後就是講w到size的元素指派為null,以便GC工作。

6.循環删除

前面也提到了,ArrayList在循環删除時會報錯,這個究竟是怎麼回事呢?

如果我們想删除一個集合中全部的某一個元素,例如下面集合ss中的a元素。

當我們需要删除一個時,我們可以調用remove方法删除,根據索引或者根據元素都用,但是多個時,我們不知道每一個元素的索引,而根據值也不知道有多少個a存在,是以我們需要周遊集合。

這時候就可能存在問題了。

無論是fori的還是foreach的删除,都會抛出java.util.ConcurrentModificationException,這是因為Arraylist循環時每一次取值都會調用其内部類Itr.next()方法。

在該方法最開始的地方,有校驗modCount的checkForComodification()方法,這個方法中比較了modCount和expectedModCount,不相等就會抛出ConcurrentModificationException異常。

那expectedModCount到底是什麼,為什麼和modCount不相等呢。

expectedModCount是Itr的成員變量,這個在進行循環時會初始化指派為modCount,最開始的時候他們是相等的,經過前面的探究,我們已經知道在remove調用時modCount會自增,是以checkForComodification就會抛出異常。

而我們常使用的這個做法就是使用 Itr 的remove。

這樣删除時就沒有任何問題了,這是因為 Itr 的remove中,對expectedModCount進行了重新指派,使得每一次調用後值都相等。

7.其他方法

ArrayList中主要的就是構造方法、add和remove了,這幾個方法看懂後,其他方法實作就比較清晰了。

比如get方法,其實就是根據索引擷取了數組的元素。

例如size方法, 就是傳回了size屬性的值。

而isEmpty方法,就是判斷size是否為0.

在ArrayList中,有一個擷取子集合的subList方法,這個方法傳回的是一個内部類SubList,該類并沒重新建立新的數組,依舊持有了ArrayList數組的元素的引用,是以當修改ArrayList元素的時候,SubList的元素也會跟着修改,這個在實際開發中一定要注意。

https://www.cnblogs.com/imyanger/p/11963624.html

楊小格子

arraylist取前五個元素_ArrayList實作原理(JDK1.8)

好文章,我在看❤️