本篇文章已授權微信公衆号 guolin_blog (郭霖)獨家釋出
這次就來梳理一下 Android 的螢幕重新整理機制,把我這段時間因為研究動畫而梳理出來的一些關于螢幕重新整理方面的知識點分享出來,能力有限,有錯的地方還望指點一下。另外,内容有點多,畢竟要講清楚不容易,是以慢慢看哈。
提問環節
閱讀源碼還是得帶着問題或目的性的去閱讀,這樣閱讀過程中比較有條理性,不會跟偏或太深入,是以,還是先來幾個問題吧:
大夥都清楚,Android 每隔 16.6ms 會重新整理一次螢幕。
Q1:但是大夥想過沒有,這個 16.6ms 重新整理一次螢幕到底是什麼意思呢?是指每隔 16.6ms 調用 onDraw() 繪制一次麼?
Q2:如果界面一直保持沒變的話,那麼還會每隔 16.6ms 重新整理一次螢幕麼?
Q3:界面的顯示其實就是一個 Activity 的 View 樹裡所有的 View 都進行測量、布局、繪制操作之後的結果呈現,那麼如果這部分工作都完成後,螢幕會馬上就重新整理麼?
Q4:網上都說避免丢幀的方法之一是保證每次繪制界面的操作要在 16.6ms 内完成,但如果這個 16.6ms 是一個固定的頻率的話,請求繪制的操作在代碼裡被調用的時機是不确定的啊,那麼如果某次使用者點選螢幕導緻的界面重新整理操作是在某一個 16.6ms 幀快結束的時候,那麼即使這次繪制操作小于 16.6 ms,按道理不也會造成丢幀麼?這又該如何了解?
Q5:大夥都清楚,主線程耗時的操作會導緻丢幀,但是耗時的操作為什麼會導緻丢幀?它是如何導緻丢幀發生的?
本篇主要就是搞清楚這幾個問題,分析的源碼基本隻涉及 ViewRootImpl 和 Choreographer 這兩個類。
源碼分析
ps:本篇分析的源碼均是 android-25 版本,版本不一樣,源碼可能會有些許差異,大夥過的時候注意一下。
基本概念
首先,先來過一下一些基本概念,摘抄自網上文章android螢幕重新整理顯示機制:
在一個典型的顯示系統中,一般包括CPU、GPU、display三個部分, CPU負責計算資料,把計算好資料交給GPU,GPU會對圖形資料進行渲染,渲染好後放到buffer裡存起來,然後display(有的文章也叫螢幕或者顯示器)負責把buffer裡的資料呈現到螢幕上。
顯示過程,簡單的說就是CPU/GPU準備好資料,存入buffer,display每隔一段時間去buffer裡取資料,然後顯示出來。display讀取的頻率是固定的,比如每個16ms讀一次,但是CPU/GPU寫資料是完全無規律的。
上述内容概括一下,大體意思就是說,螢幕的重新整理包括三個步驟:CPU 計算螢幕資料、GPU 進一步處理和緩存、最後 display 再将緩存中(buffer)的螢幕資料顯示出來。
(ps:開發過程中應該接觸不到 GPU、display 這些層面的東西,是以我把這部分工作都稱作底層的工作了,下文出現的底層指的就是除了 CPU 計算螢幕資料之外的工作。)
對于 Android 而言,第一個步驟:CPU 計算螢幕資料指的也就是 View 樹的繪制過程,也就是 Activity 對應的視圖樹從根布局 DecorView 開始層層周遊每個 View,分别執行測量、布局、繪制三個操作的過程。
也就是說,我們常說的 Android 每隔 16.6ms 重新整理一次螢幕其實是指:底層以固定的頻率,比如每 16.6ms 将 buffer 裡的螢幕資料顯示出來。
如果還不清楚,那再看一張網上很常見的圖(摘自上面同一篇文章):
結合這張圖,再來講講 16.6 ms 螢幕重新整理一次的意思。
Display 這一行可以了解成螢幕,是以可以看到,底層是以固定的頻率發出 VSync 信号的,而這個固定頻率就是我們常說的每 16.6ms 發送一個 VSync 信号,至于什麼叫 VSync 信号,我們可以不用深入去了解,隻要清楚這個信号就是螢幕重新整理的信号就可以了。
繼續看圖,Display 黃色的這一行裡有一些數字:
0, 1, 2, 3, 4
,可以看到每次螢幕重新整理信号到了的時候,數字就會變化,是以這些數字其實可以了解成每一幀螢幕顯示的畫面。也就是說,螢幕每一幀的畫面可以持續 16.6ms,當過了 16.6ms,底層就會發出一個螢幕重新整理信号,而螢幕就會去顯示下一幀的畫面。
以上都是一些基本概念,也都是底層的工作,我們了解一下就可以了。接下去就還是看這圖,然後講講我們 app 層該幹的事了:
繼續看圖,CPU 藍色的這行,上面也說過了,CPU 這塊的耗時其實就是我們 app 繪制目前 View 樹的時間,而這段時間就跟我們自己寫的代碼有關系了,如果你的布局很複雜,層次嵌套很多,每一幀内需要重新整理的 View 又很多時,那麼每一幀的繪制耗時自然就會多一點。
繼續看圖,CPU 藍色這行裡也有一些數字,其實這些數字跟 Display 黃色的那一行裡的數字是對應的,在 Display 裡我們解釋過這些數字表示的是每一幀的畫面,那麼在 CPU 這一行裡,其實就是在計算對應幀的畫面資料,也叫螢幕資料。也就是說,在目前幀内,CPU 是在計算下一幀的螢幕畫面資料,當螢幕重新整理信号到的時候,螢幕就去将 CPU 計算的螢幕畫面資料顯示出來;同時 CPU 也接收到螢幕重新整理信号,是以也開始去計算下一幀的螢幕畫面資料。
CPU 跟 Display 是不同的硬體,它們是可以并行工作的。要了解的一點是,我們寫的代碼,隻是控制讓 CPU 在接收到螢幕重新整理信号的時候開始去計算下一幀的畫面工作。而底層在每一次螢幕重新整理信号來的時候都會去切換這一幀的畫面,這點我們是控制不了的,是底層的工作機制。之是以要講這點,是因為,當我們的 app 界面沒有必要再重新整理時(比如使用者不操作了,目前界面也沒動畫),這個時候,我們 app 是接收不到螢幕重新整理信号的,是以也就不會讓 CPU 去計算下一幀畫面資料,但是底層仍然會以固定的頻率來切換每一幀的畫面,隻是它後面切換的每一幀畫面都一樣,是以給我們的感覺就是螢幕沒重新整理。
是以,我覺得上面那張圖還可以再繼續延深幾幀的長度,這樣就更容易了解了:
我在那張圖的基礎上延長了幾幀,我想這樣應該可以更容易了解點。
看我畫的這張圖,前三幀跟原圖一樣,從第三幀之後,因為我們的 app 界面不需要重新整理了(使用者不操作了,界面也沒有動畫),那麼這之後我們 app 就不會再接收到螢幕重新整理信号了,是以也就不會再讓 CPU 去繪制視圖樹來計算下一幀畫面了。但是,底層還是會每隔 16.6ms 發出一個螢幕重新整理信号,隻是我們 app 不會接收到而已,Display 還是會在每一個螢幕重新整理信号到的時候去顯示下一幀畫面,隻是下一幀畫面一直是第4幀的内容而已。
好了,到這裡 Q1,Q2,Q3 都可以先回答一半了,那麼我們就先稍微來梳理一下:
- 我們常說的 Android 每隔 16.6 ms 重新整理一次螢幕其實是指底層會以這個固定頻率來切換每一幀的畫面。
- 這個每一幀的畫面也就是我們的 app 繪制視圖樹(View 樹)計算而來的,這個工作是交由 CPU 處理,耗時的長短取決于我們寫的代碼:布局複不複雜,層次深不深,同一幀内重新整理的 View 的數量多不多。
- CPU 繪制視圖樹來計算下一幀畫面資料的工作是在螢幕重新整理信号來的時候才開始工作的,而當這個工作處理完畢後,也就是下一幀的畫面資料已經全部計算完畢,也不會馬上顯示到螢幕上,而是會等下一個螢幕重新整理信号來的時候再交由底層将計算完畢的螢幕畫面資料顯示出來。
- 當我們的 app 界面不需要重新整理時(使用者無操作,界面無動畫),app 就接收不到螢幕重新整理信号是以也就不會讓 CPU 再去繪制視圖樹計算畫面資料工作,但是底層仍然會每隔 16.6 ms 切換下一幀的畫面,隻是這個下一幀畫面一直是相同的内容。
這部分雖然說是一些基本概念,但其實也包含了一些結論了,是以可能大夥看着會有些困惑:為什麼界面不重新整理時 app 就接收不到螢幕重新整理信号了?為什麼繪制視圖樹計算下一幀畫面的工作會是在螢幕重新整理信号來的時候才開始的?等等。
emmm,有這些困惑很棒,這樣,我們下面一起過源碼時,大夥就更有目的性了,這樣過源碼我覺得效率是比較高一點的。繼續看下去,跟着過完源碼,你就清楚為什麼了。好了,那我們下面就開始過源碼了。
ViewRootImpl 與 DecorView 的綁定
閱讀源碼從哪開始看起一直都是個頭疼的問題,是以找一個合适的切入點來跟的話,整個梳理的過程可能會順暢一點。本篇是研究螢幕的重新整理,那麼建議就是從某個會導緻螢幕重新整理的方法入手,比如
View#invalidate()
。
View#invalidate()
是請求重繪的一個操作,是以我們切入點可以從這個方法開始一步步跟下去。我們在上一篇部落格View 動畫 Animation 運作原了解析已經分析過
View#invalidate()
這個方法了。
想再過一遍的可以再去看看,我們這裡就直接說結論了。我們跟着
invalidate()
一步步往下走的時候,發現最後跟到了
ViewRootImpl#scheduleTraversals()
就停止了。而 ViewRootImpl 就是今天我們要介紹的重點對象了。
大夥都清楚,Android 裝置呈現到界面上的大多數情況下都是一個 Activity,真正承載視圖的是一個 Window,每個 Window 都有一個 DecorView,我們調用
setContentView()
其實是将我們自己寫的布局檔案添加到以 DecorView 為根布局的一個 ViewGroup 裡,構成一顆 View 樹。
這些大夥都清楚,每個 Activity 對應一顆以 DecorView 為根布局的 View 樹,但其實 DecorView 還有 mParent,而且就是 ViewRootImpl,而且每個界面上的 View 的重新整理,繪制,點選事件的分發其實都是由 ViewRootImpl 作為發起者的,由 ViewRootImpl 控制這些操作從 DecorView 開始周遊 View 樹去分發處理。
在上一篇動畫分析的部落格裡,分析
View#invalidate()
時,也可以看到内部其實是有一個 do{}while() 循環來不斷尋找 mParent,是以最終才會走到 ViewRootImpl 裡去,那麼可能大夥就會疑問了,為什麼 DecorView 的 mParent 會是 ViewRootImpl 呢?換個問法也就是,在什麼時候将 DevorView 和 ViewRootImpl 綁定起來?
Activity 的啟動是在 ActivityThread 裡完成的,
handleLaunchActivity()
會依次間接的執行到 Activity 的
onCreate()
,
onStart()
onResume()
。在執行完這些後 ActivityThread 會調用
WindowManager#addView()
,而這個
addView()
最終其實是調用了 WindowManagerGlobal 的
addView()
方法,我們就從這裡開始看:
WindowManager 維護着所有 Activity 的 DecorView 和 ViewRootImpl。這裡初始化了一個 ViewRootImpl,然後調用了它的
setView()
方法,将 DevorView 作為參數傳遞了進去。是以看看 ViewRootImpl 中的
setView()
做了什麼:
在
setView()
方法裡調用了 DecorView 的
assignParent()
方法,是以去看看 View 的這個方法:
參數是 ViewParent,而 ViewRootImpl 是實作了 ViewParent 接口的,是以在這裡就将 DecorView 和 ViewRootImpl 綁定起來了。每個Activity 的根布局都是 DecorView,而 DecorView 的 parent 又是 ViewRootImpl,是以在子 View 裡執行
invalidate()
之類的操作,循環找 parent 時,最後都會走到 ViewRootImpl 裡來。
跟界面重新整理相關的方法裡應該都會有一個循環找 parent 的方法,或者是不斷調用 parent 的方法,這樣最終才都會走到 ViewRootImpl 裡,也就是說實際上 View 的重新整理都是由 ViewRootImpl 來控制的。
即使是界面上一個小小的 View 發起了重繪請求時,都要層層走到 ViewRootImpl,由它來發起重繪請求,然後再由它來開始周遊 View 樹,一直周遊到這個需要重繪的 View 再調用它的
onDraw()
方法進行繪制。
我們重新看回 ViewRootImpl 的
setView()
這個方法,這個方法裡還調用了一個
requestLayout()
方法:
這裡調用了一個
scheduleTraversals()
,還記得當 View 發起重繪操作
invalidate()
時,最後也調用了
scheduleTraversals()
這個方法麼。其實這個方法就是螢幕重新整理的關鍵,它是安排一次繪制 View 樹的任務等待執行,具體後面再說。
也就是說,其實打開一個 Activity,當它的 onCreate---onResume 生命周期都走完後,才将它的 DecoView 與建立的一個 ViewRootImpl 對象綁定起來,同時開始安排一次周遊 View 任務也就是繪制 View 樹的操作等待執行,然後将 DecoView 的 parent 設定成 ViewRootImpl 對象。
這也就是為什麼在
onCreate---onResume
裡擷取不到 View 寬高的原因,因為在這個時刻 ViewRootImpl 甚至都還沒建立,更不用說是否已經執行過測量操作了。
還可以得到一點資訊是,一個 Activity 界面的繪制,其實是在
onResume()
之後才開始的。
ViewRootImpl#scheduleTraversals
到這裡,我們梳理清楚了,調用一個 View 的
invalidate()
請求重繪操作,内部原來是要層層通知到 ViewRootImpl 的
scheduleTraversals()
裡去。而且打開一個新的 Activity,它的界面繪制原來是在
onResume()
之後也層層通知到 ViewRootImpl 的
scheduleTraversals()
裡去。雖然其他關于 View 的重新整理操作,比如
requestLayout()
等等之類的方法我們還沒有去看,但我們已經可以大膽猜測,這些跟 View 重新整理有關的操作最終也都會層層走到 ViewRootImpl 中的
scheduleTraversals()
方法裡去的。
那麼這個方法究竟幹了些什麼,我們就要好好來分析了:
mTraversalScheduled 這個 boolean 變量的作用等會再來看,先看看
mChoreographer.postCallback()
這個方法,傳入了三個參數,第二個參數是一個 Runnable 對象,先來看看這個 Runnable:
這個 Runnable 做的事很簡單,就調用了一個方法,
doTraversal()
:
看看這個方法做的事,跟
scheduleTraversals()
正好相反,一個将變量置成 true,這裡置成 false,一個是
postSyncBarrier()
,這裡是
removeSyncBarrier()
,具體作用等會再說,繼續先看看
performTraversals()
,這個方法也是螢幕重新整理的關鍵:
View 的測量、布局、繪制三大流程都是交由 ViewRootImpl 發起,而且還都是在
performTraversals()
方法中發起的,是以這個方法的邏輯很複雜,因為每次都需要根據相應狀态判斷是否需要三個流程都走,有時可能隻需要執行
performDraw()
繪制流程,有時可能隻執行
performMeasure()
測量和
performLayout()
布局流程(一般測量和布局流程是一起執行的)。不管哪個流程都會周遊一次 View 樹,是以其實界面的繪制是需要周遊很多次的,如果頁面層次太過複雜,每一幀需要重新整理的 View 又很多時,耗時就會長一點。
當然,測量、布局、繪制這些流程在周遊時并不一定會把整顆 View 樹都周遊一遍,ViewGroup 在傳遞這些流程時,還會再根據相應狀态判斷是否需要繼續往下傳遞。
了解了
performTraversals()
是重新整理界面的源頭後,接下去就需要了解下它是什麼時候執行的,和
scheduleTraversals()
又是什麼關系?
performTraversals()
是在
doTraversal()
中被調用的,而
doTraversal()
又被封裝到一個 Runnable 裡,那麼關鍵就是這個 Runnable 什麼時候被執行了?
Choreographer
scheduleTraversals()
裡調用了 Choreographer 的
postCallback()
将 Runnable 作為參數傳了進去,是以跟進去看看:
因為
postCallback()
調用
postCallbackDelayed()
時傳了 delay = 0 進去,是以在
postCallbackDelayedInternal()
裡面會先根據目前時間戳将這個 Runnable 儲存到一個 mCallbackQueue 隊列裡,這個隊列跟 MessageQueue 很相似,裡面待執行的任務都是根據一個時間戳來排序。然後走了
scheduleFrameLocked()
方法這邊,看看做了些什麼:
如果代碼走了 else 這邊來發送一個消息,那麼這個消息做的事肯定很重要,因為對這個 Message 設定了異步的标志而且用了
sendMessageAtFrontOfQueue()
方法,這個方法是将這個 Message 直接放到 MessageQueue 隊列裡的頭部,可以了解成設定了這個 Message 為最高優先級,那麼先看看這個 Message 做了些什麼:
是以這個 Message 最後做的事就是
scheduleVsyncLocked()
。我們回到
scheduleFrameLocked()
這個方法裡,當走 if 裡的代碼時,直接調用了
scheduleVsyncLocked()
,當走 else 裡的代碼時,發了一個最高優先級的 Message,這個 Message 也是執行
scheduleVsyncLocked()
。既然兩邊最後調用的都是同一個方法,那麼為什麼這麼做呢?
關鍵在于 if 條件裡那個方法,我的了解那個方法是用來判斷目前是否是在主線程的,我們知道主線程也是一直在執行着一個個的 Message,那麼如果在主線程的話,直接調用這個方法,那麼這個方法就可以直接被執行了,如果不是在主線程,那麼 post 一個最高優先級的 Message 到主線程去,保證這個方法可以第一時間得到處理。
那麼這個方法是幹嘛的呢,為什麼需要在最短時間内被執行呢,而且隻能在主線程?
調用了 native 層的一個方法,那跟到這裡就跟不下去了。
那到這裡,我們先來梳理一下:
到這裡為止,我們知道一個 View 發起重新整理的操作時,會層層通知到 ViewRootImpl 的 scheduleTraversals() 裡去,然後這個方法會将周遊繪制 View 樹的操作 performTraversals() 封裝到 Runnable 裡,傳給 Chorerographer,以目前的時間戳放進一個 mCallbackQueue 隊列裡,然後調用了 native 層的一個方法就跟不下去了。是以這個 Runnable 什麼時候會被執行還不清楚。那麼,下去的重點就是搞清楚它什麼時候從隊列裡被拿出來執行了?
接下去隻能換種方式繼續跟了,既然這個 Runnable 操作被放在一個 mCallbackQueue 隊列裡,那就從這個隊列着手,看看這個隊列的取操作在哪被執行了:
還記得我們說過在 ViewRootImpl 的
scheduleTraversals()
裡會将周遊 View 樹繪制的操作封裝到 Runnable 裡,然後調用 Choreographer 的
postCallback()
将這個 Runnable 放進隊列裡麼,而當時調用
postCallback()
時傳入了多個參數,這是因為 Choreographer 裡有多個隊列,而第一個參數 Choreographer.CALLBACK_TRAVERSAL 這個參數是用來區分隊列的,可以了解成各個隊列的 key 值。
那麼這樣一來,就找到關鍵的方法了:
doFrame()
,這個方法裡會根據一個時間戳去隊列裡取任務出來執行,而這個任務就是 ViewRootImpl 封裝起來的
doTraversal()
操作,而
doTraversal()
會去調用
performTraversals()
開始根據需要測量、布局、繪制整顆 View 樹。是以剩下的問題就是
doFrame()
這個方法在哪裡被調用了。
有幾個調用的地方,但有個地方很關鍵:
關鍵的地方來了,這個繼承自 DisplayEventReceiver 的 FrameDisplayEventReceiver 類的作用很重要。跟進去看注釋,我隻能了解它是用來接收底層信号用的。但看了網上的解釋後,所有的都了解過來了:
FrameDisplayEventReceiver繼承自DisplayEventReceiver接收底層的VSync信号開始處理UI過程。VSync信号由SurfaceFlinger實作并定時發送。FrameDisplayEventReceiver收到信号後,調用onVsync方法組織消息發送到主線程處理。這個消息主要内容就是run方法裡面的doFrame了,這裡mTimestampNanos是信号到來的時間參數。
也就是說,
onVsync()
是底層會回調的,可以了解成每隔 16.6ms 一個幀信号來的時候,底層就會回調這個方法,當然前提是我們得先注冊,這樣底層才能找到我們 app 并回調。當這個方法被回調時,内部發起了一個 Message,注意看代碼對這個 Message 設定了 callback 為 this,Handler 在處理消息時會先檢視 Message 是否有 callback,有則優先交由 Message 的 callback 處理消息,沒有的話再去看看Handler 有沒有 callback,如果也沒有才會交由
handleMessage()
這個方法執行。
這裡這麼做的原因,我猜測可能
onVsync()
是由底層回調的,那麼它就不是運作在我們 app 的主線程上,畢竟上層 app 對底層是隐藏的。但這個
doFrame()
是個 ui 操作,它需要在主線程中執行,是以才通過 Handler 切到主線程中。
還記得我們前面分析
scheduleTraversals()
方法時,最後跟到了一個 native 層方法就跟不下去了麼,現在再回過來想想這個 native 層方法的作用是什麼,應該就比較好猜測了。
英文不大了解,大體上可能是說安排接收一個 vsync 信号。而根據我們的分析,如果這個 vsync 信号發出的話,底層就會回調 DisplayEventReceiver 的
onVsync()
方法。
那如果隻是這樣的話,就有一點說不通了,首先上層 app 對于這些發送 vsync 信号的底層來說肯定是隐藏的,也就是說底層它根本不知道上層 app 的存在,那麼在它的每 16.6ms 的幀信号來的時候,它是怎麼找到我們的 app,并回調它的方法呢?
這就有點類似于觀察者模式,或者說釋出-訂閱模式。既然上層 app 需要知道底層每隔 16.6ms 的幀信号事件,那麼它就需要先注冊監聽才對,這樣底層在發信号的時候,直接去找這些觀察者通知它們就行了。
這是我的了解,是以,這樣一來,
scheduleVsync()
這個調用到了 native 層方法的作用大體上就可以了解成注冊監聽了,這樣底層也才找得到上層 app,并在每 16.6ms 重新整理信号發出的時候回調上層 app 的 onVsync() 方法。這樣一來,應該就說得通了。
還有一點,
scheduleVsync()
注冊的監聽應該隻是監聽下一個螢幕重新整理信号的事件而已,而不是監聽所有的螢幕重新整理信号。比如說目前監聽了第一幀的重新整理信号事件,那麼當第一幀的重新整理信号來的時候,上層 app 就能接收到事件并作出反應。但如果還想監聽第二幀的重新整理信号,那麼隻能等上層 app 接收到第一幀的重新整理信号之後再去監聽下一幀。
雖然現在能力還不足以跟蹤到 native 層,這些結論雖然是猜測的,但都經過調試,對注釋、代碼了解之後梳理出來的結論,跟原理應該不會偏差太多,這樣子的了解應該是可以的。
本篇内容确實有點多,是以到這裡還是繼續來先來梳理一下目前的資訊,防止都忘記上面講了些什麼:
- 我們知道一個 View 發起重新整理的操作時,最終是走到了 ViewRootImpl 的 scheduleTraversals() 裡去,然後這個方法會将周遊繪制 View 樹的操作 performTraversals() 封裝到 Runnable 裡,傳給 Chorerographer,以目前的時間戳放進一個 mCallbackQueue 隊列裡,然後調用了 native 層的方法向底層注冊監聽下一個螢幕重新整理信号事件。
- 當下一個螢幕重新整理信号發出的時候,如果我們 app 有對這個事件進行監聽,那麼底層它就會回調我們 app 層的 onVsync() 方法來通知。當 onVsync() 被回調時,會發一個 Message 到主線程,将後續的工作切到主線程來執行。
- 切到主線程的工作就是去 mCallbackQueue 隊列裡根據時間戳将之前放進去的 Runnable 取出來執行,而這些 Runnable 有一個就是周遊繪制 View 樹的操作 performTraversals()。在這次的周遊操作中,就會去繪制那些需要重新整理的 View。
- 是以說,當我們調用了 invalidate(),requestLayout(),等之類重新整理界面的操作時,并不是馬上就會執行這些重新整理的操作,而是通過 ViewRootImpl 的 scheduleTraversals() 先向底層注冊監聽下一個螢幕重新整理信号事件,然後等下一個螢幕重新整理信号來的時候,才會去通過 performTraversals() 周遊繪制 View 樹來執行這些重新整理操作。
過濾一幀内重複的重新整理請求
整體上的流程我們已經梳理出來的,但還有幾點問題需要解決。我們在一個 16.6ms 的一幀内,代碼裡可能會有多個 View 發起了重新整理請求,這是非常常見的場景了,比如某個動畫是有多個 View 一起完成,比如界面發生了滑動等等。
按照我們上面梳理的流程,隻要 View 發起了重新整理請求最終都會走到 ViewRootImpl 中的
scheduleTraversals()
裡去,是吧。而這個方法又會封裝一個周遊繪制 View 樹的操作
performTraversals()
到 Runnable 然後扔到隊列裡等重新整理信号來的時候取出來執行,沒錯吧。
那如果多個 View 發起了重新整理請求,豈不是意味着會有多次周遊繪制 View 樹的操作?
其實,這點不用擔心,還記得我們在最開始分析
scheduleTraverslas()
的時候先跳過了一些代碼麼?現在我們回過來繼續看看這些代碼:
我們上面分析的
scheduleTraversals()
幹的那一串工作,前提是 mTraversalScheduled 這個 boolean 類型變量等于 false 才會去執行。那這個變量在什麼時候被指派被 false 了呢:
隻有三個被指派為 false 的地方,一個是上圖的
doTraversal()
,還有就是聲明時預設為 false,剩下一個是在取消周遊繪制 View 操作
unscheduleTraversals()
裡。這兩個可以先不去看,就看看
doTraversal()
。還記得這個方法吧,就是在
scheduleTraversals()
中封裝到 Runnable 裡的那個方法。
也就是說,當我們調用了一次
scheduleTraversals()
之後,直到下一個螢幕重新整理信号來的時候,
doTraversal()
被取出來執行。在這期間重複調用
scheduleTraversals()
都會被過濾掉的。那麼為什麼需要這樣呢?
其實,想想就能明白了。View 最終是怎麼重新整理的呢,就是在執行
performTraversals()
周遊繪制 View 樹過程中層層周遊到需要重新整理的 View,然後去繪制它的吧。既然是周遊,那麼不管上一幀内有多少個 View 發起了重新整理的請求,在這一次的周遊過程中全部都會去處理的吧。這也是我們從代碼上看到的,每一個螢幕重新整理信号來的時候,隻會去執行一次
performTraversals()
,因為隻需周遊一遍,就能夠重新整理所有的 View 了。
而
performTraversals()
會被執行的前提是調用了
scheduleTraversals()
來向底層注冊監聽了下一個螢幕重新整理信号事件,是以在同一個 16.6ms 的一幀内,隻需要第一個發起重新整理請求的 View 來走一遍
scheduleTraversals()
幹的事就可以了,其他不管還有多少 View 發起了重新整理請求,沒必要再去重複向底層注冊監聽下一個螢幕重新整理信号事件了,反正隻要有一次周遊繪制 View 樹的操作就可以對它們進行重新整理了。
postSyncBarrier()---同步屏障消息
還剩最後一個問題,
scheduleTraversals()
裡我們還有一行代碼沒分析。這個問題是這樣的:
我們清楚主線程其實是一直在處理 MessageQueue 消息隊列裡的 Message,每個操作都是一個 Message,打開 Activity 是一個 Message,周遊繪制 View 樹來重新整理螢幕也是一個 Message。
而且,上面梳理完我們也清楚,周遊繪制 View 樹的操作是在螢幕重新整理信号到的時候,底層回調我們 app 的
onVsync()
,這個方法再去将周遊繪制 View 樹的操作 post 到主線程的 MessageQueue 中去等待執行。主線程同一時間隻能處理一個 Message,這些 Message 就肯定有先後的問題,那麼會不會出現下面這種情況呢:
也就是說,當我們的 app 接收到螢幕重新整理信号時,來不及第一時間就去執行重新整理螢幕的操作,這樣一來,即使我們将布局優化得很徹底,保證繪制目前 View 樹不會超過 16ms,但如果不能第一時間優先處理繪制 View 的工作,那等 16.6 ms 過了,底層需要去切換下一幀的畫面了,我們 app 卻還沒處理完,這樣也照樣會出現丢幀了吧。而且這種場景是非常有可能出現的吧,畢竟主線程需要處理的事肯定不僅僅是重新整理螢幕的事而已,那麼這個問題是怎麼處理的呢?
是以我們繼續回來看
scheduleTraversals()
:
在邏輯走進 Choreographer 前會先往隊列裡發送一個同步屏障,而當
doTraversal()
被調用時才将同步屏障移除。這個同步屏障又涉及到消息機制了,不深入了,這裡就隻給出結論。
這個同步屏障的作用可以了解成攔截同步消息的執行,主線程的 Looper 會一直循環調用 MessageQueue 的
next()
來取出隊頭的 Message 執行,當 Message 執行完後再去取下一個。當
next()
方法在取 Message 時發現隊頭是一個同步屏障的消息時,就會去周遊整個隊列,隻尋找設定了異步标志的消息,如果有找到異步消息,那麼就取出這個異步消息來執行,否則就讓
next()
方法陷入阻塞狀态。如果
next()
方法陷入阻塞狀态,那麼主線程此時就是處于空閑狀态的,也就是沒在幹任何事。是以,如果隊頭是一個同步屏障的消息的話,那麼在它後面的所有同步消息就都被攔截住了,直到這個同步屏障消息被移除出隊列,否則主線程就一直不會去處理同步螢幕後面的同步消息。
而所有消息預設都是同步消息,隻有手動設定了異步标志,這個消息才會是異步消息。另外,同步屏障消息隻能由内部來發送,這個接口并沒有公開給我們使用。
最後,仔細看上面 Choreographer 裡所有跟 message 有關的代碼,你會發現,都手動設定了異步消息的标志,是以這些操作是不受到同步屏障影響的。這樣做的原因可能就是為了盡可能保證上層 app 在接收到螢幕重新整理信号時,可以在第一時間執行周遊繪制 View 樹的工作。
因為主線程中如果有太多消息要執行,而這些消息又是根據時間戳進行排序,如果不加一個同步屏障的話,那麼周遊繪制 View 樹的工作就可能被迫延遲執行,因為它也需要排隊,那麼就有可能出現當一幀都快結束的時候才開始計算螢幕資料,那即使這次的計算少于 16.6ms,也同樣會造成丢幀現象。
那麼,有了同步屏障消息的控制就能保證每次一接收到螢幕重新整理信号就第一時間處理周遊繪制 View 樹的工作麼?
隻能說,同步屏障是盡可能去做到,但并不能保證一定可以第一時間處理。因為,同步屏障是在
scheduleTraversals()
被調用時才發送到消息隊列裡的,也就是說,隻有當某個 View 發起了重新整理請求時,在這個時刻後面的同步消息才會被攔截掉。如果在
scheduleTraversals()
之前就發送到消息隊列裡的工作仍然會按順序依次被取出來執行。
界面重新整理控制者--ViewRootImpl
最後,就是上文經常說的一點,所有跟界面重新整理相關的操作,其實最終都會走到 ViewRootImpl 中的
scheduleTraversals()
去的。
大夥可以想想,跟界面重新整理有關的操作有哪些,大概就是下面幾種場景吧:
- invalidate(請求重繪)
- requestLayout(重新布局)
- requestFocus(請求焦點)
- startActivity(打開新界面)
- onRestart(重新打開界面)
- KeyEvent(遙控器事件,本質上是焦點導緻的重新整理)
- Animation(各種動畫,本質上是請求重繪導緻的重新整理)
- RecyclerView滑動(頁面滑動,本質上是動畫導緻的重新整理)
- setAdapter(各種adapter的更新)
- ...
在上一篇分析動畫的部落格裡,我們跟蹤了
invalidate()
,确實也是這樣,至于其他的我并沒有一一去驗證,大夥有興趣可以看看,我猜測,這些跟界面重新整理有關的方法内部要麼就是一個 do{}while() 循環尋找 mParent,要麼就是直接不斷的調用 mParent 的方法。而一顆 View 樹最頂端的 mParent 就是 ViewRootImpl,是以這些跟界面重新整理相關的方法,在 ViewRootImpl 肯定也是可以找到的:
其實,以前我一直以為如果界面上某個小小的 View 發起了
invalidate()
重繪之類的操作,那麼應該就隻是它自己的
onLayout()
onDraw()
被調用來重繪而已。最後才清楚,原來,即使再小的 View,如果發起了重繪的請求,那麼也需要先層層走到 ViewRootImpl 裡去,而且還不是馬上就執行重繪操作,而是需要等待下一個螢幕重新整理信号來的時候,再從 DecorView 開始層層周遊到這些需要重新整理的 View 裡去重繪它們。
總結
本篇篇幅确實很長,因為這部分内容要理清楚不容易,要講清楚更不容易,大夥如果有時間,可以靜下心來慢慢看,從頭看下來,我相信,多少會有些收獲的。如果沒時間,那麼也可以直接看看總結。
- 界面上任何一個 View 的重新整理請求最終都會走到 ViewRootImpl 中的 scheduleTraversals() 裡來安排一次周遊繪制 View 樹的任務;
- scheduleTraversals() 會先過濾掉同一幀内的重複調用,在同一幀内隻需要安排一次周遊繪制 View 樹的任務即可,這個任務會在下一個螢幕重新整理信号到來時調用 performTraversals() 周遊 View 樹,周遊過程中會将所有需要重新整理的 View 進行重繪;
- 接着 scheduleTraversals() 會往主線程的消息隊列中發送一個同步屏障,攔截這個時刻之後所有的同步消息的執行,但不會攔截異步消息,以此來盡可能的保證當接收到螢幕重新整理信号時可以盡可能第一時間處理周遊繪制 View 樹的工作;
- 發完同步屏障後 scheduleTraversals() 才會開始安排一個周遊繪制 View 樹的操作,作法是把 performTraversals() 封裝到 Runnable 裡面,然後調用 Choreographer 的 postCallback() 方法;
- postCallback() 方法會先将這個 Runnable 任務以目前時間戳放進一個待執行的隊列裡,然後如果目前是在主線程就會直接調用一個native 層方法,如果不是在主線程,會發一個最高優先級的 message 到主線程,讓主線程第一時間調用這個 native 層的方法;
- native 層的這個方法是用來向底層注冊監聽下一個螢幕重新整理信号,當下一個螢幕重新整理信号發出時,底層就會回調 Choreographer 的onVsync() 方法來通知上層 app;
- onVsync() 方法被回調時,會往主線程的消息隊列中發送一個執行 doFrame() 方法的消息,這個消息是異步消息,是以不會被同步屏障攔截住;
- doFrame() 方法會去取出之前放進待執行隊列裡的任務來執行,取出來的這個任務實際上是 ViewRootImpl 的 doTraversal() 操作;
- 上述第4步到第8步涉及到的消息都手動設定成了異步消息,是以不會受到同步屏障的攔截;
- doTraversal() 方法會先移除主線程的同步屏障,然後調用 performTraversals() 開始根據目前狀态判斷是否需要執行performMeasure() 測量、perfromLayout() 布局、performDraw() 繪制流程,在這幾個流程中都會去周遊 View 樹來重新整理需要更新的View;
再來一張時序圖結尾,大夥想自己過源碼時可以跟着時序圖來,建議在電腦上閱讀:
QA
Q1:Android 每隔 16.6 ms 重新整理一次螢幕到底指的是什麼意思?是指每隔 16.6ms 調用 onDraw() 繪制一次麼?
答:我們常說的 Android 每隔 16.6 ms 重新整理一次螢幕其實是指底層會以這個固定頻率來切換每一幀的畫面,而這個每一幀的畫面資料就是我們 app 在接收到螢幕重新整理信号之後去執行周遊繪制 View 樹工作所計算出來的螢幕資料。而 app 并不是每隔 16.6ms 的螢幕重新整理信号都可以接收到,隻有當 app 向底層注冊監聽下一個螢幕重新整理信号之後,才能接收到下一個螢幕重新整理信号到來的通知。而隻有當某個 View 發起了重新整理請求時,app 才會去向底層注冊監聽下一個螢幕重新整理信号。
也就是說,隻有當界面有重新整理的需要時,我們 app 才會在下一個螢幕重新整理信号來時,周遊繪制 View 樹來重新計算螢幕資料。如果界面沒有重新整理的需要,一直保持不變時,我們 app 就不會去接收每隔 16.6ms 的螢幕重新整理信号事件了,但底層仍然會以這個固定頻率來切換每一幀的畫面,隻是後面這些幀的畫面都是相同的而已。
答:我們 app 隻負責計算螢幕資料而已,接收到螢幕重新整理信号就去計算,計算完畢就計算完畢了。至于螢幕的重新整理,這些是由底層以固定的頻率來切換螢幕每一幀的畫面。是以即使螢幕資料都計算完畢,螢幕會不會馬上重新整理就取決于底層是否到了要切換下一幀畫面的時機了。
答:之是以提了這個問題,是因為之前是以為如果某個 View 發起了重新整理請求,比如調用了
invalidte()
,那麼它的重繪工作就馬上開始執行了,是以以前在看網上那些介紹螢幕重新整理機制的部落格時,經常看見下面這張圖:
那個時候就是不大了解,為什麼每一次 CPU 計算的工作都剛剛好是在每一個信号到來的那個瞬間開始的呢?畢竟代碼裡發起重新整理螢幕的操作是動态的,不可能每次都剛剛好那麼巧。
梳理完螢幕重新整理機制後就清楚了,代碼裡調用了某個 View 發起的重新整理請求,這個重繪工作并不會馬上就開始,而是需要等到下一個螢幕重新整理信号來的時候才開始,是以現在回過頭來看這些圖就清楚多了。
答:造成丢幀大體上有兩類原因,一是周遊繪制 View 樹計算螢幕資料的時間超過了 16.6ms;二是,主線程一直在處理其他耗時的消息,導緻周遊繪制 View 樹的工作遲遲不能開始,進而超過了 16.6 ms 底層切換下一幀畫面的時機。
第一個原因就是我們寫的布局有問題了,需要進行優化了。而第二個原因則是我們常說的避免在主線程中做耗時的任務。
針對第二個原因,系統已經引入了同步屏障消息的機制,盡可能的保證周遊繪制 View 樹的工作能夠及時進行,但仍沒辦法完全避免,是以我們還是得盡可能避免主線程耗時工作。
其實第二個原因,可以拿出來細講的,比如有這種情況, message 不怎麼耗時,但數量太多,這同樣可能會造成丢幀。如果有使用一些圖檔架構的,它内部下載下傳圖檔都是開線程去下載下傳,但當下載下傳完成後需要把圖檔加載到綁定的 view 上,這個工作就是發了一個 message 切到主線程來做,如果一個界面這種 view 特别多的話,隊列裡就會有非常多的 message,雖然每個都 message 并不怎麼耗時,但經不起量多啊。後面有時間的話,看看要不要專門整理一篇文章來講卡頓和丢幀的事。
推薦閱讀(大神部落格)
破譯Android性能優化中的16ms問題
android螢幕重新整理顯示機制
Android Choreographer 源碼分析
最近剛開通了公衆号,想激勵自己堅持寫作下去,初期主要分享原創的Android或Android-Tv方面的小知識,感興趣的可以點一波關注,謝謝支援~~