天天看點

淺談Unity3D 骨骼動畫

  轉載請标明出處http://www.cnblogs.com/zblade/

  最近研究了一下遊戲中模型的骨骼動畫的原理,做一個學習筆記,便于大家共同學習探讨。

  ps:最近改bug改的要死要活,部落格寫的吭哧吭哧的~

      首先列出學習參考的前人的文章,本文較多的參考了其中的表述:

  1、骨骼動畫詳解 :http://blog.csdn.net/ccx1234/article/details/6641944,不過這篇文章的原文已經被csdn封了:D,可以看看對應的轉載的文章也行

      2、OpenGL10-骨骼動畫原理篇:http://www.cnblogs.com/zhanglitong/p/3196752.html

一、骨骼動畫、關節動畫、關鍵幀動畫

  在實際的遊戲中,用的最多的是這三種基本的動畫。

  在關鍵幀動畫中,模型在每個關鍵幀中都是一個固定的姿勢,相當于一個“快照”,通過在不同的關鍵幀中進行插值平滑計算,可以得到一個較為流暢的動畫表現。關鍵幀動畫的一個優勢是隻需要做插值計算,相對于其他的動畫計算量很小,但是劣勢也比較明顯,基于固定的“快照”進行插值計算,表現大大被限制,同時插值如果不夠平滑容易出現尖刺等現象, 同時一個無法忽略的問題就是,對于每幀動畫都需要進行記憶體占用,在幀數較多和頂點數較多的時候,這會帶來極大的記憶體占用。當然幀動畫也有其實際的應用場景,目前在一些模型的表情動畫中會較多的應用到幀動畫,因為其動畫較少,同時可以用插值實作較為平滑的效果,不需要骨骼動畫。

  關節動畫是早期出現的一種動畫,在這種動畫中,模型整體不是一個Mesh, 而是分為多個Mesh,通過父子的關系進行組織,這樣父節點的Mesh就會帶動子節點的Mesh進行變換,這樣層層的變換關系,就可以得到各個子Mesh在不同關鍵幀中的位置。關節動畫相比于關鍵幀動畫,依賴于各個關鍵幀的動畫資料,可以實時的計算出各個Mesh的位置,不再受限于固定的位置,但是由于是分散的各個Mesh,這樣在不同Mesh的結合處容易出現裂縫。

  骨骼動畫是進一步的動畫類型,原理構成極其簡單,但是解決問題極其有優勢。将模型分為骨骼Bone和蒙皮Mesh兩個部分,其基本的原理可以闡述為:模型的骨骼可分為基本多層父子骨骼,在動畫關鍵幀資料的驅動下,計算出各個父子骨骼的位置,基于骨骼的控制通過頂點混合動态計算出蒙皮網格的頂點。在骨骼動畫中,通常包含的是骨骼層次資料,網格Mesh資料, 網格蒙皮資料Skin Info和骨骼的動畫關鍵幀資料。本文重點講解一下骨骼動畫。

二、骨骼動畫原理分析

  對于Skinned Mesh的了解關鍵是蒙皮的計算過程,這裡的皮,并不是我們常見的在shader中用到的貼圖texture,而是模型的mesh, 是以蒙皮其實就是計算mesh相對于骨骼的位置變換過程。如果我們的骨骼沒有變化,那麼我們的mesh就沒有變化,此時的mesh就相當于一個靜态的mesh。是以對于skinned的了解,就是指具有蒙皮資料skin info的mesh :D。 在實際的執行個體中,skin info主要包含目前mesh上的頂點受到哪些骨骼影響,各個骨骼的影響權重。借用文章1中的表述,整個mesh頂點的變換過程可以用矩陣的方式表述:

  Vworld = Vmesh * BoneOffsetMatrix1 * CombineMatrix1 * W1 +Vmesh * BoneOffsetMatrix2 * CombineMatrix2 * W2 +...+ Vmesh * BoneOffsetMatrixn * CombineMatrixn * Wn

  其中BoneOffsetMatrix 和 CombineMatrix在下面的講解中會詳細講解求解過程。

 1、骨骼動畫中的骨骼

  在我們常見的模型模組化中,美術通常将模型設定成雙手水準,雙腿分立的類“大”字型。 為什麼要用這樣的方式? 這與我們的模型的骨骼有一定的關系。通常模型骨骼數量都有一個限制(通常為30,下面會解釋為什麼受到限制),模型不可能為一根骨骼,如果為一根骨骼,那麼模型的表現就會顯得比較單一,想要表現出類似于人體的動畫,一般都會有多個骨骼。對于每個骨骼,如何建立其組織關系,在模組化的時候就進行了基本的設定。在完成模組化後,在進行骨骼綁定的時候,通常美術會選擇模型的盆骨做為模型的根骨骼。那麼基于根骨骼,可以遞推出各個骨骼相對于根骨的父子關系。通過骨骼所在的空間,其原點我們會選擇兩個腳之間的中點作為原點,這時候就會發現根骨骼并沒有和原點重合,這時美術會建構一個Scene_Root做為額外的骨骼,其位置就為世界原點,而真正的根骨骼Bip01會作為Scene_Root的唯一子骨骼。

淺談Unity3D 骨骼動畫

                                      請忽略我的靈魂畫法:D

  基于根骨骼,我們可以遞推出各個骨骼相對于根骨骼的父子轉換矩陣,通常這樣的矩陣轉換為旋轉矩陣,不存在平移和縮放,當然比如你的一個模型動畫是拉長模型的身體(比如海賊王這種動畫:D),那麼你可以添加平移和縮放到變換矩陣中。此時對于整個模型就有了一個基本的直覺的感受了,模型的具體動畫,取決于模型的根骨骼,牽一發而動全身(這兒的牽一發是指模型的動畫資料驅動),整個模型的運動會帶動外面的mesh一起運動,就可以表現出整個模型的骨骼動畫,這樣,我們對于骨骼動畫就有一個基本的了解。

  借用參考文1的說話,骨骼的本質,其實就是一個坐标空間,我們在做骨骼動畫的時候,關鍵幀中包含的對骨骼的變換主要為旋轉矩陣,是以對骨骼的變換就是對骨骼空間的旋轉變換。說簡單點,一個骨骼動畫,帶來的變換,首先作用在根骨骼上,影響根骨骼的坐标空間,然後遞歸的影響根骨的子骨骼,這樣層層的遞歸影響,最後帶來的就是整體骨骼變換。基于此,我們就可以了解關節的作用,關節就是骨骼自身空間的原點。而關節的位置由目前骨骼在其父節點骨骼空間中的位置來描述,圍繞關節的旋轉就是骨骼空間自身的旋轉,這樣變換就通過關節層層遞歸傳遞。用c++的表述,可以定義一個基本的骨骼類,主要包含自己的世界坐标中的位置,在父節點中的位置,其第一個子節點,其兄弟骨骼的指針,代碼依據于文章1:

     這樣,當父節點骨骼發生變換的時候,子節點的骨骼就會做相應的變換,這樣的操作可以稱為 UpdateBoneMatrix(更新骨骼矩陣),這樣的操作可以用一個方法ComputeWorldPos來表示,這樣可以用遞歸的方式在Bone中實作,代碼依據于文章1:

   這樣,當父節點骨骼發生變換的時候,子節點的骨骼都會做出相應的變換,進而得到最新的位置、朝向等資訊,骨骼發生變化,進而會帶動外在的mesh發生變化,是以整體的模型就表現出運動起來。基于此,可以了解為什麼骨骼是骨骼動畫的核心。

  

2、骨骼動畫中的蒙皮

  1)關于蒙皮的一種了解

  在說完骨骼後,對于整體模型在動畫中骨骼的變換,可以有一個大緻的了解,當然模型隻是内在的,動畫的外在表現就是模型的蒙皮變化,是以骨骼動畫中的第二部分就是蒙皮的計算。這裡的皮,就是前面說過的Mesh。

  首先,需要明确的是Mesh所在的空間。在模組化的時候,模型的Mesh是和骨骼一樣處于同樣的空間中的,Mesh中的各個頂點是基于Mesh的原點來進行定位的。但是模型在運動表現的時候,是根據骨骼的變換來做相應的動作的,對應的Mesh上的頂點就需要做出對應的轉換,是以Mesh的頂點需要轉換到對應的骨骼所在的坐标空間中,進行相應的位置變換,是以對應的需要添加蒙皮資訊,也就是skin info,主要是目前頂點受到哪些骨骼的影響,影響的權重等,借用文章1的表述,可以用C++表示一個頂點類,代碼依據于文章1:

  當然,這兒隻是一個簡單的表述,具體的在引擎中會有規範的設計。那麼我們的頂點在跟随骨骼做運動的時候,是如何計算自己的位置的?我們就需要引入BoneOffsetMatrix 和 Transform Matrix的概念。

     在前面,我們已經提到,頂點需要依附于骨骼進行位置計算,但是模組化的時候,頂點的位置是基于Mesh原點進行模組化的,通常情況下,Mesh的原點是和模型的骨骼的根骨骼處于同一個坐标空間中,那麼 BoneOffsetMatrix就是用來将Mesh中頂點從Mesh空間轉換到骨骼所在空間中。這就是很多文章中提及的Binding Pos的設定。

  在模組化的時候,對于每個骨骼,我們是可以得到其對應的Transform Matrix(用來層層計算到父節點所在空間中),其中根骨骼的Transform Matrix是基于世界空間的轉換,是以對于每一個下面的子骨骼,要計算其Transform Matrix,需要進行一個矩陣的連乘操作。最後得到的最終矩陣連乘結果矩陣就是Combined Transform Matrix,基于這個矩陣,就可以将頂點從骨骼所在的空間轉換到世界空間中。反過來,這個矩陣的逆矩陣(一般隻考慮可以取逆的操作),就是從世界空間中轉換到該骨骼的空間中,由于Mesh的定義基于Mesh原點,Mesh原點就在世界空間中,是以這個逆矩陣就是需要計算的的 Offset Matrix,也被稱為Inverse Matrix,這個逆矩陣一般實在初始位置中求得,通過取逆即可獲得。

  在實際的計算中,每個骨骼可能會對應多個頂點,如果每個頂點都儲存其對應的骨骼的變換矩陣,那麼大量的頂點就會包含非常多的變換矩陣,帶來記憶體資料的擴大。是以我們隻需要儲存目前該骨骼在初始位置,對應的從世界空間到其骨骼空間的變換矩陣,那麼其對應的每個頂點在每次變換操作的時候,隻需要對應的用offset Matrix來操作即可。

      對于上面的Transform Matrix和offset Matrix,是納入了旋轉、平移和縮放的。其實offset Matrix取決于骨骼的初始位置,此時一般隻包含了平移(此時還沒有動畫,是以沒有旋轉和縮放),在動畫中,一般也以旋轉為主(是以大部分的動畫的關鍵幀用四元數表示)。在矩陣中都包含三種矩陣,是處于相容性考慮。

  這兒就基于平移,做一個基本的蒙皮的計算過程,代碼主要依據于文章1:

         仔細捋一捋上面的代碼,就可以了解整體的蒙皮變換的過程,當然,這兒隻用了矩陣變換中的平移變換,如果考慮加上旋轉和縮放,則回到最初的計算公式中了。至此,對于基本的骨骼動畫中的骨骼變換和蒙皮變換,有了一個詳細的解釋。下面說說Unity中是如何處理骨骼變換的。

2)關于蒙皮的新的了解

     在我寫完這篇文章後,給同僚檢視,同僚覺得較為繞,有點迷糊,後來我想了一下,可以采用一種較為清晰的方式重新講解一下蒙皮的過程:

    首先給出蒙皮計算的過程: 頂點在模型坐标系中位置 -> 骨骼空間中位置 -> 變換後的骨骼空間中的位置->模型坐标系中的位置 -> 世界空間中的位置

    關于蒙皮的定義,其實質就是骨骼在動畫資料的驅動下,變換位置,依附于該骨骼的mesh頂點會對應的變換到新的位置(在世界空間中)的整個過程。

    确定最終結果: mesh上的頂點在世界空間中的位置變換到最新位置

    那麼怎麼得到這樣的一個結果?在前文中,我們已經知道,骨骼是和mesh分離的,骨骼依賴于根骨骼,層層遞進得到各自的轉換矩陣。而mesh是在模型模組化中,基于模型空間得到的位置設定。在這兒,根骨骼的空間原點和mesh的空間原點重合,也就是mesh的坐标系和根骨骼的坐标系為同一個坐标系,也就是模型坐标系。

    我們已經知道,骨骼本身就是一個坐标系空間,其原點就是關節點。那麼在模組化的時候,模組化軟體就會有一步計算操作,稱為BindingPos操作。這步操作可以這樣了解,mesh上分布了衆多的頂點,對應于單獨的一個骨骼,我們可以得到其骨骼空間的轉換矩陣,以及那些頂點依附于其上。對于依附其上的頂點,模組化的時候,以及基于模型空間給出了一個模型空間中的位置,那麼其相對于目前該骨骼空間的位置,可以基于模型空間位置與骨骼的轉換矩陣得到,這個位置就是其BindingPos, 這個變換矩陣,就是BindingPosMatrix,基于這個矩陣,可以将頂點位置從模型空間轉換到骨骼空間。

       到這兒,我們完成了:  頂點在模型坐标系中位置 -> 骨骼空間中位置

    接下來我們繼續下面的計算,在骨骼動畫中,每個動畫資料中,會帶來目前骨骼的新的變化(旋轉為主),那麼在目前動畫資料的驅動下,目前骨骼變換到新的位置,得到新的骨骼矩陣,那麼依附其上的頂點的位置也會變換,首先是将頂點位置從模型空間中轉換到目前該骨骼的空間中,然後基于骨骼的目前這次變換矩陣(比如旋轉90度對應的矩陣),得到其在該骨骼空間中的新位置,這個新的位置再和目前骨骼在和根骨骼的變換矩陣相作用,變換回模型空間中。

    到這兒,我們完成了:  骨骼空間中位置 -> 變換後的骨骼空間中的位置->模型坐标系中的位置

       接下來,就是模型坐标系到世界坐标系的變換,這個就不多說,就是一個MVP的轉換矩陣。

       這樣,我們就完成了一次骨骼變換,依附其上的頂點的位置變換的整個過程,由點及面,整個蒙皮的過程就是一個大量該類變換的過程。當然,這兒還沒有說一個頂點受多個骨骼影響的情況,其實質也很簡單,就是一個頂點受到多個骨骼的影響,那麼就各自配置設定一個對應的權重,那麼在計算的時候,各自單獨計算,然後乘上權重系數,進行累加,就可以得到mesh上各個頂點的最新位置資訊。

三、Unity3D骨骼動畫處理

   前面講解的對于骨骼動畫中的骨骼變換,蒙皮的計算,都是在CPU中進行的。在實際的遊戲引擎中,這些都是分開處理的,較為通用的處理是将骨骼的動畫資料驅動放在CPU中,計算出骨骼的變換矩陣,然後傳遞給GPU中進行蒙皮計算。在DX10的時候,一般的shader給出的寄存器的大小在128的大小,一個變換矩陣為4x4,如果去除最後一行(0,0,0,1)就可以用3個float表示,那麼最多可以表示,嗯,42個左右,如果考慮進行性能優化,不完全占用寄存器的大小,那麼一般會限制在30根骨骼的大小上。将這些骨骼的變換矩陣在CPU進行計算後,就可以封裝成skin info傳遞到GPU中。

      在GPU的計算中,就會取出這些mesh上的頂點進行對應的位置計算,基于骨骼的轉換矩陣和骨骼的權重,得到最新的位置,進而進行一次頂點計算和描繪。之是以将骨骼動畫的兩個部分分開處理,一個原因就是CPU的處理能力相對而言沒有GPU快捷,一般一個模型的骨骼數量是較小的,但是mesh上的頂點數量較大,利用GPU的并行處理能力優勢,可以分擔CPU的計算壓力。

      在DX11還是DX12之後(記不太清楚),骨骼變換矩陣的計算結果不再存儲在寄存器中,而是存儲在一個buffer中,這樣的buffer大小基于骨骼數量的大小在第一次計算的時候設定,之後每次骨骼動畫資料驅動得到新的變換矩陣,就依次更改對應的buffer中存儲的變換矩陣,這樣就不再受到寄存器的大小而限制骨骼的根數的大小。但是實際的優化中,都會盡量優化模型的骨骼的數量,畢竟數量越多,特别是影響頂點的骨骼數量越多,那麼計算量就會越大,正常的思維是優化骨骼數量而不是去擴充buffer的大小:D

      在文章2中,對于GPU的蒙皮計算做了較大的性能優化,主要的思維也是這樣,在CPU中進行骨骼變換,将變換的結果傳遞到GPU中,進而進行蒙皮計算。基本的思維和前面說的變換思維一緻,其基本的優化重點也是想利用一個buffer來緩存變換矩陣,進而優化性能。這兒我就重點分析一下shader部分的代碼,其在cpu部分的代碼處理基本和前面的代碼思想一緻:

      如果采用CPU的計算骨骼變換,那麼GPU的shader:

  其優化的政策,就是用貼圖的方式來存儲這個變換矩陣,參看一下代碼吧:

  總結:綜合整篇文章,對于骨骼動畫有了一個較為詳細的講解,主要是參考兩篇文章,我隻是做了一個知識的搬運工,今兒就寫到這兒,後面有更多的更新,會繼續回來更改。