淺談Unity3D 骨骼動畫

　　轉載請标明出處http://www.cnblogs.com/zblade/

　　最近研究了一下遊戲中模型的骨骼動畫的原理，做一個學習筆記，便于大家共同學習探讨。

　　ps:最近改bug改的要死要活，部落格寫的吭哧吭哧的~

首先列出學習參考的前人的文章，本文較多的參考了其中的表述：

　　1、骨骼動畫詳解：http://blog.csdn.net/ccx1234/article/details/6641944，不過這篇文章的原文已經被csdn封了:D，可以看看對應的轉載的文章也行

2、OpenGL10-骨骼動畫原理篇：http://www.cnblogs.com/zhanglitong/p/3196752.html

一、骨骼動畫、關節動畫、關鍵幀動畫

　　在實際的遊戲中，用的最多的是這三種基本的動畫。

　　在關鍵幀動畫中，模型在每個關鍵幀中都是一個固定的姿勢，相當于一個“快照”，通過在不同的關鍵幀中進行插值平滑計算，可以得到一個較為流暢的動畫表現。關鍵幀動畫的一個優勢是隻需要做插值計算，相對于其他的動畫計算量很小，但是劣勢也比較明顯，基于固定的“快照”進行插值計算，表現大大被限制，同時插值如果不夠平滑容易出現尖刺等現象，同時一個無法忽略的問題就是，對于每幀動畫都需要進行記憶體占用，在幀數較多和頂點數較多的時候，這會帶來極大的記憶體占用。當然幀動畫也有其實際的應用場景，目前在一些模型的表情動畫中會較多的應用到幀動畫，因為其動畫較少，同時可以用插值實作較為平滑的效果，不需要骨骼動畫。

　　關節動畫是早期出現的一種動畫，在這種動畫中，模型整體不是一個Mesh, 而是分為多個Mesh，通過父子的關系進行組織，這樣父節點的Mesh就會帶動子節點的Mesh進行變換，這樣層層的變換關系，就可以得到各個子Mesh在不同關鍵幀中的位置。關節動畫相比于關鍵幀動畫，依賴于各個關鍵幀的動畫資料，可以實時的計算出各個Mesh的位置，不再受限于固定的位置，但是由于是分散的各個Mesh，這樣在不同Mesh的結合處容易出現裂縫。

　　骨骼動畫是進一步的動畫類型，原理構成極其簡單，但是解決問題極其有優勢。将模型分為骨骼Bone和蒙皮Mesh兩個部分，其基本的原理可以闡述為：模型的骨骼可分為基本多層父子骨骼，在動畫關鍵幀資料的驅動下，計算出各個父子骨骼的位置，基于骨骼的控制通過頂點混合動态計算出蒙皮網格的頂點。在骨骼動畫中，通常包含的是骨骼層次資料，網格Mesh資料，網格蒙皮資料Skin Info和骨骼的動畫關鍵幀資料。本文重點講解一下骨骼動畫。

二、骨骼動畫原理分析

　　對于Skinned Mesh的了解關鍵是蒙皮的計算過程，這裡的皮，并不是我們常見的在shader中用到的貼圖texture，而是模型的mesh, 是以蒙皮其實就是計算mesh相對于骨骼的位置變換過程。如果我們的骨骼沒有變化，那麼我們的mesh就沒有變化，此時的mesh就相當于一個靜态的mesh。是以對于skinned的了解，就是指具有蒙皮資料skin info的mesh :D。在實際的執行個體中，skin info主要包含目前mesh上的頂點受到哪些骨骼影響，各個骨骼的影響權重。借用文章1中的表述，整個mesh頂點的變換過程可以用矩陣的方式表述：

　　Vworld = Vmesh * BoneOffsetMatrix1 * CombineMatrix1 * W1 +Vmesh * BoneOffsetMatrix2 * CombineMatrix2 * W2 +...+ Vmesh * BoneOffsetMatrixn * CombineMatrixn * Wn

　　其中BoneOffsetMatrix 和 CombineMatrix在下面的講解中會詳細講解求解過程。

1、骨骼動畫中的骨骼

　　在我們常見的模型模組化中，美術通常将模型設定成雙手水準，雙腿分立的類“大”字型。為什麼要用這樣的方式？這與我們的模型的骨骼有一定的關系。通常模型骨骼數量都有一個限制（通常為30，下面會解釋為什麼受到限制），模型不可能為一根骨骼，如果為一根骨骼，那麼模型的表現就會顯得比較單一，想要表現出類似于人體的動畫，一般都會有多個骨骼。對于每個骨骼，如何建立其組織關系，在模組化的時候就進行了基本的設定。在完成模組化後，在進行骨骼綁定的時候，通常美術會選擇模型的盆骨做為模型的根骨骼。那麼基于根骨骼，可以遞推出各個骨骼相對于根骨的父子關系。通過骨骼所在的空間，其原點我們會選擇兩個腳之間的中點作為原點，這時候就會發現根骨骼并沒有和原點重合，這時美術會建構一個Scene_Root做為額外的骨骼，其位置就為世界原點，而真正的根骨骼Bip01會作為Scene_Root的唯一子骨骼。

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　請忽略我的靈魂畫法:D

　　基于根骨骼，我們可以遞推出各個骨骼相對于根骨骼的父子轉換矩陣，通常這樣的矩陣轉換為旋轉矩陣，不存在平移和縮放，當然比如你的一個模型動畫是拉長模型的身體（比如海賊王這種動畫:D），那麼你可以添加平移和縮放到變換矩陣中。此時對于整個模型就有了一個基本的直覺的感受了，模型的具體動畫，取決于模型的根骨骼，牽一發而動全身（這兒的牽一發是指模型的動畫資料驅動），整個模型的運動會帶動外面的mesh一起運動，就可以表現出整個模型的骨骼動畫，這樣，我們對于骨骼動畫就有一個基本的了解。

　　借用參考文1的說話，骨骼的本質，其實就是一個坐标空間，我們在做骨骼動畫的時候，關鍵幀中包含的對骨骼的變換主要為旋轉矩陣，是以對骨骼的變換就是對骨骼空間的旋轉變換。說簡單點，一個骨骼動畫，帶來的變換，首先作用在根骨骼上，影響根骨骼的坐标空間，然後遞歸的影響根骨的子骨骼，這樣層層的遞歸影響，最後帶來的就是整體骨骼變換。基于此，我們就可以了解關節的作用，關節就是骨骼自身空間的原點。而關節的位置由目前骨骼在其父節點骨骼空間中的位置來描述，圍繞關節的旋轉就是骨骼空間自身的旋轉，這樣變換就通過關節層層遞歸傳遞。用c++的表述，可以定義一個基本的骨骼類，主要包含自己的世界坐标中的位置，在父節點中的位置，其第一個子節點，其兄弟骨骼的指針，代碼依據于文章1：

這樣，當父節點骨骼發生變換的時候，子節點的骨骼就會做相應的變換，這樣的操作可以稱為 UpdateBoneMatrix（更新骨骼矩陣），這樣的操作可以用一個方法ComputeWorldPos來表示，這樣可以用遞歸的方式在Bone中實作，代碼依據于文章1：

　　這樣，當父節點骨骼發生變換的時候，子節點的骨骼都會做出相應的變換，進而得到最新的位置、朝向等資訊，骨骼發生變化，進而會帶動外在的mesh發生變化，是以整體的模型就表現出運動起來。基于此，可以了解為什麼骨骼是骨骼動畫的核心。

2、骨骼動畫中的蒙皮

　　1）關于蒙皮的一種了解

　　在說完骨骼後，對于整體模型在動畫中骨骼的變換，可以有一個大緻的了解，當然模型隻是内在的，動畫的外在表現就是模型的蒙皮變化，是以骨骼動畫中的第二部分就是蒙皮的計算。這裡的皮，就是前面說過的Mesh。

　　首先，需要明确的是Mesh所在的空間。在模組化的時候，模型的Mesh是和骨骼一樣處于同樣的空間中的，Mesh中的各個頂點是基于Mesh的原點來進行定位的。但是模型在運動表現的時候，是根據骨骼的變換來做相應的動作的，對應的Mesh上的頂點就需要做出對應的轉換，是以Mesh的頂點需要轉換到對應的骨骼所在的坐标空間中，進行相應的位置變換，是以對應的需要添加蒙皮資訊，也就是skin info，主要是目前頂點受到哪些骨骼的影響，影響的權重等，借用文章1的表述，可以用C++表示一個頂點類，代碼依據于文章1：

　　當然，這兒隻是一個簡單的表述，具體的在引擎中會有規範的設計。那麼我們的頂點在跟随骨骼做運動的時候，是如何計算自己的位置的？我們就需要引入BoneOffsetMatrix 和 Transform Matrix的概念。

在前面，我們已經提到，頂點需要依附于骨骼進行位置計算，但是模組化的時候，頂點的位置是基于Mesh原點進行模組化的，通常情況下，Mesh的原點是和模型的骨骼的根骨骼處于同一個坐标空間中，那麼 BoneOffsetMatrix就是用來将Mesh中頂點從Mesh空間轉換到骨骼所在空間中。這就是很多文章中提及的Binding Pos的設定。

　　在模組化的時候，對于每個骨骼，我們是可以得到其對應的Transform Matrix（用來層層計算到父節點所在空間中），其中根骨骼的Transform Matrix是基于世界空間的轉換，是以對于每一個下面的子骨骼，要計算其Transform Matrix，需要進行一個矩陣的連乘操作。最後得到的最終矩陣連乘結果矩陣就是Combined Transform Matrix，基于這個矩陣，就可以将頂點從骨骼所在的空間轉換到世界空間中。反過來，這個矩陣的逆矩陣（一般隻考慮可以取逆的操作），就是從世界空間中轉換到該骨骼的空間中，由于Mesh的定義基于Mesh原點，Mesh原點就在世界空間中，是以這個逆矩陣就是需要計算的的 Offset Matrix，也被稱為Inverse Matrix，這個逆矩陣一般實在初始位置中求得，通過取逆即可獲得。

　　在實際的計算中，每個骨骼可能會對應多個頂點，如果每個頂點都儲存其對應的骨骼的變換矩陣，那麼大量的頂點就會包含非常多的變換矩陣，帶來記憶體資料的擴大。是以我們隻需要儲存目前該骨骼在初始位置，對應的從世界空間到其骨骼空間的變換矩陣，那麼其對應的每個頂點在每次變換操作的時候，隻需要對應的用offset Matrix來操作即可。

對于上面的Transform Matrix和offset Matrix，是納入了旋轉、平移和縮放的。其實offset Matrix取決于骨骼的初始位置，此時一般隻包含了平移（此時還沒有動畫，是以沒有旋轉和縮放），在動畫中，一般也以旋轉為主（是以大部分的動畫的關鍵幀用四元數表示）。在矩陣中都包含三種矩陣，是處于相容性考慮。

　　這兒就基于平移，做一個基本的蒙皮的計算過程，代碼主要依據于文章1：

仔細捋一捋上面的代碼，就可以了解整體的蒙皮變換的過程，當然，這兒隻用了矩陣變換中的平移變換，如果考慮加上旋轉和縮放，則回到最初的計算公式中了。至此，對于基本的骨骼動畫中的骨骼變換和蒙皮變換，有了一個詳細的解釋。下面說說Unity中是如何處理骨骼變換的。

2）關于蒙皮的新的了解

　在我寫完這篇文章後，給同僚檢視，同僚覺得較為繞，有點迷糊，後來我想了一下，可以采用一種較為清晰的方式重新講解一下蒙皮的過程：

　首先給出蒙皮計算的過程：頂點在模型坐标系中位置 -> 骨骼空間中位置 -> 變換後的骨骼空間中的位置->模型坐标系中的位置 -> 世界空間中的位置

　關于蒙皮的定義，其實質就是骨骼在動畫資料的驅動下，變換位置，依附于該骨骼的mesh頂點會對應的變換到新的位置（在世界空間中）的整個過程。

　确定最終結果： mesh上的頂點在世界空間中的位置變換到最新位置

　那麼怎麼得到這樣的一個結果？在前文中，我們已經知道，骨骼是和mesh分離的，骨骼依賴于根骨骼，層層遞進得到各自的轉換矩陣。而mesh是在模型模組化中，基于模型空間得到的位置設定。在這兒，根骨骼的空間原點和mesh的空間原點重合，也就是mesh的坐标系和根骨骼的坐标系為同一個坐标系，也就是模型坐标系。

　我們已經知道，骨骼本身就是一個坐标系空間，其原點就是關節點。那麼在模組化的時候，模組化軟體就會有一步計算操作，稱為BindingPos操作。這步操作可以這樣了解，mesh上分布了衆多的頂點，對應于單獨的一個骨骼，我們可以得到其骨骼空間的轉換矩陣，以及那些頂點依附于其上。對于依附其上的頂點，模組化的時候，以及基于模型空間給出了一個模型空間中的位置，那麼其相對于目前該骨骼空間的位置，可以基于模型空間位置與骨骼的轉換矩陣得到，這個位置就是其BindingPos，這個變換矩陣，就是BindingPosMatrix，基于這個矩陣，可以将頂點位置從模型空間轉換到骨骼空間。

到這兒，我們完成了：頂點在模型坐标系中位置 -> 骨骼空間中位置

　接下來我們繼續下面的計算，在骨骼動畫中，每個動畫資料中，會帶來目前骨骼的新的變化(旋轉為主)，那麼在目前動畫資料的驅動下，目前骨骼變換到新的位置，得到新的骨骼矩陣，那麼依附其上的頂點的位置也會變換，首先是将頂點位置從模型空間中轉換到目前該骨骼的空間中，然後基于骨骼的目前這次變換矩陣（比如旋轉90度對應的矩陣），得到其在該骨骼空間中的新位置，這個新的位置再和目前骨骼在和根骨骼的變換矩陣相作用，變換回模型空間中。

　到這兒，我們完成了：骨骼空間中位置 -> 變換後的骨骼空間中的位置->模型坐标系中的位置

接下來，就是模型坐标系到世界坐标系的變換，這個就不多說，就是一個MVP的轉換矩陣。

這樣，我們就完成了一次骨骼變換，依附其上的頂點的位置變換的整個過程，由點及面，整個蒙皮的過程就是一個大量該類變換的過程。當然，這兒還沒有說一個頂點受多個骨骼影響的情況，其實質也很簡單，就是一個頂點受到多個骨骼的影響，那麼就各自配置設定一個對應的權重，那麼在計算的時候，各自單獨計算，然後乘上權重系數，進行累加，就可以得到mesh上各個頂點的最新位置資訊。

三、Unity3D骨骼動畫處理

　　前面講解的對于骨骼動畫中的骨骼變換，蒙皮的計算，都是在CPU中進行的。在實際的遊戲引擎中，這些都是分開處理的，較為通用的處理是将骨骼的動畫資料驅動放在CPU中，計算出骨骼的變換矩陣，然後傳遞給GPU中進行蒙皮計算。在DX10的時候，一般的shader給出的寄存器的大小在128的大小，一個變換矩陣為4x4，如果去除最後一行(0,0,0,1)就可以用3個float表示，那麼最多可以表示，嗯，42個左右，如果考慮進行性能優化，不完全占用寄存器的大小，那麼一般會限制在30根骨骼的大小上。将這些骨骼的變換矩陣在CPU進行計算後，就可以封裝成skin info傳遞到GPU中。

在GPU的計算中，就會取出這些mesh上的頂點進行對應的位置計算，基于骨骼的轉換矩陣和骨骼的權重，得到最新的位置，進而進行一次頂點計算和描繪。之是以将骨骼動畫的兩個部分分開處理，一個原因就是CPU的處理能力相對而言沒有GPU快捷，一般一個模型的骨骼數量是較小的，但是mesh上的頂點數量較大，利用GPU的并行處理能力優勢，可以分擔CPU的計算壓力。

在DX11還是DX12之後（記不太清楚），骨骼變換矩陣的計算結果不再存儲在寄存器中，而是存儲在一個buffer中，這樣的buffer大小基于骨骼數量的大小在第一次計算的時候設定，之後每次骨骼動畫資料驅動得到新的變換矩陣，就依次更改對應的buffer中存儲的變換矩陣，這樣就不再受到寄存器的大小而限制骨骼的根數的大小。但是實際的優化中，都會盡量優化模型的骨骼的數量，畢竟數量越多，特别是影響頂點的骨骼數量越多，那麼計算量就會越大，正常的思維是優化骨骼數量而不是去擴充buffer的大小：D

在文章2中，對于GPU的蒙皮計算做了較大的性能優化，主要的思維也是這樣，在CPU中進行骨骼變換，将變換的結果傳遞到GPU中，進而進行蒙皮計算。基本的思維和前面說的變換思維一緻，其基本的優化重點也是想利用一個buffer來緩存變換矩陣，進而優化性能。這兒我就重點分析一下shader部分的代碼，其在cpu部分的代碼處理基本和前面的代碼思想一緻：

如果采用CPU的計算骨骼變換，那麼GPU的shader:

　　其優化的政策，就是用貼圖的方式來存儲這個變換矩陣，參看一下代碼吧：

　　總結：綜合整篇文章，對于骨骼動畫有了一個較為詳細的講解，主要是參考兩篇文章，我隻是做了一個知識的搬運工，今兒就寫到這兒，後面有更多的更新，會繼續回來更改。