摘要
無論一個類設計的多麼完美,在未來的需求演進中,都有可能會碰到一些無法預測的情況。那怎麼擴充已有的類呢?一般而言,繼承群組合是不錯的選擇。但是在objective-c 2.0中,又提供了category這個語言特性,可以動态地為已有類添加新行為。如今category已經遍布于objective-c代碼的各個角落,從apple官方的framework到各個開源架構,從功能繁複的大型app到簡單的應用,catagory無處不在。本文對category做了比較全面的整理,希望對讀者有所裨益。
簡介
本文作者來自美團酒店旅遊事業群ios研發組。我們緻力于創造價值、提升效率、追求卓越。歡迎大家加入我們(履歷請發送到郵箱[email protected])。
本文系學習objective-c的runtime源碼時整理所成,主要剖析了category在runtime層的實作原理以及和category相關的方方面面,内容包括:
初入寶地-category簡介
連類比事-category和extension
挑燈細覽-category真面目
追本溯源-category如何加載
旁枝末葉-category和+load方法
觸類旁通-category和方法覆寫
更上一層-category和關聯對象
1、初入寶地-category簡介
category是objective-c 2.0之後添加的語言特性,category的主要作用是為已經存在的類添加方法。除此之外,apple還推薦了category的另外兩個使用場景1
可以把類的實作分開在幾個不同的檔案裡面。這樣做有幾個顯而易見的好處,a)可以減少單個檔案的體積 b)可以把不同的功能組織到不同的category裡 c)可以由多個開發者共同完成一個類 d)可以按需加載想要的category 等等。
聲明私有方法
不過除了apple推薦的使用場景,廣大開發者腦洞大開,還衍生出了category的其他幾個使用場景:
模拟多繼承
把framework的私有方法公開
objective-c的這個語言特性對于純動态語言來說可能不算什麼,比如javascript,你可以随時為一個“類”或者對象添加任意方法和執行個體變量。但是對于不是那麼“動态”的語言而言,這确實是一個了不起的特性。
2、連類比事-category和extension
extension看起來很像一個匿名的category,但是extension和有名字的category幾乎完全是兩個東西。 extension在編譯期決議,它就是類的一部分,在編譯期和頭檔案裡的@interface以及實作檔案裡的@implement一起形成一個完整的類,它伴随類的産生而産生,亦随之一起消亡。extension一般用來隐藏類的私有資訊,你必須有一個類的源碼才能為一個類添加extension,是以你無法為系統的類比如nsstring添加extension。(詳見2)
但是category則完全不一樣,它是在運作期決議的。
就category和extension的差別來看,我們可以推導出一個明顯的事實,extension可以添加執行個體變量,而category是無法添加執行個體變量的(因為在運作期,對象的記憶體布局已經确定,如果添加執行個體變量就會破壞類的内部布局,這對編譯型語言來說是災難性的)。
3、挑燈細覽-category真面目
我們知道,所有的oc類和對象,在runtime層都是用struct表示的,category也不例外,在runtime層,category用結構體category_t(在objc-runtime-new.h中可以找到此定義),它包含了
1)、類的名字(name)
2)、類(cls)
3)、category中所有給類添加的執行個體方法的清單(instancemethods)
4)、category中所有添加的類方法的清單(classmethods)
5)、category實作的所有協定的清單(protocols)
6)、category中添加的所有屬性(instanceproperties)
從category的定義也可以看出category的可為(可以添加執行個體方法,類方法,甚至可以實作協定,添加屬性)和不可為(無法添加執行個體變量)。
ok,我們先去寫一個category看一下category到底為何物:
myclass.h:
myclass.m:
我們使用clang的指令去看看category到底會變成什麼:
好吧,我們得到了一個3m大小,10w多行的.cpp檔案(這絕對是apple值得吐槽的一點),我們忽略掉所有和我們無關的東西,在檔案的最後,我們找到了如下代碼片段:
我們可以看到,
1)、首先編譯器生成了執行個體方法清單objc$_category_instance_methodsmyclass$_myaddition和屬性清單objc$_prop_listmyclass$_myaddition,兩者的命名都遵循了公共字首+類名+category名字的命名方式,而且執行個體方法清單裡面填充的正是我們在myaddition這個category裡面寫的方法printname,而屬性清單裡面填充的也正是我們在myaddition裡添加的name屬性。還有一個需要注意到的事實就是category的名字用來給各種清單以及後面的category結構體本身命名,而且有static來修飾,是以在同一個編譯單元裡我們的category名不能重複,否則會出現編譯錯誤。
2)、其次,編譯器生成了category本身objc$_categorymyclass$_myaddition,并用前面生成的清單來初始化category本身。
3)、最後,編譯器在data段下的objc_catlist section裡儲存了一個大小為1的category_t的數組l_objc_labelcategory$(當然,如果有多個category,會生成對應長度的數組^_^),用于運作期category的加載。
到這裡,編譯器的工作就接近尾聲了,對于category在運作期怎麼加載,我們下節揭曉。
4、追本溯源-category如何加載
我們知道,objective-c的運作是依賴oc的runtime的,而oc的runtime和其他系統庫一樣,是os x和ios通過dyld動态加載的。
想了解更多dyld地同學可以移步這裡(3)。
對于oc運作時,入口方法如下(在objc-os.mm檔案中):
category被附加到類上面是在map_images的時候發生的,在new-abi的标準下,_objc_init裡面的調用的map_images最終會調用objc-runtime-new.mm裡面的_read_images方法,而在_read_images方法的結尾,有以下的代碼片段:
首先,我們拿到的catlist就是上節中講到的編譯器為我們準備的category_t數組,關于是如何加載catlist本身的,我們暫且不表,這和category本身的關系也不大,有興趣的同學可以去研究以下apple的二進制格式和load機制。
略去printconnecting這個用于log的東西,這段代碼很容易了解:
1)、把category的執行個體方法、協定以及屬性添加到類上
2)、把category的類方法和協定添加到類的metaclass上
值得注意的是,在代碼中有一小段注釋 / || cat->classproperties /,看來蘋果有過給類添加屬性的計劃啊。
ok,我們接着往裡看,category的各種清單是怎麼最終添加到類上的,就拿執行個體方法清單來說吧:
在上述的代碼片段裡,addunattachedcategoryforclass隻是把類和category做一個關聯映射,而remethodizeclass才是真正去處理添加事宜的功臣。
而對于添加類的執行個體方法而言,又會去調用attachcategorymethods這個方法,我們去看下attachcategorymethods:
attachcategorymethods做的工作相對比較簡單,它隻是把所有category的執行個體方法清單拼成了一個大的執行個體方法清單,然後轉交給了attachmethodlists方法(我發誓,這是本節我們看的最後一段代碼了^_^),這個方法有點長,我們隻看一小段:
需要注意的有兩點:
1)、category的方法沒有“完全替換掉”原來類已經有的方法,也就是說如果category和原來類都有methoda,那麼category附加完成之後,類的方法清單裡會有兩個methoda
2)、category的方法被放到了新方法清單的前面,而原來類的方法被放到了新方法清單的後面,這也就是我們平常所說的category的方法會“覆寫”掉原來類的同名方法,這是因為運作時在查找方法的時候是順着方法清單的順序查找的,它隻要一找到對應名字的方法,就會罷休^_^,殊不知後面可能還有一樣名字的方法。
5、旁枝末葉-category和+load方法
我們知道,在類和category中都可以有+load方法,那麼有兩個問題:
1)、在類的+load方法調用的時候,我們可以調用category中聲明的方法麼?
2)、這麼些個+load方法,調用順序是咋樣的呢?
鑒于上述幾節我們看的代碼太多了,對于這兩個問題我們先來看一點直覺的:

我們的代碼裡有myclass和myclass的兩個category (category1和category2),myclass和兩個category都添加了+load方法,并且category1和category2都寫了myclass的printname方法。
在xcode中點選edit scheme,添加如下兩個環境變量(可以在執行load方法以及加載category的時候列印log資訊,更多的環境變量選項可參見objc-private.h):

運作項目,我們會看到控制台列印很多東西出來,我們隻找到我們想要的資訊,順序如下:
objc[1187]: replaced: -[myclass printname] by category category1
objc[1187]: replaced: -[myclass printname] by category category2
.
objc[1187]: load: class 'myclass' scheduled for +load
objc[1187]: load: category 'myclass(category1)' scheduled for +load
objc[1187]: load: category 'myclass(category2)' scheduled for +load
objc[1187]: load: +[myclass load]
objc[1187]: load: +[myclass(category1) load]
objc[1187]: load: +[myclass(category2) load]
是以,對于上面兩個問題,答案是很明顯的:
1)、可以調用,因為附加category到類的工作會先于+load方法的執行
2)、+load的執行順序是先類,後category,而category的+load執行順序是根據編譯順序決定的。
目前的編譯順序是這樣的:

我們調整一個category1和category2的編譯順序,run。ok,我們可以看到控制台的輸出順序變了:

雖然對于+load的執行順序是這樣,但是對于“覆寫”掉的方法,則會先找到最後一個編譯的category裡的對應方法。
這一節我們隻是用很直覺的方式得到了問題的答案,有興趣的同學可以繼續去研究一下oc的運作時代碼。
6、觸類旁通-category和方法覆寫
鑒于上面幾節我們已經把原理都講了,這一節隻有一個問題:
怎麼調用到原來類中被category覆寫掉的方法?
對于這個問題,我們已經知道category其實并不是完全替換掉原來類的同名方法,隻是category在方法清單的前面而已,是以我們隻要順着方法清單找到最後一個對應名字的方法,就可以調用原來類的方法:
7、更上一層-category和關聯對象
如上所見,我們知道在category裡面是無法為category添加執行個體變量的。但是我們很多時候需要在category中添加和對象關聯的值,這個時候可以求助關聯對象來實作。
myclass+category1.h:
myclass+category1.m:
但是關聯對象又是存在什麼地方呢? 如何存儲? 對象銷毀時候如何處理關聯對象呢?
我們去翻一下runtime的源碼,在objc-references.mm檔案中有個方法_object_set_associative_reference:
我們可以看到所有的關聯對象都由associationsmanager管理,而associationsmanager定義如下:
associationsmanager裡面是由一個靜态associationshashmap來存儲所有的關聯對象的。這相當于把所有對象的關聯對象都存在一個全局map裡面。而map的的key是這個對象的指針位址(任意兩個不同對象的指針位址一定是不同的),而這個map的value又是另外一個associationshashmap,裡面儲存了關聯對象的kv對。
而在對象的銷毀邏輯裡面,見objc-runtime-new.mm:
嗯,runtime的銷毀對象函數objc_destructinstance裡面會判斷這個對象有沒有關聯對象,如果有,會調用_object_remove_assocations做關聯對象的清理工作。
後記
正如侯捷先生所講-“源碼面前,了無秘密”,apple的cocoa touch架構雖然并不開源,但是objective-c的runtime和core foundation卻是完全開放源碼的(在http://www.opensource.apple.com/tarballs/可以下載下傳到全部的開源代碼)。
本系列runtime源碼學習将會持續更新,意猶未盡的同學可以自行到上述網站下載下傳源碼學習。行筆簡陋,如有錯誤,望指正。
發現文章有錯誤、對内容有疑問,都可以關注美團點評技術團隊微信公衆号(meituantech),在背景給我們留言。我們每周會挑選出一位熱心小夥伴,送上一份精美的小禮品。快來掃碼關注我們吧!