天天看點

深入了解領域驅動設計中的聚合聚合解決的核心問題是什麼聚合劃分的原則實作方面的考慮總結

深入了解領域驅動設計中的聚合聚合解決的核心問題是什麼聚合劃分的原則實作方面的考慮總結

免費報名參加研發效能峰會:

developer.aliyun.com/topic/n2021?channel=yy_other

聚合模式是 DDD 的模式結構中較為難于了解的一個,也是 DDD 學習曲線中的一個關鍵障礙。合理地設計聚合,能清晰地表述業務一緻性,也更容易帶來清晰的實作,設計不合理的聚合,甚至在設計中沒有聚合的概念,則相反。

聚合的概念并不複雜。本文希望能回到聚合的本質,對聚合的定義和實操給出一些有價值的建議。

聚合解決的核心問題是什麼

我們先來看一下在 DDD Reference 中關于聚合的定義。

将實體和值對象劃分為聚合并圍繞着聚合定義邊界。選擇一個實體作為每個聚合的根,并僅允許外部對象持有對聚合根的引用。作為一個整體來定義聚合的屬性和不變量,并把其執行責任賦予聚合根或指定的架構機制。

這是典型的“模式語言”,說明了聚合是什麼,聚合根(aggregation root)是什麼,以及如何使用聚合。但是,模式語言的問題在于過度精煉,如果讀者已經熟悉了這種模式,很容易看懂,但是最需要看懂的、那些尚不夠熟悉這些概念的人,卻容易感到不知所雲。為了能深入了解一個模式的本質,我們還是要回到它試圖解決的核心問題上來。

在軟體架構領域有一句名言:

“架構并不由系統的功能決定,而是由系統的非功能屬性決定”。

這句話直白的解釋就是:假如不考慮性能、健壯性、可移植性、可修改性、開發成本、時間限制等因素,用任何的架構、任何的方法,系統的功能總是可以實作的,項目總是能開發完成的,隻是開發時間、以後的維護成本、功能擴充的容易程度不同罷了。

當然現實決非如此。我們總是希望系統在可了解、可維護、可擴充等方面表現良好,進而多快好省的達成系統背後的業務目标。但是,在現實中,不合理的設計方法有可能增加系統的複雜性。我們先來看一個例子:

假設問題領域是一個企業内部的辦公用品采購系統。

  • 企業的員工可以通過該系統送出一個采購請求,一個請求包含了若幹數量、若幹類型的辦公用品(稱為采購項)。(1)
  • 主管負責對采購申請進行審批。(2)
  • 審批通過後,系統會根據提供商不同,生成若幹訂單。(3)

對同一個問題,存在若幹種不同的設計思路,例如以資料庫為中心的設計、面向對象的設計和“正确的 OO”的 DDD 的設計。

如果采用以資料庫為中心的模組化方式,首先會進行資料庫設計——我确實看到還有許多團隊仍然在采取這種方法,花費大量的時間進行資料庫結構的讨論。為了避免圖表過大,我們僅僅給出了和采購申請相關的表格。結構如下圖所示:

深入了解領域驅動設計中的聚合聚合解決的核心問題是什麼聚合劃分的原則實作方面的考慮總結

圖1 資料庫視角下的設計

如果直接在資料庫這麼低的設計層次上考慮問題,除了資料庫的設計繁瑣易錯,更重要的是會面臨一些比較複雜的業務規則和資料一緻性保證的問題。例如:

  • 如果采購請求被删除,則相應的和該采購請求相關的采購項以及它們之間的關聯都需要被删除——在資料庫設計中,這種限制可以通過資料庫外鍵來保證。
  • 如果多個使用者在對具有相關關系的資料進行并發處理,則可能涉及到複雜的鎖定機制。例如,如果審批者正在對采購請求進行審批,而采購送出者正在對采購項進行修改,則就有可能導緻稽核的資料是過期資料,或者導緻采購項更新的失敗。
  • 如果同時更新某些相關聯的資料,也可能面臨部分更新成功導緻的問題——在資料庫設計中,這類限制則需要通過 transaction 來保證。

确實,每個問題都是有解決方案的,但是,第一,對于模型的讨論過早地進入了實作領域,和業務概念脫開了聯系,不便于持續地和業務人員協作;第二,技術細節和業務規則的細節糾纏在一起,很容易顧此失彼。有沒有一種方案,可以讓我們更多的聚焦于問題領域,而不是深陷到這種技術細節中?

面向對象技術和 ORM(對象-關系映射)有助于我們提高問題的抽象層級。在面向對象的世界中,我們看到的結構是這樣的:

深入了解領域驅動設計中的聚合聚合解決的核心問題是什麼聚合劃分的原則實作方面的考慮總結

圖2 傳統OO視角下的設計

面向對象的方式提高了抽象層級,忽略了不必要的技術細節,例如已經不需要關心外鍵、關聯表這些技術細節了。我們需要關心的模型元素的數量減少了,複雜性也相應減少了。隻是,業務規則如何保證,在傳統的面向對象方法中并沒有嚴格的實作限制。例如:

從業務角度來看,如果采購申請的審批已經通過,對采購申請的采購項進行再次更新應該是非法的。但是,在面向對象的世界中,你缺沒法阻止程式員寫出這樣的代碼:

...
    PurchaseRequest purchaseRequest = getPurchaseRequest(requestId);
    PurchaseItem item = purchaseRequest.getItem(itemId);
    item.setQuantity(1000);
    savePurchaseItem(item);      

語句 1 取得了一個采購申請的執行個體;語句 2 取得了該申請中的一個條目。語句 3 和 4 修改了采購申請條目并儲存。假如采購申請已經審批通過,這種修改豈不是可以輕易突破采購申請的預算?

當然,程式員可以在代碼中加入邏輯檢查來保證一緻性:在修改或儲存申請條目前總是檢查

purchaseRequest

的狀态,如果狀态不為草稿就禁止修改。但是,考慮到

PurchaseItem

對象可以在代碼的任何位置被取出來,且可能在不同的方法間傳遞,如果 OO 設計不當,就可能導緻該業務邏輯分散到各處。沒有設計限制,這種檢查的實作并不是一件容易的事情。

讓我們回到本質思考:采購項如果脫離采購請求,它自身的單獨存在有價值嗎?——沒有價值。如果沒有價值:名義上看起來對采購項的修改,本質上是對采購項的修改嗎?還是本質上其實是對采購請求的修改?

如果我們認可“修改采購項也是修改采購請求”這個結論,那麼我們就不應該分開來研究采購項和采購請求,而是應該如下圖所示:

深入了解領域驅動設計中的聚合聚合解決的核心問題是什麼聚合劃分的原則實作方面的考慮總結

圖3 用聚合封裝對象

我們把“采購請求”和“采購項”組織到一起,看做一個更大的整體,稱為“聚合”。這個聚合内部的業務邏輯,例如“采購申請稽核通過後,不得對采購申請條目進行更改”,應內建于聚合内部。為了實作這一目标,我們約定:對采購項的一切操作(增加、删除、修改等),都是對采購請求對象的操作。

也就是說:在 DDD 的世界中,從來就不應該存在

savePurchaseItem()

這種方法,而應以

purchaseRequest.modifyPurchaseItem()

purchaseRequestRepository.save(purchaseRequest)

取代之。

在新的對象關系中,采購申請負責“把守關隘”(即“聚合根”),采購條目成為了聚合的内部資料。由于聚合現在已經是一個整體,與其相關的操作隻能通過采購申請對象進行,業務一緻性就可以得到保證。這事實上也是關于對象之間關系的更精确的描述:雖然采購申請和采購項都被模組化為對象,但是它們的地位是不對等的。采購項是從屬于采購申請的對象,它們隻有是一個整體才有意義。

聚合的本質就是建立了一個比對象粒度更大的邊界,聚集那些緊密關聯的對象,形成了一個業務上的對象整體。使用聚合根作為對外的互動入口,進而保證了多個互相關聯的對象的一緻性。合理使用聚合,可以更容易地保證業務規則的一緻性,減少了對象之間可能的耦合,提升設計的可了解性,降低出問題的可能性。

是以,通過把對象組織為聚合,在基本的對象層次之上構造了一層新的封裝。封裝簡化了概念,隐藏了細節,在外部需要關心的模型元素數量進一步減少,複雜性下降。 但是,封裝邊界的引入也引發了一個新的問題,例如:商品資訊也是采購項的有效部分,應不應該把商品也放入“采購請求”這個聚合呢?送出人和審批人是不是也該放入聚合呢?如果要便利地獲得業務規則的一緻性,那豈不是把一切存在業務關聯的對象都應該放在一起更好?如果有些對象應該放入聚合,有些不應該放入聚合,那麼是否存在一個清晰的指導原則?本文在下一節回答這個問題。

聚合劃分的原則

聚合作為 DDD 的對象體系中的一層,也同樣應該遵循高内聚、低耦合的原則。本文認為,聚合邊界内的對象應滿足如下的啟發式規則:

  1. 生命周期一緻性
  2. 問題域一緻性
  3. 場景頻率一緻性
  4. 聚合内的元素盡可能少

生命周期一緻性是指聚合邊界内的對象,和聚合根之間存在“人身依附”關系。即:如果聚合根消失,聚合内的其他元素都應該同時消失。例如,在前述例子中,如果聚合根(采購請求)不存在了,那麼采購項當然也就失去了存在的意義。而商品、作為申請人的使用者等對象,和采購請求之間則不存在此關系。

可以用反證法來證明生命周期一緻性:如果一個對象在聚合根消失之後仍然有意義,那麼說明在系統中必然需要存在其他方法通路該對象。這和聚合的定義相沖突。是以聚合根内的其他元素必然在聚合根消失後失效。違反生命周期一緻性,也會同時帶來實作上的嚴重問題。讓我們一起看一個例子:

public class PurchaseRequest {
    private Set<PurchaseItem> items;
    private User submitter;
    ...
}      

其中 User 對象的生命周期和采購申請不一緻。現在假如有兩段程式代碼并行執行:

  • 代碼 1(例如采購申請的修改)獲得了某個采購申請的對象,對該對象進行了修改,進行儲存。注意由于 User 對象嵌入到了 PurchaseRequest 中,User 對象也會被同時儲存。
r = purchaseRequestRepository.findOne(id);
//...一些修改
purchaseRequestRepository.save(r);      
  • 代碼 2(例如是使用者管理),獲得了該對象對應的審批人的資訊,也進行了修改。
User user = userRepo.findOne(r.getSubmitter().getId());
//...一些修改
userRepo.save(user);      

這将會導緻一種完全不可接受的後果:對于 User 對象的修改不确定性!是以,對于那些說不清楚是否應該劃入同一個聚合的對象,不妨問一下:這個對象如果離開本聚合的上下文,是否還有單獨存在的價值?如果答案是肯定的,該對象就不應該劃到本聚合中:

  • Submitter/Approver 對應的 User 對象脫離了 PurchaseRequest,仍然有單獨存在的理由;
  • Product 對象脫離了 PurchaseRequest,是可以單獨存在的;

    是以以上兩個對象都不屬于采購申請這個聚合。

第二個原則是問題域一緻性。事實上問題域一緻是限界上下文(Bounded Context)的限制。聚合作為一種戰術模式,所表示的模型一定會位于同一個限界上下文之内。

雖然原則一說明了對象的生命周期一緻性可作為聚合劃分的依據,但是什麼是”一個對象脫離另外一個對象是否有存在的意義“,有時候可能會存在争議。例如:如果采購申請被删除,那麼根據此采購申請生成的訂單是否有價值?(由于訂單這個例子可能會陷入另外一種争論,它可以從業務流程上規避:隻要訂單存在,采購申請就不能删除),讓我們換一個非常近似的例子:

一個線上論壇,使用者可以對論壇上使用者的文章發表評論。文章顯然應該是一個聚合根。如果文章被删除,那麼,使用者的評論看起來也要同時消失。那麼評論是否可以屬于文章這個聚合?

現在讓我們來考慮評論是否還可能有其他的用途。例如,一個圖書網站,使用者可以對圖書發表評論。如果隻是因為文章删除和評論删除之間存在邏輯上的關聯,就讓文章聚合持有評論對象,那麼顯然就限制了評論的适用範圍。一目了然的事實是,評論這一個概念,在本質上和文章這個概念相去甚遠。是以,我們得到了一個新的、淩駕于原則 1 之上的原則——不屬于同一個問題域的對象,不應該出現在同一個聚合中。對 DDD 熟悉的朋友可能知道,這在 DDD 中對應于限界上下文這一戰略模式。限于文章篇幅,我們在此不過多展開。

深入了解領域驅動設計中的聚合聚合解決的核心問題是什麼聚合劃分的原則實作方面的考慮總結

圖4 問題域一緻性

由于聚合根無法保證聚合之外的一緻性,是以我們需要依賴”最終一緻性“來實作聚合之間的一緻性。例如,在文章删除的時候,發送一個文章删除的消息。評論系統接收到文章删除消息之後,删除文章對應的評論。

依賴于前述兩個原則已經能夠區分出大多數聚合。但是,仍然會存在一些比較複雜的情況。例如,考慮軟體開發中的“産品”和“版本”以及“功能”的關系。“産品”和“版本”算不算是同一個問題域?——這幾個概念之間的關系可能就不如“文章”和“評論”那麼清晰。不過不要緊,我們仍然有一個啟發式規則來規避這種模糊性。這就是“場景頻率一緻性”原則。

場景(scenario)是業務用例的具體化描述,反應了使用者使用系統達成業務目标的方式。我們可以觀察這些場景中涉及的領域對象操作,如對領域對象的檢視、修改等。場景操作頻率的一緻性是同一聚合内部對象的一個關鍵表征。經常被同時操作的對象,它們往往屬于同一個聚合。而那些極少被同時關注的對象,一般不應該劃為一個聚合。

以下圖所示的“産品”、“版本”和“功能”這三個概念為例來說明。産品确實包含了很多功能,這些功能通過一系列的版本釋出。但是,在産品層面的操作,例如檢視所有的産品清單,卻并不需要關心特定功能的詳細資訊,也不需要了解特定的某個版本資訊。我們做版本規劃的時候,确實會用到功能清單,但是大多數時候我們并不會去檢視功能詳情,更加不可能在做版本規劃的時候修改功能描述。

深入了解領域驅動設計中的聚合聚合解決的核心問題是什麼聚合劃分的原則實作方面的考慮總結

圖5 不合适的聚合

根據這一原則,我們劃分出了如下的三個聚合:

深入了解領域驅動設計中的聚合聚合解決的核心問題是什麼聚合劃分的原則實作方面的考慮總結

圖6 更合理的聚合

基于場景一緻性劃分聚合,對于實作也有很大好處。不在同一個場景下操作的對象,放入同一個聚合意味着每次操作一個對象,就需要把其他對象的所有資訊抓取到,這是非常沒有意義的。從實作層次,如果不緊密相關的對象出現在同一個聚合中,會導緻它們經常在不同的場景中被并發修改,也增加了這些對象之間沖突的可能性。是以:操作場景不一緻的對象,或者說如果一個對象在不同場景下都會被使用,應該考慮把它們分到不同的聚合中。

盡量小的聚合

聚合出現的本質是解決一緻性問題帶來的複雜性。是以,那麼凡是不破壞以上三個一緻性的情況,都沒有必要把它們放到同一個聚合中。僅僅由一個業務概念(即領域模型中的類名及屬性以及後面馬上提到的 Id 對象)構成的聚合在面向對象的世界中是大多數。

根據上述分析,在采購申請的例子中,采購申請、采購申請的一些屬性(如狀态、送出時間等)以及采購項屬于一個聚合。但是,商品、使用者這些不能屬于采購申請這個聚合。這些聚合之間如何關聯起來呢?我們引入一種新的值對象來解決這個問題,如下圖所示。圖中也順便标記了各對象是值對象還是實體對象。

深入了解領域驅動設計中的聚合聚合解決的核心問題是什麼聚合劃分的原則實作方面的考慮總結

圖7 精化後的聚合封裝

在采購請求這個聚合中,除了采購請求聚合根是實體對象外,其他對象,包括作為對外引用的 Id 對象都是值對象。

對應的代碼如下:

public class PurchaseRequest {
    private Set<PurchaseItem> items;
    private UserId submitterId;
    ...
}
public class PurchaseItem extends ValueObject{
    private ProductId product;
    private Integer quantity;
    ...
}      

Id 值對象的引入是一個值得讨論的問題。

首先,Id 值對象的引入能斷開聚合,能加快查詢的速度,但是它不可避免的會導緻某些場景下,需要對資訊進行第二次查詢,而且無法利用 ORM 的 EagerFetch/LazyFetch 加載機制的周遊。這是一種損失嗎?簡單地回答是:不是損失。不要貪圖不屬于一個聚合的對象層次嵌套帶來的所謂便利——它引起的麻煩要遠遠多于帶來的益處。這類問題應該由外部服務,例如應用層服務來完成。

其次,為了斷開聚合而額外引入的 Id 值對象,還能算是領域模型或者是 “統一語言” 的一部分嗎?我對這一問題的解釋是:這是 DDD 的實作機制的一部分,它屬于領域模型,但是請把可見性控制在開發團隊。

沒有必要和業務人員溝通這些概念。僅僅使用問題域識别出的實體、值對象、領域服務和領域事件和業務人員進行溝通。Id 值對象、資源庫和工廠以及聚合、聚合根這些概念留給實作人員自己了解和在實作中使用就可以了。它們仍然是領域模型的一部分,它們的存在也仍然是統一語言的一部分,但是正如視圖可以有選擇地忽略部分資訊一樣,這些概念應該在和業務人員的溝通以及業務描述時忽略。

第三,請注意這個 Id 對象引用的隻能是其他聚合根的 Id。由于隻有聚合根才可能會被外部引用,是以聚合根的 ID 應該做到全局唯一。聚合内部的對象,無論是實體對象還是值對象,都隻需要保證内部的 ID 唯一即可。

實作方面的考慮

資源庫、工廠面向聚合定義

工廠(Factory)模式、資源庫(Repository)模式都是 DDD 在實作次元的模式。盡管在 DDD Reference 給出的模式關系圖中,工廠、資源庫除了與聚合之間有連接配接之外,與實體之間也有連接配接,甚至工廠和值對象之間也有連接配接,但是,本文認為,這些連接配接的強度是不同的,價值也是不同的。

工廠模式的存在顯然是為了分離對象的構造與使用,但是在 DDD 的上下文中,它包含了更深層面的意義。聚合内部的對象直接的關系可能是複雜的,業務一緻性是需要保證的,那麼使用工廠來構造聚合對象是一種更好的對複雜性的封裝。誠然,工廠模式對于非聚合跟的複雜的體對象和值對象的構造也有價值,但這隻是設計或者實作層面的事情,和業務模型扯不上什麼關系。

盡管聚合的工廠和一般對象的工廠都是以工廠模式同名,但是 DDD 以聚合為基本機關設計的 Factory 對于簡化系統的複雜性具有更重要的意義。從設計限制上,在聚合以外,隻應該有一個工廠對外可見,那就是聚合的工廠。(領域事件的 Factory 也是有意義的,領域事件離本文的話題稍遠,暫且不做讨論)。

資源庫模式也絕非隻是意味着持久化,更不是資料庫通路層,是以不要誤解。資源庫更重要的意義是:資源庫是聚合的倉儲機制,外部世界通過資源庫,而且隻能通過資源庫來完成對聚合的通路。資源庫以聚合的整體管理對象。是以,從設計限制上,一個聚合隻能有一個資源庫對象,那就是以聚合根命名的資源庫。除此之外的其他對象,都不應該提供資源庫對象。

深入了解領域驅動設計中的聚合聚合解決的核心問題是什麼聚合劃分的原則實作方面的考慮總結

圖8 聚合和資源庫

代碼結構與聚合保持一緻

細心的讀者肯定已經發現了,在上圖中包的組織方式也是和聚合一緻的,并且使用了聚合根的名字作為包名。這是我本人組織代碼時的慣用方式,把聚合作為代碼的一個層級(之上當然存在其他層級,例如限界上下文、子產品等),把所有屬于該聚合的實體(包含聚合根)對象、值對象、資源庫、工廠等都放入到同一個代碼包中。代碼結構和領域模型的結構高度一緻,可以降低表示差距,更好的管理對象世界的複雜性。

聚合不可跨越部署的邊界

部署的邊界是一個複雜的話題,本文僅就和聚合有關的内容進行讨論。首先,如果系統采用了微服務架構,應該保持部署邊界和限界上下文邊界的一緻——不要讓部署的粒度大于限界上下文的粒度,這樣可以帶來更好的業務靈活性和可伸縮性。其次,從服務的最小邊界上,不可讓最小邊界小于聚合的粒度,否則會帶來大量的資料的一緻性問題——因為微服務之間的一緻性一般需要通過最終一緻性來保證,如果聚合跨越了部署邊界将會是一緻性的災難。曾經在某些書上看到一些關于關于微服務劃分的不甚合理的建議,例如把對每一個對象的增删改查都做成一個服務。這種建議在我看來是錯誤的。

聚合改進了系統性能和可伸縮性

很多人會為 ORM 機制中低效的查詢所困擾。為什麼會這樣?看一下前面的例子就明白了。我們為前述的不正确的聚合的例子加上 Spring JPA 的 Annotation:

public class PurchaseRequest {
    @OneToMany(cascade = CascadeType.ALL, fetch = FetchType.EAGER)
    private Set<PurchaseItem> items;
    @OneToOne(cascade = CascadeType.ALL, fetch = FetchType.EAGER)
    private User submitter;
    ...
}      

由于缺乏聚合的概念,或者不正确的做了一個超大的聚合,那麼每次對 PurchaseRequest 的查詢,都需要從系統抓取大量的對象,耗費了大量的計算資源——也許 User 自己也是一個超大的對象呢?“拔出蘿蔔帶出泥”,性能自然不可能好。

也許有讀者會說,我不用 Eager Fetch,我可以用 Lazy Fetch 啊。是的,這确實對性能上更好一些,但是不幸的是,資料通路的上下文将不得不一直保留,系統出錯的機率大大增加,也給分布式設計帶來了不便。

小的聚合就完全沒有這個問題了——在這種情形下,每個涉及通路的對象(事實上就是聚合)不可能很大,而所需的資料又恰如其分的都在,資料完整性和業務完整性就有了保障,還可以友善地進行水準擴充,性能和可伸縮性也就同時得到了滿足。

總結

模組化是我們了解現實世界,簡化問題複雜性的方法之一。聚合作為領域模組化的一個層次,通過恰如其分的邊界,實作了資訊隐藏、提高了抽象層級,封裝了緊密關聯的業務邏輯,保證了系統資料的一緻性,改進了系統的性能。

本文讨論了聚合的定義和價值,概括的說:

  • 聚合是面向對象的世界中模組化的一個層次。它隐藏了細粒度對象,限制了對象之間的耦合。
  • 聚合是一緻性的邊界,是對具有緊密關聯關系的對象的封裝。聚合封裝了實體對象和值對象,并且采用其中最重要的一個實體對象作為聚合根。聚合根作為聚合的唯一外部入口,保證了業務規則和資料的一緻性。

本文也探讨了關于聚合識别的四條啟發式規則,具體是:

從實作角度,資源庫、工廠的粒度應該和聚合的粒度一緻,代碼結構和部署結構也可以和聚合對齊。實作和領域模型保持一緻,這也是領域驅動設計作為正确的 OO 的目标和價值所在。

作者簡介:張剛,軟體工程博士,阿裡雲雲效資深技術專家,ALPD方法學核心成員。