大型網站架構系列：消息隊列

一、消息隊列概述

消息隊列中間件是分布式系統中重要的元件，主要解決應用耦合，異步消息，流量削鋒等問題。實作高性能，高可用，可伸縮和最終一緻性架構。是大型分布式系統不可缺少的中間件。

目前在生産環境，使用較多的消息隊列有ActiveMQ，RabbitMQ，ZeroMQ，Kafka，MetaMQ，RocketMQ等。

二、消息隊列應用場景

以下介紹消息隊列在實際應用中常用的使用場景。異步處理，應用解耦，流量削鋒和消息通訊四個場景。

2.1異步處理

場景說明：使用者注冊後，需要發注冊郵件和注冊短信。傳統的做法有兩種1.串行的方式；2.并行方式。

（1）串行方式：将注冊資訊寫入資料庫成功後，發送注冊郵件，再發送注冊短信。以上三個任務全部完成後，傳回給用戶端。

（2）并行方式：将注冊資訊寫入資料庫成功後，發送注冊郵件的同時，發送注冊短信。以上三個任務完成後，傳回給用戶端。與串行的差别是，并行的方式可以提高處理的時間。

假設三個業務節點每個使用50毫秒鐘，不考慮網絡等其他開銷，則串行方式的時間是150毫秒，并行的時間可能是100毫秒。

因為CPU在機關時間内處理的請求數是一定的，假設CPU1秒内吞吐量是100次。則串行方式1秒内CPU可處理的請求量是7次（1000/150）。并行方式處理的請求量是10次（1000/100）。

小結：如以上案例描述，傳統的方式系統的性能（并發量，吞吐量，響應時間）會有瓶頸。如何解決這個問題呢？

引入消息隊列，将不是必須的業務邏輯，異步處理。改造後的架構如下：

按照以上約定，使用者的響應時間相當于是注冊資訊寫入資料庫的時間，也就是50毫秒。注冊郵件，發送短信寫入消息隊列後，直接傳回，是以寫入消息隊列的速度很快，基本可以忽略，是以使用者的響應時間可能是50毫秒。是以架構改變後，系統的吞吐量提高到每秒20 QPS。比串行提高了3倍，比并行提高了兩倍。

2.2應用解耦

場景說明：使用者下單後，訂單系統需要通知庫存系統。傳統的做法是，訂單系統調用庫存系統的接口。如下圖：

傳統模式的缺點：

1）假如庫存系統無法通路，則訂單減庫存将失敗，進而導緻訂單失敗；

2）訂單系統與庫存系統耦合；

如何解決以上問題呢？引入應用消息隊列後的方案，如下圖：

訂單系統：使用者下單後，訂單系統完成持久化處理，将消息寫入消息隊列，傳回使用者訂單下單成功。
庫存系統：訂閱下單的消息，采用拉/推的方式，擷取下單資訊，庫存系統根據下單資訊，進行庫存操作。
假如：在下單時庫存系統不能正常使用。也不影響正常下單，因為下單後，訂單系統寫入消息隊列就不再關心其他的後續操作了。實作訂單系統與庫存系統的應用解耦。

2.3流量削鋒

流量削鋒也是消息隊列中的常用場景，一般在秒殺或團搶活動中使用廣泛。

應用場景：秒殺活動，一般會因為流量過大，導緻流量暴增，應用挂掉。為解決這個問題，一般需要在應用前端加入消息隊列。

可以控制活動的人數；
可以緩解短時間内高流量壓垮應用；

使用者的請求，伺服器接收後，首先寫入消息隊列。假如消息隊列長度超過最大數量，則直接抛棄使用者請求或跳轉到錯誤頁面；
秒殺業務根據消息隊列中的請求資訊，再做後續處理。

2.4日志處理

日志處理是指将消息隊列用在日志進行中，比如Kafka的應用，解決大量日志傳輸的問題。架構簡化如下：

日志采集用戶端，負責日志資料采集，定時寫受寫入Kafka隊列；
Kafka消息隊列，負責日志資料的接收，存儲和轉發；
日志處理應用：訂閱并消費kafka隊列中的日志資料；

以下是新浪kafka日志處理應用案例：

轉自（http://cloud.51cto.com/art/201507/484338.htm）

(1)Kafka：接收使用者日志的消息隊列。

(2)Logstash：做日志解析，統一成JSON輸出給Elasticsearch。

(3)Elasticsearch：實時日志分析服務的核心技術，一個schemaless，實時的資料存儲服務，通過index組織資料，兼具強大的搜尋和統計功能。

(4)Kibana：基于Elasticsearch的資料可視化元件，超強的資料可視化能力是衆多公司選擇ELK stack的重要原因。

2.5消息通訊

消息通訊是指，消息隊列一般都内置了高效的通信機制，是以也可以用在純的消息通訊。比如實作點對點消息隊列，或者聊天室等。

點對點通訊：

用戶端A和用戶端B使用同一隊列，進行消息通訊。

聊天室通訊：

用戶端A，用戶端B，用戶端N訂閱同一主題，進行消息釋出和接收。實作類似聊天室效果。

以上實際是消息隊列的兩種消息模式，點對點或釋出訂閱模式。模型為示意圖，供參考。

三、消息中間件示例

3.1電商系統

消息隊列采用高可用，可持久化的消息中間件。比如Active MQ，Rabbit MQ，Rocket Mq。（1）應用将主幹邏輯處理完成後，寫入消息隊列。消息發送是否成功可以開啟消息的确認模式。（消息隊列傳回消息接收成功狀态後，應用再傳回，這樣保障消息的完整性）

（2）擴充流程（發短信，配送處理）訂閱隊列消息。采用推或拉的方式擷取消息并處理。

（3）消息将應用解耦的同時，帶來了資料一緻性問題，可以采用最終一緻性方式解決。比如主資料寫入資料庫，擴充應用根據消息隊列，并結合資料庫方式實作基于消息隊列的後續處理。

3.2日志收集系統

分為Zookeeper注冊中心，日志收集用戶端，Kafka叢集和Storm叢集（OtherApp）四部分組成。

Zookeeper注冊中心，提出負載均衡和位址查找服務；
日志收集用戶端，用于采集應用系統的日志，并将資料推送到kafka隊列；

四、JMS消息服務

講消息隊列就不得不提JMS 。JMS（JAVA Message Service,java消息服務）API是一個消息服務的标準/規範，允許應用程式元件基于JavaEE平台建立、發送、接收和讀取消息。它使分布式通信耦合度更低，消息服務更加可靠以及異步性。

在EJB架構中，有消息bean可以無縫的與JM消息服務內建。在J2EE架構模式中，有消息服務者模式，用于實作消息與應用直接的解耦。

4.1消息模型

在JMS标準中，有兩種消息模型P2P（Point to Point）,Publish/Subscribe(Pub/Sub)。

4.1.1 P2P模式

P2P模式包含三個角色：消息隊列（Queue），發送者(Sender)，接收者(Receiver)。每個消息都被發送到一個特定的隊列，接收者從隊列中擷取消息。隊列保留着消息，直到他們被消費或逾時。

P2P的特點

每個消息隻有一個消費者（Consumer）(即一旦被消費，消息就不再在消息隊列中)
發送者和接收者之間在時間上沒有依賴性，也就是說當發送者發送了消息之後，不管接收者有沒有正在運作，它不會影響到消息被發送到隊列
接收者在成功接收消息之後需向隊列應答成功

如果希望發送的每個消息都會被成功處理的話，那麼需要P2P模式。

4.1.2 Pub/sub模式

包含三個角色主題（Topic），釋出者（Publisher），訂閱者（Subscriber）。多個釋出者将消息發送到Topic,系統将這些消息傳遞給多個訂閱者。

Pub/Sub的特點

每個消息可以有多個消費者
釋出者和訂閱者之間有時間上的依賴性。針對某個主題（Topic）的訂閱者，它必須建立一個訂閱者之後，才能消費釋出者的消息。
為了消費消息，訂閱者必須保持運作的狀态。

為了緩和這樣嚴格的時間相關性，JMS允許訂閱者建立一個可持久化的訂閱。這樣，即使訂閱者沒有被激活（運作），它也能接收到釋出者的消息。

如果希望發送的消息可以不被做任何處理、或者隻被一個消息者處理、或者可以被多個消費者處理的話，那麼可以采用Pub/Sub模型。

4.2消息消費

在JMS中，消息的産生和消費都是異步的。對于消費來說，JMS的消息者可以通過兩種方式來消費消息。

（1）同步

訂閱者或接收者通過receive方法來接收消息，receive方法在接收到消息之前（或逾時之前）将一直阻塞；

（2）異步

訂閱者或接收者可以注冊為一個消息監聽器。當消息到達之後，系統自動調用監聽器的onMessage方法。

JNDI：Java命名和目錄接口,是一種标準的Java命名系統接口。可以在網絡上查找和通路服務。通過指定一個資源名稱，該名稱對應于資料庫或命名服務中的一個記錄，同時傳回資源連接配接建立所必須的資訊。

JNDI在JMS中起到查找和通路發送目标或消息來源的作用。

4.3JMS程式設計模型

(1) ConnectionFactory

建立Connection對象的工廠，針對兩種不同的jms消息模型，分别有QueueConnectionFactory和TopicConnectionFactory兩種。可以通過JNDI來查找ConnectionFactory對象。

(2) Destination

Destination的意思是消息生産者的消息發送目标或者說消息消費者的消息來源。對于消息生産者來說，它的Destination是某個隊列（Queue）或某個主題（Topic）;對于消息消費者來說，它的Destination也是某個隊列或主題（即消息來源）。

是以，Destination實際上就是兩種類型的對象：Queue、Topic可以通過JNDI來查找Destination。

(3) Connection

Connection表示在用戶端和JMS系統之間建立的連結（對TCP/IP socket的包裝）。Connection可以産生一個或多個Session。跟ConnectionFactory一樣，Connection也有兩種類型：QueueConnection和TopicConnection。

(4) Session

Session是操作消息的接口。可以通過session建立生産者、消費者、消息等。Session提供了事務的功能。當需要使用session發送/接收多個消息時，可以将這些發送/接收動作放到一個事務中。同樣，也分QueueSession和TopicSession。

(5) 消息的生産者

消息生産者由Session建立，并用于将消息發送到Destination。同樣，消息生産者分兩種類型：QueueSender和TopicPublisher。可以調用消息生産者的方法（send或publish方法）發送消息。

(6) 消息消費者

消息消費者由Session建立，用于接收被發送到Destination的消息。兩種類型：QueueReceiver和TopicSubscriber。可分别通過session的createReceiver(Queue)或createSubscriber(Topic)來建立。當然，也可以session的creatDurableSubscriber方法來建立持久化的訂閱者。

(7) MessageListener

消息監聽器。如果注冊了消息監聽器，一旦消息到達，将自動調用監聽器的onMessage方法。EJB中的MDB（Message-Driven Bean）就是一種MessageListener。

深入學習JMS對掌握JAVA架構，EJB架構有很好的幫助，消息中間件也是大型分布式系統必須的元件。本次分享主要做全局性介紹，具體的深入需要大家學習，實踐，總結，領會。

五、常用消息隊列

一般商用的容器，比如WebLogic，JBoss，都支援JMS标準，開發上很友善。但免費的比如Tomcat，Jetty等則需要使用第三方的消息中間件。本部分内容介紹常用的消息中間件（Active MQ,Rabbit MQ，Zero MQ,Kafka）以及他們的特點。

5.1 ActiveMQ

ActiveMQ 是Apache出品，最流行的，能力強勁的開源消息總線。ActiveMQ 是一個完全支援JMS1.1和J2EE 1.4規範的 JMS Provider實作，盡管JMS規範出台已經是很久的事情了，但是JMS在當今的J2EE應用中間仍然扮演着特殊的地位。

ActiveMQ特性如下：

⒈ 多種語言和協定編寫用戶端。語言: Java,C,C++,C#,Ruby,Perl,Python,PHP。應用協定： OpenWire,Stomp REST,WS Notification,XMPP,AMQP

⒉ 完全支援JMS1.1和J2EE 1.4規範（持久化，XA消息，事務)

⒊ 對Spring的支援，ActiveMQ可以很容易内嵌到使用Spring的系統裡面去，而且也支援Spring2.0的特性

⒋ 通過了常見J2EE伺服器（如 Geronimo,JBoss 4,GlassFish,WebLogic)的測試，其中通過JCA 1.5 resource adaptors的配置，可以讓ActiveMQ可以自動的部署到任何相容J2EE 1.4 商業伺服器上

⒌ 支援多種傳送協定：in-VM,TCP,SSL,NIO,UDP,JGroups,JXTA

⒍ 支援通過JDBC和journal提供高速的消息持久化

⒎ 從設計上保證了高性能的叢集，用戶端-伺服器，點對點

⒏ 支援Ajax

⒐ 支援與Axis的整合

⒑ 可以很容易得調用内嵌JMS provider，進行測試

5.2 RabbitMQ

RabbitMQ是流行的開源消息隊列系統，用erlang語言開發。RabbitMQ是AMQP（進階消息隊列協定）的标準實作。支援多種用戶端，如：Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP等，支援AJAX，持久化。用于在分布式系統中存儲轉發消息，在易用性、擴充性、高可用性等方面表現不俗。

結構圖如下：

幾個重要概念：

Broker：簡單來說就是消息隊列伺服器實體。

Exchange：消息交換機，它指定消息按什麼規則，路由到哪個隊列。

Queue：消息隊列載體，每個消息都會被投入到一個或多個隊列。

Binding：綁定，它的作用就是把exchange和queue按照路由規則綁定起來。

Routing Key：路由關鍵字，exchange根據這個關鍵字進行消息投遞。

vhost：虛拟主機，一個broker裡可以開設多個vhost，用作不同使用者的權限分離。

producer：消息生産者，就是投遞消息的程式。

consumer：消息消費者，就是接受消息的程式。

channel：消息通道，在用戶端的每個連接配接裡，可建立多個channel，每個channel代表一個會話任務。

消息隊列的使用過程，如下：

（1）用戶端連接配接到消息隊列伺服器，打開一個channel。

（2）用戶端聲明一個exchange，并設定相關屬性。

（3）用戶端聲明一個queue，并設定相關屬性。

（4）用戶端使用routing key，在exchange和queue之間建立好綁定關系。

（5）用戶端投遞消息到exchange。

exchange接收到消息後，就根據消息的key和已經設定的binding，進行消息路由，将消息投遞到一個或多個隊列裡。

5.3 ZeroMQ

号稱史上最快的消息隊列，它實際類似于Socket的一系列接口，他跟Socket的差別是：普通的socket是端到端的（1:1的關系），而ZMQ卻是可以N：M 的關系，人們對BSD套接字的了解較多的是點對點的連接配接，點對點連接配接需要顯式地建立連接配接、銷毀連接配接、選擇協定（TCP/UDP）和處理錯誤等，而ZMQ屏蔽了這些細節，讓你的網絡程式設計更為簡單。ZMQ用于node與node間的通信，node可以是主機或者是程序。

引用官方的說法： “ZMQ(以下ZeroMQ簡稱ZMQ)是一個簡單好用的傳輸層，像架構一樣的一個socket library，他使得Socket程式設計更加簡單、簡潔和性能更高。是一個消息處理隊列庫，可在多個線程、核心和主機盒之間彈性伸縮。ZMQ的明确目标是“成為标準網絡協定棧的一部分，之後進入Linux核心”。現在還未看到它們的成功。但是，它無疑是極具前景的、并且是人們更加需要的“傳統”BSD套接字之上的一層封裝。ZMQ讓編寫高性能網絡應用程式極為簡單和有趣。”

特點是：

高性能，非持久化；
跨平台：支援Linux、Windows、OS X等。
多語言支援； C、C++、Java、.NET、Python等30多種開發語言。
可單獨部署或內建到應用中使用；
可作為Socket通信庫使用。

與RabbitMQ相比，ZMQ并不像是一個傳統意義上的消息隊列伺服器，事實上，它也根本不是一個伺服器，更像一個底層的網絡通訊庫，在Socket API之上做了一層封裝，将網絡通訊、程序通訊和線程通訊抽象為統一的API接口。支援“Request-Reply “，”Publisher-Subscriber“，”Parallel Pipeline”三種基本模型和擴充模型。

ZeroMQ高性能設計要點：

1、無鎖的隊列模型

對于跨線程間的互動（使用者端和session）之間的資料交換通道pipe，采用無鎖的隊列算法CAS；在pipe兩端注冊有異步事件，在讀或者寫消息到pipe的時，會自動觸發讀寫事件。

2、批量處理的算法

對于傳統的消息處理，每個消息在發送和接收的時候，都需要系統的調用，這樣對于大量的消息，系統的開銷比較大，zeroMQ對于批量的消息，進行了适應性的優化，可以批量的接收和發送消息。

3、多核下的線程綁定，無須CPU切換

差別于傳統的多線程并發模式，信号量或者臨界區， zeroMQ充分利用多核的優勢，每個核綁定運作一個工作者線程，避免多線程之間的CPU切換開銷。

5.4 Kafka

Kafka是一種高吞吐量的分布式釋出訂閱消息系統，它可以處理消費者規模的網站中的所有動作流資料。這種動作（網頁浏覽，搜尋和其他使用者的行動）是在現代網絡上的許多社會功能的一個關鍵因素。這些資料通常是由于吞吐量的要求而通過處理日志和日志聚合來解決。對于像Hadoop的一樣的日志資料和離線分析系統，但又要求實時處理的限制，這是一個可行的解決方案。Kafka的目的是通過Hadoop的并行加載機制來統一線上和離線的消息處理，也是為了通過叢集機來提供實時的消費。

Kafka是一種高吞吐量的分布式釋出訂閱消息系統，有如下特性：

通過O(1)的磁盤資料結構提供消息的持久化，這種結構對于即使數以TB的消息存儲也能夠保持長時間的穩定性能。（檔案追加的方式寫入資料，過期的資料定期删除）
高吞吐量：即使是非常普通的硬體Kafka也可以支援每秒數百萬的消息。
支援通過Kafka伺服器和消費機叢集來分區消息。
支援Hadoop并行資料加載。

Kafka相關概念

Broker

Kafka叢集包含一個或多個伺服器，這種伺服器被稱為broker[5]

Topic

每條釋出到Kafka叢集的消息都有一個類别，這個類别被稱為Topic。（實體上不同Topic的消息分開存儲，邏輯上一個Topic的消息雖然儲存于一個或多個broker上但使用者隻需指定消息的Topic即可生産或消費資料而不必關心資料存于何處）

Partition

Parition是實體上的概念，每個Topic包含一個或多個Partition.

Producer

負責釋出消息到Kafka broker

Consumer

消息消費者，向Kafka broker讀取消息的用戶端。

Consumer Group

每個Consumer屬于一個特定的Consumer Group（可為每個Consumer指定group name，若不指定group name則屬于預設的group）。

一般應用在大資料日志處理或對實時性（少量延遲），可靠性（少量丢資料）要求稍低的場景使用。

熬夜不易,點選請老王喝杯烈酒！！！！！！！

大型網站架構系列：消息隊列

二、消息隊列應用場景

2.1異步處理

2.2應用解耦

2.3流量削鋒

2.4日志處理

2.5消息通訊

三、消息中間件示例

3.1電商系統

3.2日志收集系統

4.1消息模型

4.1.1 P2P模式

4.1.2 Pub/sub模式

4.2消息消費

4.3JMS程式設計模型

五、常用消息隊列

5.1 ActiveMQ

5.2 RabbitMQ

5.3 ZeroMQ

5.4 Kafka

繼續閱讀

醫療行業正從大資料中汲取回報的六個途徑

公車私用的檢讨書

生成對抗網絡（GAN）

深度學習面試題37：LSTM Networks原理(Long Short Term Memory networks)

RabbitMQ在分布式系統中的應用

Kafka實戰解惑

一種提高微服務架構的穩定性與資料一緻性的方法

RocketMQ原了解析-Remoting

RocketMQ原了解析-NameServer

RocketMQ原了解析－Broker

RocketMQ原了解析－Consumer

Java NIO淺析

RocketMQ原了解析－Producer

分布式開放消息系統(RocketMQ)的原理與實踐

簡析TCP的三次握手與四次分手