天天看點

消息隊列概述

消息隊列中間件是分布式系統中重要的元件,主要解決應用耦合,異步消息,流量削鋒等問題

實作高性能,高可用,可伸縮和最終一緻性架構

使用較多的消息隊列有ActiveMQ,RabbitMQ,ZeroMQ,Kafka,MetaMQ,RocketMQ

消息隊列應用場景

以下介紹消息隊列在實際應用中常用的使用場景。異步處理,應用解耦,流量削鋒和消息通訊四個場景

異步處理

場景說明:使用者注冊後,需要發注冊郵件和注冊短信。傳統的做法有兩種 1.串行的方式;2.并行方式

(1)串行方式:将注冊資訊寫入資料庫成功後,發送注冊郵件,再發送注冊短信。以上三個任務全部完成後,傳回給用戶端

消息隊列概述

(2)并行方式:将注冊資訊寫入資料庫成功後,發送注

消息隊列概述

假設三個業務節點每個使用50毫秒鐘,不考慮網絡等其他開銷,則串行方式的時間是150毫秒,并行的時間可能是100毫秒。

因為CPU在機關時間内處理的請求數是一定的,假設CPU1秒内吞吐量是100次。則串行方式1秒内CPU可處理的請 求量是7次(1000/150)。并行方式處理的請求量是10次(1000/100

小結:如以上案例描述,傳統的方式系統的性能(并發量,吞吐量,響應時間)會有瓶頸。如何解決這個問題呢?

引入消息隊列,将不是必須的業務邏輯,異步處理。改造後的架構如下:

消息隊列概述

按照以上約定,使用者的響應時間相當于是注冊資訊寫入資料庫的時間,也就是50毫秒。注冊郵件,發送短信寫入消息隊列後,直接傳回,是以寫入消息隊列的速度很快,

基本可以忽略,是以使用者的響應時間可能是50毫秒。是以架構改變後,系統的吞吐量提高到每秒20 QPS。比串行提高了3倍,比并行提高了兩倍

應用解耦

場景說明:使用者下單後,訂單系統需要通知庫存系統。傳統的做法是,訂單系統調用庫存系統的接口。如下圖

消息隊列概述

 傳統模式的缺點:

  • 假如庫存系統無法通路,則訂單減庫存将失敗,進而導緻訂單失敗
  • 訂單系統與庫存系統耦合

  如何解決以上問題呢?引入應用消息隊列後的方案,如下圖:

消息隊列概述
  • 訂單系統:使用者下單後,訂單系統完成持久化處理,将消息寫入消息隊列,傳回使用者訂單下單成功
  • 庫存系統:訂閱下單的消息,采用拉/推的方式,擷取下單資訊,庫存系統根據下單資訊,進行庫存操作
  • 假如:在下單時庫存系統不能正常使用。也不影響正常下單,因為下單後,訂單系統寫入消息隊列就不再關

  心其他的後續操作了。實作訂單系統與庫存系統的應用解耦

流量削鋒

流量削鋒也是消息隊列中的常用場景,一般在秒殺或團搶活動中使用廣泛

應用場景:秒殺活動,一般會因為流量過大,導緻流量暴增,應用挂掉。為解決這個問題,一般需要在應用前端加入消息隊列。

  • 可以控制活動的人數
  • 可以緩解短時間内高流量壓垮應用

  

消息隊列概述
  • 使用者的請求,伺服器接收後,首先寫入消息隊列。假如消息隊列長度超過最大數量,則直接抛棄使用者請求或跳轉到錯誤頁面
  • 秒殺業務根據消息隊列中的請求資訊,再做後續處理

日志處理

日志處理是指将消息隊列用在日志進行中,比如Kafka的應用,解決大量日志傳輸的問題。架構簡化如下

消息隊列概述
  • 日志采集用戶端,負責日志資料采集,定時寫受寫入Kafka隊列
  • Kafka消息隊列,負責日志資料的接收,存儲和轉發
  • 日志處理應用:訂閱并消費kafka隊列中的日志資料

以下是新浪kafka日志處理應用案例:轉自(http://cloud.51cto.com/art/201507/484338.htm)

消息隊列概述

(1)Kafka:接收使用者日志的消息隊列

(2)Logstash:做日志解析,統一成JSON輸出給Elasticsearch

(3)Elasticsearch:實時日志分析服務的核心技術,一個schemaless,實時的資料存儲服務,通過index組織資料,兼具強大的搜尋和統計功能

(4)Kibana:基于Elasticsearch的資料可視化元件,超強的資料可視化能力是衆多公司選擇ELK stack的重要原因

消息通訊

消息通訊是指,消息隊列一般都内置了高效的通信機制,是以也可以用在純的消息通訊。比如實作點對點消息隊列,或者聊天室等

點對點通訊:

消息隊列概述

用戶端A和用戶端B使用同一隊列,進行消息通訊。

聊天室通訊:

消息隊列概述

用戶端A,用戶端B,用戶端N訂閱同一主題,進行消息釋出和接收。實作類似聊天室效果。

以上實際是消息隊列的兩種消息模式,點對點或釋出訂閱模式。模型為示意圖,供參考。

消息中間件示例

電商系統

消息隊列概述

消息隊列采用高可用,可持久化的消息中間件。比如Active MQ,Rabbit MQ,Rocket Mq。

(1)應用将主幹邏輯處理完成後,寫入消息隊列。消息發送是否成功可以開啟消息的确認模式。(消息隊列傳回消息接收成功狀态後,應用再傳回,這樣保障消息的完整性)

(2)擴充流程(發短信,配送處理)訂閱隊列消息。采用推或拉的方式擷取消息并處理。

(3)消息将應用解耦的同時,帶來了資料一緻性問題,可以采用最終一緻性方式解決。比如主資料寫入資料庫,

擴充應用根據消息隊列,并結合資料庫方式實作基于消息隊列的後續處理。

日志收集系統

消息隊列概述

分為Zookeeper注冊中心,日志收集用戶端,Kafka叢集和Storm叢集(OtherApp)四部分組成。

  • Zookeeper注冊中心,提出負載均衡和位址查找服務
  • 日志收集用戶端,用于采集應用系統的日志,并将資料推送到kafka隊列
  • Kafka叢集:接收,路由,存儲,轉發等消息處理

Storm叢集:與OtherApp處于同一級别,采用拉的方式消費隊列中的資料

JMS消息服務

講消息隊列就不得不提JMS 。JMS(JAVA Message Service,java消息服務)API是一個消息服務的标準/規範,允許

應用程式元件基于JavaEE平台建立、發送、接收和讀取消息。它使分布式通信耦合度更低,消息服務更加可靠以及

異步性。

在EJB架構中,有消息bean可以無縫的與JM消息服務內建。在J2EE架構模式中,有消息服務者模式,用于實作消息

與應用直接的解耦。

消息模型

在JMS标準中,有兩種消息模型P2P(Point to Point),Publish/Subscribe(Pub/Sub)。

消息隊列概述

P2P模式包含三個角色:消息隊列(Queue),發送者(Sender),接收者(Receiver)。每個消息都被發送到一個特

定的隊列,接收者從隊列中擷取消息。隊列保留着消息,直到他們被消費或逾時。

P2P的特點

  • 每個消息隻有一個消費者(Consumer)(即一旦被消費,消息就不再在消息隊列中)
  • 發送者和接收者之間在時間上沒有依賴性,也就是說當發送者發送了消息之後,不管接收者有沒有正在運作,它不會影響到消息被發送到隊列
  • 接收者在成功接收消息之後需向隊列應答成功

如果希望發送的每個消息都會被成功處理的話,那麼需要P2P模式。

消息隊列概述

Pub/sub模式包含三個角色主題(Topic),釋出者(Publisher),訂閱者(Subscriber) 多個釋出者将消息發送

到Topic,系統将這些消息傳遞給多個訂閱者。

Pub/Sub的特點

  • 每個消息可以有多個消費者
  • 釋出者和訂閱者之間有時間上的依賴性。針對某個主題(Topic)的訂閱者,它必須建立一個訂閱者之後,才能消費釋出者的消息
  • 為了消費消息,訂閱者必須保持運作的狀态

為了緩和這樣嚴格的時間相關性,JMS允許訂閱者建立一個可持久化的訂閱。這樣,即使訂閱者沒有被激活(運

行),它也能接收到釋出者的消息。

如果希望發送的消息可以不被做任何處理、或者隻被一個消息者處理、或者可以被多個消費者處理的話,那麼可以

采用Pub/Sub模型。

消息消費

在JMS中,消息的産生和消費都是異步的。對于消費來說,JMS的消息者可以通過兩種方式來消費消息。

(1)同步

訂閱者或接收者通過receive方法來接收消息,receive方法在接收到消息之前(或逾時之前)将一直阻塞;

(2)異步

訂閱者或接收者可以注冊為一個消息監聽器。當消息到達之後,系統自動調用監聽器的onMessage方法。

防止消息丢失

由于網絡問題,我們很難保證生産者發送的消息能100%到達消息隊列伺服器,也就是說有消息丢失的可能性,因

此,生産者就必須具有消息丢失檢測和重發機制,也就是我們常說的消息隊列的事物機制

不能把可靠性的保證全部交給TCP,TCP隻保證了傳輸層的可靠傳輸,但是無法保證與應用層的互動是否出錯

TCP無法給應用層任何回報,是以必須在應用層處理差錯

同步的事務——停止等待

所謂停止等待協定就是沒發送完一組資料後,等待對方确認并且收到确認後,再發送下一組資料。

消息隊列概述

同步的事務——連續ARQ

類似于TCP的滑動視窗模型

消息隊列概述

異步的事務——回調機制

生産者在發送消息的時候,注冊一個回調函數,這樣生産者便不用停下來等待确認了,而是可以一直持續發送消

息,當消息到達消息隊列伺服器的時候,伺服器便會調用生産者注冊的回調函數,告知生産者消息發送成功了還是

失敗了,進而做進一步的處理,進而提高了并發量。

消息隊列概述

 消息的幂等處理

由于網絡原因,生産者可能會重複發送消息,是以消費者方必須做消息的幂等處理,常用的解決方案有:

1. 查詢操作:查詢一次和查詢多次,在資料不變的情況下,查詢結果是一樣的。select是天然的幂等操作;

2. 删除操作:删除操作也是幂等的,删除一次和多次删除都是把資料删除。(注意可能傳回結果不一樣,删除的資料不存在,傳回0,删除的資料多條,傳回結果多個) ;

3. 唯一索引,防止新增髒資料。比如:支付寶的資金賬戶,支付寶也有使用者賬戶,每個使用者隻能有一個資金賬戶,怎麼防止給使用者建立資金賬戶多個,那麼給資金賬戶表中的使用者ID加唯一索引,是以一個使用者新增成功

一個資金賬戶記錄。要點:唯一索引或唯一組合索引來防止新增資料存在髒資料(當表存在唯一索引,并發時新增報錯時,再查詢一次就可以了,資料應該已經存在了,傳回結果即可);

4. token機制,防止頁面重複送出。業務要求: 頁面的資料隻能被點選送出一次;發生原因: 由于重複點選或者網絡重發,或者nginx重發等情況會導緻資料被重複送出;解決辦法: 叢集環境采用token加redis(redis單

線程的,處理需要排隊);單JVM環境:采用token加redis或token加jvm記憶體。  

  處理流程:

    1. 資料送出前要向服務的申請token,token放到redis或jvm記憶體,token有效時間;

    2. 送出後背景校驗token,同時删除token,生成新的token傳回。token特點:要申請,一次有效性,可以限流。注意:redis要用删除操作來判斷token,删除成功代表token校驗通過,如果用select+delete來校驗token,存在并發問題,不建議使用;

5. 悲觀鎖——擷取資料的時候加鎖擷取。select * from table_xxx where id='xxx' for update; 注意:id字段一定是主鍵或者唯一索引,不然是鎖表,會死人的悲觀鎖使用時一般伴随事務一起使用,資料鎖定時間可能會很長,根據實際情況選用;

6. 樂觀鎖——樂觀鎖隻是在更新資料那一刻鎖表,其他時間不鎖表,是以相對于悲觀鎖,效率更高。樂觀鎖的實作方式多種多樣可以通過version或者其他狀态條件:

    1. 通過版本号實作

      update table_xxx set name=#name#,version=version+1 where version=#version#如下圖(來自網上);

    2. 通過條件限制 

      update table_xxx set avai_amount=avai_amount-#subAmount# where avai_amount-#subAmount# >= 0 要求:quality-#subQuality# >=,這個情景适合不用版本号,隻更新是做資料安全校驗,适合庫存模型,扣份額和復原份額,性能更高;

消息隊列概述

 7.分布式鎖——還是拿插入資料的例子,如果是分布是系統,建構全局唯一索引比較困難,例如唯一性的字段沒法确定,這時候可以引入分布式鎖,通過第三方的系統(redis或zookeeper),在業務系統插入資料或者更新資料,擷取分布式鎖,然後做操作,之後釋放鎖,

 這樣其實是把多線程并發的鎖的思路,引入多多個系統,也就是分布式系統中得解決思路。要點:某個長流程處理過程要求不能并發執行,可以在流程執行之前根據某個标志(使用者ID+字尾等)擷取分布式鎖,其他流程執行時擷取鎖就會失敗,也就是同一時間該流程隻能有一個能執行成功,執行

後,釋放分布式鎖(分布式鎖要第三方系統提供);

8.select + insert——并發不高的背景系統,或者一些任務JOB,為了支援幂等,支援重複執行,簡單的處理方法是,先查詢下一些關鍵資料,判斷是否已經執行過,在進行業務處理,就可以了。注意:核心高并發流程不要用這種方法;

消息的按序處理

同上,消息的按序也不能完全依靠于TCP

在說到消息中間件的時候,我們通常都會談到一個特性:消息的順序消費問題。這個問題看起來很簡單:

Producer發送消息1, 2, 3。。。 Consumer按1, 2, 3。。。順序消費。

但實際情況卻是:無論RocketMQ,還是Kafka,預設都不保證消息的嚴格有序消費!

這個特性看起來很簡單,但為什麼預設他們都不保證呢?

“嚴格的順序消費”有多麼困難

下面就從3個方面來分析一下,對于一個消息中間件來說,”嚴格的順序消費”有多麼困難,或者說不可能。

發送端

發送端不能異步發送,異步發送在發送失敗的情況下,就沒辦法保證消息順序。比如你連續發了1,2,3。 過了一會,傳回結果1失敗,2, 3成功。你把1再重新發送1遍,這個時候順序就亂掉了。

存儲端

對于存儲端,要保證消息順序,會有以下幾個問題:

(1)消息不能分區。也就是1個topic,隻能有1個隊列。在Kafka中,它叫做partition;在RocketMQ中,它叫做queue。 如果你有多個隊列,那同1個topic的消息,會分散到多個分區裡面,自然不能保證順序。

(2)即使隻有1個隊列的情況下,會有第2個問題。該機器挂了之後,能否切換到其他機器?也就是高可用問題。比如你目前的機器挂了,上面還有消息沒有消費完。此時切換到其他機器,可用性保證了。但消息順序就亂掉了。要想保證,一方面要同步複制,不能異步複制;另1方面得保證,切機器之前,挂掉的機器上面,所有消息必須消費完了,不能有殘留。很明顯,這個很難!!!

接收端

對于接收端,不能并行消費,也即不能開多線程或者多個用戶端消費同1個隊列。

總結

從上面的分析可以看出,要保證消息的嚴格有序,有多麼困難!

發送端和接收端的問題,還好解決一點,限制異步發送,限制并行消費。但對于存儲端,機器挂了之後,切換的問題,就很難解決了。

你切換了,可能消息就會亂;你不切換,那就暫時不可用。這2者之間,就需要權衡了。

繼續閱讀