Storm 配置設定邏輯

2021-10-30 11:14:40

ps：都是學習的别人的部落格，隻是做了個整理所有就寫成了原創，其實都是人家的東西

當一個topology在storm cluster中運作時，它的并發主要跟3個邏輯對象相關：worker，executor 和task

1. Worker 是運作在工作節點上面，被Supervisor守護程序建立的用來幹活的JVM程序。每個Worker對應于一個給定topology的全部執行任務的一個子集。反過來說，一個Worker裡面不會運作屬于不同的topology的執行任務。

2. Executor可以了解成一個Worker程序中的工作線程。一個Executor中隻能運作隸屬于同一個component（spout/bolt）的task。一個Worker程序中可以有一個或多個Executor線程。在預設情況下，一個Executor運作一個task。

3. Task則是spout和bolt中具體要幹的活了。一個Executor可以負責1個或多個task。每個component（spout/bolt）的并發度就是這個component對應的task數量。同時，task也是各個節點之間進行grouping（partition）的機關。

conf.setNumWorkers(workers); //設定worker數量

uilder.setBolt("2", new WordSpliter(),4) //設定Executor并發數量

builder.setBolt("2", new WordSpliter(),4).setNumTasks(1); //設定每個線程處理的Task數量

任務配置設定時有兩種情況：

(a)task數目比worker多，例如task是[1 2 3 4],可用的slot隻有[host1:port1 host2:port1]，那麼最終是這樣配置設定

{1: [host1:port1] 2 : [host2:port1]

3 : [host1:port1] 4 : [host2:port1]}

可以看到任務平均地配置設定在兩個worker上。

(b)如果task數目比worker少，例如task是[1 2]，而worker有[host1:port1 host1:port2 host2:port1 host2:port2]，那麼首先會将woker排序，将不同host間隔排列，保證task不會全部配置設定到同一個機器上，也就是将worker排列成

[host1:port1 host2:port1 host1:port2 host2:port2]

然後配置設定任務為

{1: host1:port1 , 2 : host2:port1}

通過Config.setNumWorkers(int))來指定一個storm叢集中執行topolgy的程序數量, 所有的線程将在這些指定的worker程序中運作. 比如說一個topology中要啟動300個線程來運作spout/bolt, 而指定的worker程序數量是60個, 那麼storm将會給每個worker配置設定5個線程來跑spout/bolt, 如果要對一個topology進行調優, 可以調整worker數量和spout/bolt的parallelism數量(調整參數之後要記得重新部署topology. 後續會為該操作提供一個swapping的功能來減小重新部署的時間).

對于worker和task之間的比例, nathan也給出了參考, 即1個worker包含10~15個左右, 當然這個參考, 實際情況還是要根據配置和測試情況

Storm 配置設定邏輯

繼續閱讀

麥博FC330低音炮拆機圖（簡易版）

xml解析失敗Invalid byte 1 of 1-byte UTF-8 sequence

用 Canvas 編織璀璨星空圖

HTML5Canvas 酷炫效果

龍珠訓練營task04

2020年終總結和展望前言一、2020年終總結二、2021年展望

一場春雨，一個帶着泥土芬芳的記憶

在DOS下運作不了ipconfig指令

開博一周年

MathType

【可靠性評估】電力系統可靠性評估matlab仿真1.軟體版本2.本算法理論知識

在linux下安裝GSL庫以及在codeblocks上配置GSL庫一在 linux 上安裝 GSL 二在codeblocks 上按如下方式配置 GSL庫：三測試程式

jQuery練習一. 選擇器練習二. DOM操作練習三. 事件練習

swmm與lisflood-fp源碼如何一起編譯 CMake指令

layui多任務上傳添加進度條