本節書摘來自華章計算機《storm企業級應用:實戰、運維和調優》一書中的第3章,作者:馬延輝 陳書美 雷葆華著, 更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。
本章從細節入手,了解storm的核心概念,包括stream、spout、bolt、tuple、task、worker、stream grouping和topology。stream是被處理的資料,spout是資料源,bolt處理資料,tuple是資料單元,task是運作spout或bolt中的線程,worker是運作這些線程的程序,stream grouping規定了bolt接收何種類型資料作為輸入。topology是由stream grouping連接配接起來的spout和bolt節點網絡。
另外,除了核心概念,本章還介紹資料流模型,從整體上介紹storm,這樣從微觀和宏觀的角度了解storm之後,就可以更好地利用storm這個工具來開展實時處理分析的項目。