3 核心架構及其元件

3.1 core架構

3.2 核心的元件

順便來看看

官方文檔

3.2.1 Source - 收集

指定資料源（Avro, Thrift, Spooling, Kafka, Exec）

3.2.2 Channel - 聚集

把資料暫存（Memory, File, Kafka等用的比較多）

3.2.3 Sink - 輸出

把資料寫至某處（HDFS, Hive, Logger, Avro, Thrift, File, ES, HBase, Kafka等）

multi-agent flow

為了跨多個代理或跳資料流，先前代理的接收器和目前跳的源需要是avro類型，接收器指向源的主機名（或IP位址）和端口。

Consolidation合并

日志收集中非常常見的情況是大量日志生成用戶端将資料發送到連接配接到存儲子系統的少數消費者代理。例如，從數百個Web伺服器收集

Multiplexing the flow

Flume支援将事件流多路複用到一個或多個目的地。這是通過定義可以複制或選擇性地将事件路由到一個或多個信道的流複用器來實作的。

上面的例子顯示了來自代理“foo”的源代碼将流程擴充到三個不同的通道。扇出可以複制或多路複用。在複制流的情況下，每個事件被發送到所有三個通道。對于多路複用情況，當事件的屬性與預配置的值比對時，事件将被傳遞到可用通道的子集。例如，如果一個名為“txnType”的事件屬性設定為“customer”，那麼它應該轉到channel1和channel3，如果它是“vendor”，那麼它應該轉到channel2，否則轉到channel3。可以在代理的配置檔案中設定映射。

分布式日志收集架構Flume下載下傳安裝與使用（二）3 核心架構及其元件

3 核心架構及其元件

3.1 core架構

3.2 核心的元件

3.2.1 Source - 收集

3.2.2 Channel - 聚集

3.2.3 Sink - 輸出

multi-agent flow

Consolidation合并

Multiplexing the flow

繼續閱讀

阿裡雲天池龍珠計劃SQL訓練營打卡

阿裡雲天池龍珠計劃SQL訓練營day1

實驗樓sql進階之成績管理系統的資料操作(window)

Spring Cloud整合Sleuth，當請求完成後，Zipkin沒有鍊路資訊

轉詳解C#資料庫存取圖檔三大方式

HiveQl語句應用執行個體：WordCount具體步驟如下：

Oracle的基本操作

BMP檔案結構及圖像每行位元組計算方法

磁盤結構及在Linux中的命名

SQL優化SQL語句優化的目的

JAVA高效程式設計指南

關于SQL語言

SQL語言基礎：常用的資料查詢語句

ubuntu14.04下安裝hbse1.0.1.1

neo4j之cypher使用文檔

sqlServer根據經緯查距離