logstash讀取kafka資料插件

2023-05-21 20:16:00

最近公司做日志檢索和計數日志不同次元統計，選用了ELK，我們的日志已經上傳到Kafka中，Logstash需要從Kafka讀取資料，下面是Logstash的簡化配置：

<span style="font-size:18px;">input {
  kafka {
        #Kafka topic
        topic_id => "test_count_log"
        #消費者組 
        group_id => "logstash_data_access_event"
        #zk的連結位址 
        zk_connect => "10.0.171.202:2181,10.0.171.203:2181,10.0.171.204:2181fka_msg"
        queue_size => 80000
        consumer_threads => 4
        fetch_message_max_bytes => 10485760
  }
}

output {
  elasticsearch {
        hosts => ["10.35.129.3:9200","10.35.129.4:9200","10.35.129.5:9200","10.35.129.6:9200","10.35.129.7:9200"]
        workers => 4
        codec => "json"
        index => "kafka_test_count_log-%{+YYYY.MM.dd}"
  }
}</span>

想要使用多個 logstash 端協同消費同一個 topic 的話，那麼需要把兩個或是多個 logstash 消費端配置成相同的 group_id 和 topic_id ，但是前提是要把相應的 topic 分多個 partitions (區) ，多個消費者消費是無法保證消息的消費順序性的。這裡解釋下，為什麼要分多個 partitions(區) ， kafka 的消息模型是對 topic 分區以達到分布式效果。每個 topic 下的不同的 partitions (區) 隻能有一個 Owner 去消費。是以隻有多個分區後才能啟動多個消費者，對應不同的區去消費。其中協調消費部分是由 server 端協調而成。不必使用者考慮太多。隻是消息的消費則是無序的。

總結:保證消息的順序，那就用一個 partition 。 kafka 的每個 partition 隻能同時被同一個 group 中的一個 consumer 消費。

logstash讀取kafka資料插件

繼續閱讀

go應用程式寫kafka阻塞（大坑）

虛拟機---kafka的安裝

白話描述Kafka

kafka環境部署(二)

Kafka學習篇（二）——Kafka環境搭建安裝JDK安裝KafkaKafka指令Kafka配置

大白話帶你認識Kafka一、Kafka基礎1.Topic 主題二、kafka的叢集架構3.Kafka的網絡設計finally

kafka使用筆記-librdkafka支援sasl認證

librdkafka consumer封裝的一點總結

用c++ 連接配接kafka我所踩過的坑(Connection refused || desired partition does not exist)

Linux 安裝kafka的庫librdkafka

librdkafka安裝步驟

Kafka：Topic概念與API介紹

Doris SQL日志審計部署，以及sql收集輸出kafka，後續血緣分析

Flink Kafka Doris實戰demo

Kafka 和 EMS 消息批量 ack 的實作

Spring Cloud整合Sleuth，當請求完成後，Zipkin沒有鍊路資訊