天天看點

kafka consumer 停止消費topic現象解決及建議

現象

在kafka consumer (以 kafka1.0.0為例)消費 topic 時,常常會出現程式還在運作,但是已經不消費消息了(kafka producer正常生産消息),使用kafka指令檢視,kafka 已經沒有consumer 的資訊了。

實驗用例

實驗 kafka consumer 實作:

package com.muhao.kafka;

import java.util.Arrays;
import java.util.Properties;

import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;

public class MyKafKaConsumer {
	public static void main(String[] args) throws InterruptedException {
		Properties props = new Properties();
		props.put("bootstrap.servers", "192.168.220.10:9092");
		props.put("group.id", "test");
		props.put("enable.auto.commit", "true");
		props.put("auto.commit.interval.ms", "1000");
		props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
		props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
		KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);
		consumer.subscribe(Arrays.asList("my-topic"));
		while (true) {
			ConsumerRecords<String, String> records = consumer.poll(100);
			for (ConsumerRecord<String, String> record : records) {
				// 一次停止10 秒鐘,如果上一次得到超過30條消息,就會出現kafka consumer停止消費的現象
				Thread.sleep(10000L);
				System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value());
				
			}
		}

	}
}
           

實驗 kafka producer 實作:

package com.muhao.kafka;

import java.util.Properties;

import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.Producer;
import org.apache.kafka.clients.producer.ProducerRecord;


public class MyKafkaProducer {
	public static void main(String[] args) {
		Properties props = new Properties();
		 props.put("bootstrap.servers", "192.168.220.10:9092");
		 props.put("acks", "all");
		 props.put("retries", 0);
		 props.put("batch.size", 16384);
		 props.put("linger.ms", 1);
		 props.put("buffer.memory", 33554432);
		 props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
		 props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

		 Producer<String, String> producer = new KafkaProducer<>(props);
		 for (int i = 0; i < 1000; i++)
		     producer.send(new ProducerRecord<String, String>("my-topic", Integer.toString(i), "hello message is number : "+Integer.toString(i)));

		 producer.close();
	}
}
           

啟動 kafka consumer ,成功運作後在 kafka指令行執行 

bin/kafka-consumer-groups.sh --bootstrap-server localhost:9092 --describe  --group test

kafka consumer 停止消費topic現象解決及建議

發現kafka consumer 已經注冊到kafka叢集中了。

kafka producer發送消息讓kafka consumer 消費,但是consumer是阻塞的,等待5分鐘時候,運作指令行

kafka consumer 停止消費topic現象解決及建議

發現kafka叢集已經沒有了 consumer的消息,但是程式仍在運作。

kafka consumer 停止消費topic現象解決及建議

解決及建議

這種現象也是糾結了好長時間,檢視源碼,終于明白了,原來是在 kafka consumer 運作時,要和kafka叢集的協調節點做心跳交流,這也是kafka叢集給consumer做負載均衡的條件。但是但是consumer内部也會有一個計時器,記錄上一次向 kafka 叢集 poll 的時間,另外心跳線程會檢測該現在距上一次poll的時間,如果該時間差超過了設定時間(kafka consumer預設的是 5分鐘),就會想kafka叢集發出leaveGroup,這時kafka叢集會登出掉該consumer 的資訊。

建議:kafka consumer 在消費消息時,不要使用阻塞方法,比如blockqueue、網絡發送設定逾時時間……

總得一句就是上下兩次poll 的時間間隔不要超過5分鐘(預設的時間)。