强大、高效、可扩展的消息传递系统——Kafka

嗨，大家好！今天我要来给大家详细介绍一下Kafka消息队列，这是一个非常强大、高效、可扩展的消息传递系统。如果你还不知道什么是Kafka，那么现在就让我来带你了解一下吧！如果你还没有使用Kafka，那么我希望本文可以帮助你了解它的原理、代码和实战应用。如果你已经使用Kafka，并且想要更深入地了解它，那么我建议你查看Kafka官方文档，它包含了大量的信息和示例，可以帮助你更好地使用Kafka。

一、起源和发展

Kafka是由LinkedIn公司开发的一种分布式消息队列系统，它最初的设计目的是为了解决LinkedIn站内信系统的问题。由于LinkedIn站内信系统需要处理数百万个消息，而传统的消息队列系统无法满足这样的需求，所以LinkedIn的工程师们开始设计并开发了Kafka。

经过多年的发展，Kafka已经成为了一种非常流行的消息队列系统，它已经被许多大型公司所采用，例如Netflix、Twitter、Airbnb等等。

二、原理

Kafka采用了一种发布-订阅的消息模型，它可以将消息分发给多个消费者进行处理。在Kafka中，消息被组织成了一个或多个主题（Topic），每个主题包含了多个消息。每个消息都包含了一个键（Key）和一个值（Value）。

Kafka中的生产者（Producer）将消息发布到一个或多个主题中，而消费者（Consumer）则从一个或多个主题中订阅消息。一旦有新的消息被发布到主题中，消费者就会立即收到这些消息，并进行处理。

Kafka的主要优势在于其高性能和高吞吐量。它采用了一种非常高效的消息存储方式，可以轻松处理大量的消息。

三、代码

Kafka的API非常简单易用，下面是一个基本的Java代码示例，展示了如何使用Kafka的生产者和消费者：

// 创建生产者 
Properties props = new Properties(); 
props.put("bootstrap.servers", "localhost:9092"); 
props.put("acks", "all"); 
props.put("retries", 0); 
props.put("batch.size", 16384); 
props.put("linger.ms", 1); 
props.put("buffer.memory", 33554432); 
props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer"); 
props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
 Producer<String, String> producer = new KafkaProducer<>(props);
// 发送消息 
producer.send(new ProducerRecord<String, String>("my-topic", "key", "value"));
// 创建消费者 
Properties props = new Properties(); 
props.put("bootstrap.servers", "localhost:9092"); 
props.put("group.id", "my-group"); 
props.put("enable.auto.commit", "true"); 
props.put("auto.commit.interval.ms", "1000"); 
props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer"); 
props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer"); 
Consumer<String, String> consumer = new KafkaConsumer<>(props);
// 订阅主题 
consumer.subscribe(Arrays.asList("my-topic"));
// 接收消息 
while (true) { 
	ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100)); 
	for (ConsumerRecord<String, String> record : records) { 
		System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value()); 
	} 
}

四、实战

现在让我们来看一下如何在实际项目中使用Kafka。假设我们正在开发一个在线商店系统，我们需要从多个来源（例如网站、移动应用程序、POS系统等）收集订单数据，并将其传输到中央订单处理系统中。

我们可以使用Kafka作为我们的消息传递系统。我们可以将所有的订单数据发送到一个名为“orders”的主题中，并将其订阅到订单处理系统中。这样，无论订单数据来自何处，我们都可以将其传递到中央处理系统中进行处理。

以下是一个基本的Kafka生产者代码示例，它将订单数据发送到“orders”主题中：

// 创建生产者 
Properties props = new Properties(); 
props.put("bootstrap.servers", "localhost:9092"); 
props.put("acks", "all"); props.put("retries", 0); 
props.put("batch.size", 16384); 
props.put("linger.ms", 1); 
props.put("buffer.memory", 33554432); 
props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer"); 
props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
 Producer<String, String> producer = new KafkaProducer<>(props);
// 发送订单数据 
Order order = new Order(); 
order.setOrderNumber("12345"); 
order.setCustomerName("John Smith"); 
order.setShippingAddress("123 Main St."); 
String orderJson = new Gson().toJson(order); 
producer.send(new ProducerRecord<String, String>("orders", order.getOrderNumber(), orderJson));

以下是一个基本的Kafka消费者代码示例，它订阅“orders”主题，并将订单数据传递到订单处理系统中：

// 创建消费者 
Properties props = new Properties(); 
props.put("bootstrap.servers", "localhost:9092"); 
props.put("group.id", "order-processing"); 
props.put("enable.auto.commit", "true"); 
props.put("auto.commit.interval.ms", "1000"); 
props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer"); 
props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer"); 
Consumer<String, String> consumer = new KafkaConsumer<>(props);
// 订阅“orders”主题 
consumer.subscribe(Arrays.asList("orders"));
// 处理订单数据 
while (true) { 
  ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100)); 
  for (ConsumerRecord<String, String> record : records) { 
    String orderJson = record.value(); 
    Order order = new Gson().fromJson(orderJson, Order.class); 
    processOrder(order);
 	} 
}

五、高级应用

Kafka不仅可以用作消息传递系统，还可以用作流处理平台。通过使用Kafka Streams API，我们可以将Kafka作为一个流处理引擎，轻松地对实时数据进行处理和分析。

例如，假设我们正在开发一个实时电商系统，我们需要对客户的购物行为进行实时分析。我们可以使用Kafka Streams API来实现这个功能。我们可以将所有的购物数据发送到一个名为“shopping-data”的主题中，并使用Kafka Streams API来对这些数据进行实时分析。

以下是一个基本的Kafka Streams代码示例，它使用Kafka Streams API来计算购物数据的平均值：

// 创建流处理拓扑 
StreamsBuilder builder = new StreamsBuilder(); 
KStream<String, Integer> shoppingData = builder.stream("shopping-data"); 
KGroupedStream<String, Integer> groupedShoppingData = shoppingData.groupByKey(); 
KTable<String, Double> averageShoppingData = groupedShoppingData.aggregate( () -> new Average(0, 0), (key, value, aggregate) -> aggregate.add(value), (key, aggregate1, aggregate2) -> aggregate1.add(aggregate2) ).mapValues(Average::avg);
// 创建Kafka Streams实例 
Properties props = new Properties(); 
props.put("bootstrap.servers", "localhost:9092"); 
props.put("application.id", "shopping-data-streams"); 
StreamsConfig config = new StreamsConfig(props); 
KafkaStreams streams = new KafkaStreams(builder.build(), config);
// 启动Kafka Streams实例 
streams.start();

以上代码将购物数据作为一个KStream，然后对其进行分组。然后，它使用一个自定义的聚合器来计算购物数据的平均值，并将结果保存到一个KTable中。最后，它使用mapValues函数将KTable转换为一个具有平均值的KTable。

六、总结

Kafka是一个非常强大、高效、可扩展的消息传递系统。它可以轻松地处理大量的消息，并具有高性能和高吞吐量。通过使用Kafka，我们可以将消息从一个地方传递到另一个地方，从而使我们的应用程序更加灵活和可扩展。

强大、高效、可扩展的消息传递系统——Kafka

继续阅读

go应用程序写kafka阻塞（大坑）

虚拟机---kafka的安装

白话描述Kafka

kafka环境部署(二)

Kafka学习篇（二）——Kafka环境搭建安装JDK安装KafkaKafka命令Kafka配置

大白话带你认识Kafka一、Kafka基础1.Topic 主题二、kafka的集群架构3.Kafka的网络设计finally

kafka使用笔记-librdkafka支持sasl认证

librdkafka consumer封装的一点总结

用c++ 连接kafka我所踩过的坑(Connection refused || desired partition does not exist)

Linux 安装kafka的库librdkafka

librdkafka安装步骤

Kafka：Topic概念与API介绍

Doris SQL日志审计部署，以及sql收集输出kafka，后续血缘分析

Flink Kafka Doris实战demo

Kafka 和 EMS 消息批量 ack 的实现

Spring Cloud整合Sleuth，当请求完成后，Zipkin没有链路信息