producer類（java）

package cn.kgc.stock;

import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.ProducerRecord;
import org.apache.kafka.clients.producer.RecordMetadata;

import java.util.Properties;
import java.util.Random;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.Future;
import java.util.concurrent.TimeUnit;

public class KB12StockProducer {
    public static void main(String[] args) {
        //模拟股票交易記錄
        //Long第多少筆交易 Float該筆交易的金額

        final Properties CONF = new Properties();
        CONF.setProperty("bootstrap.servers", "192.168.6.130:9092");
        CONF.setProperty("key.serializer", "org.apache.kafka.common.serialization.LongSerializer");
        CONF.setProperty("value.serializer", "org.apache.kafka.common.serialization.FloatSerializer");
        CONF.setProperty("retries", "2");
        CONF.setProperty("acks", "1");
        CONF.setProperty("batch.size", "10");
        CONF.setProperty("linger.ms", "500");
        final String TOPIC = "stock_01";
        final int PARTITION = 0;
        KafkaProducer<Long, Float> producer = new KafkaProducer<Long, Float>(CONF);
        Random rand = new Random();
        long count = 0;

        try {
            while (true) {
                float value = 100 + rand.nextFloat();
                Future<RecordMetadata> send = producer.send(new ProducerRecord<Long, Float>(TOPIC, PARTITION, ++count, 100 + rand.nextFloat()));
                RecordMetadata rmd = send.get();
                System.out.println(rmd.topic()+"\t"+rmd.partition()+"\t"+rmd.offset()+"\t"+count+"->"+value);
                TimeUnit.MICROSECONDS.sleep(20+rand.nextInt(980));
            }
        } catch (InterruptedException e) {
            e.printStackTrace();
        } catch (ExecutionException e) {
            e.printStackTrace();
        } finally {
            producer.close();
        }
    }
}

sparkStreaming（scala）

package cn.kgc.stock

import java.util
import java.util.Properties

import org.apache.kafka.clients.consumer.ConsumerRecord
import org.apache.spark.SparkConf
import org.apache.spark.rdd.RDD
import org.apache.spark.streaming.dstream.InputDStream
import org.apache.spark.streaming.kafka010.{ConsumerStrategies, KafkaUtils, LocationStrategies}
import org.apache.spark.streaming.{Seconds, StreamingContext}

import scala.collection.mutable

object StockSparkStream {
  def main(args: Array[String]): Unit = {
    val conf = mutable.Map[String,String]()
    conf.put("bootstrap.servers", "192.168.6.130:9092");
    conf.put("key.deserializer", "org.apache.kafka.common.serialization.LongDeserializer");
    conf.put("value.deserializer", "org.apache.kafka.common.serialization.FloatDeserializer");
    conf.put("group.id", "stock_kb12")
    conf.put("enable.auto.commit", "true")
    conf.put("auto.offset.reset", "earliest")
    val topics = Array("stock_01")


    val spark_conf = new SparkConf().setMaster("local[*]").setAppName("kb12_stock")
    //以時間作為資料粒度的控制手段：每3秒
    val stream_context = new StreamingContext(spark_conf,Seconds(3))
    
    val stream: InputDStream[ConsumerRecord[Long,Float]] = KafkaUtils.createDirectStream(stream_context,
      LocationStrategies.PreferBrokers,
      ConsumerStrategies.Subscribe(topics,conf))

    stream.foreachRDD(rdd=>{
      val value: Array[Float] = rdd.map(_.value()).collect()
      val avg = value.sum/value.size
      println(s"${value.mkString(",")}\t$avg")
    })
    stream_context.start()
    stream_context.awaitTermination()
  }
}

spark Streaming 實時流producer類（java）sparkStreaming（scala）

producer類（java）

sparkStreaming（scala）

繼續閱讀

【51CTO學院三周年】自學路上的伴侶

線上教育巨頭多鄰國Duolingo入華一周年，中國市場馬力全開

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

Sql優化一：sql語句優化

Nacos 2.0 更新前後性能對比壓測

尚矽谷—韓順平—圖解 Java設計模式（結構型）（55～）

Storm編譯打包過程中遇到的一些問題及解決方法

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

9.spark Core 進階2--Cashe

大資料排錯SparkSpark叢集啟動時候，JAVA_HOME is not sethadoop叢集，某台伺服器jps無任何輸出IDEAkafkahadoopspark sqlfile permissionsIDEA本地測試 - OutOfMemoryError: GC overhead limit exceededhdfs負載均衡

淺談企業活動中進行資料分析的重要性

Ambari介紹和架構原理

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark