SparkStreaming--输入源（本地文件）

2023-05-27 16:50:47

//输入源
object WordCountHDFSSource {
  def main(args: Array[String]): Unit = {
    System.setProperty("hadoop.home.dir", "E:\\software\\bigdate\\hadoop-2.6.0-cdh5.15.0\\hadoop-2.6.0-cdh5.15.0")
    val conf = new SparkConf();
    conf.setMaster("local[2]") //一个线程用于读数据，一个用于处理数据
    conf.setAppName("WordCountStreaming")
    val sc = new SparkContext(conf);
    val batch=5
    val streamingContext = new StreamingContext(sc, Seconds(batch))
    //监听本地目录
    val sourceDS=streamingContext.textFileStream("E:\\sparkdata")
    sourceDS.flatMap(
      line=>{
        line.split(" ")
      })
      .map((_,1))
      .reduceByKey(_+_)
      .print()
    streamingContext.start()
    streamingContext.awaitTermination()
    }
  }

SparkStreaming--输入源（本地文件）

继续阅读

Windows下IDEA远程调试Spark Streaming

基于spark的流式数据处理—SparkStreaming开发demo—文件流

Spark Streaming实时流处理项目实战笔记——Receiver方式整合之概述

spark-18.sparkStreaming_3_DStream的转换操作与输出转换操作DStream输出

Spark Streaming实时流处理项目实战笔记——Pull方式整合之服务器环境联调

flume使用pull方式整合Streaming问题：Received an error batch - no events were received from channel!1.现象2.原因3.解决

SparkStreaming整合Kafka--Receiver方式

SparkStreaming03

解决提交SparkStreaming应用读取启用了Kerberos的Kafka中数据的问题

kafka（十四）：SparkStreaming和Kafka接口的HA：checkpoints

SparkStreaming整合Kafka-0.8的官方文档要点翻译Spark Streaming + Kafka Integration Guide (Kafka broker version 0.8.2.1 or higher) Note: Kafka 0.8 support is deprecated as of Spark 2.3.0.

flume,kafka,sparkstreaming,hbase,hive连接2.kafka–spark-strming–hbase

spark streaming WordCount实例演示

中国移动运营分析实时监控平台之SparkStreaming实时数据分析并将最后结果存储到redis中业务概况

SparkStreaming整合Redis

Spark的笔记