[Spark streaming舉例]--實作過濾黑名單

2022-11-03 14:29:27

package com.scala.my

import org.apache.spark.SparkConf
import org.apache.spark.streaming.Durations
import org.apache.spark.streaming.StreamingContext

/**
 * 
 * @author root 
 *   過濾黑名單 
          步驟：
 *          1\在h15上開啟端口9999:#nc -lk 9999
 *          2\run本程式
 *          3\在h15的dos界面輸入日志内容：(注意格式是"日期+名稱")
 *          0509 yasaka
 *          0509 lily
 *          0509 cassie
 *          4\如果console沒有列印lily，那麼測試通過
 *         測試結果：通過
 */
object TransformBlackList {
  def main(args: Array[String]): Unit = {
    //擷取streamingContext
    val sc=new StreamingContext(new SparkConf().setAppName("transform").setMaster("local[2]"),Durations.seconds(8))
    /**
     * 建立模拟資料
     */
    val black=List(("lily",true))
    //需要sparkContext
    val blackRDD=sc.sparkContext.parallelize(black)
    //監聽h15上的9999端口
    val logs=sc.socketTextStream("h15", 9999)
    //分隔map
    val ds=logs.map { x => (x.split(" ")(1),x)}
    //建立transform操作
    val endDs =ds.transform( my=>{
      //左内連接配接：對于rdd和DStream連接配接     join是rdd和rdd連接配接
      val joinsRDD=my.leftOuterJoin(blackRDD)
      //過濾  
      val endRDD=joinsRDD.filter(tuple=>{
        /**
         * 舉例說明：
         * val cd=scores.getOrElse("Bob", 0)
         * 如果scores包含Bob,那麼傳回Bob,如果不包含，那麼傳回0
         */
        //意思是：tuple._2._2能get到值，傳回值，如果不能得到值，傳回false
        if (tuple._2._2.getOrElse(false)) {
false
}else{
true
}
      })
      //傳回值
     endRDD.map(_._2._1)
    })
    //列印
    endDs.print()
    //開啟
    sc.start()
    //等待
    sc.awaitTermination()
    //關閉資源
    sc.stop()
  }
}

[Spark streaming舉例]--實作過濾黑名單

繼續閱讀

windows下配置Apache的vhost初次接觸，強烈歡迎拍磚，指出錯誤

Apache與PHP環境下配置本地虛拟主機

Linux 7 中配置Apache服務，及禁止ip通路，删除apache廣告頁面。

Apache配置檔案中的deny和allow的使用

Apache 配置預設編碼

伺服器配置——Apache

Apache靜态檔案通路配置（書封伺服器）

apache httpd 配置

大資料排錯SparkSpark叢集啟動時候，JAVA_HOME is not sethadoop叢集，某台伺服器jps無任何輸出IDEAkafkahadoopspark sqlfile permissionsIDEA本地測試 - OutOfMemoryError: GC overhead limit exceededhdfs負載均衡

Ubuntu16.04安裝Apache+MySQL+PHP1. 安裝Apache2. 安裝MySQL3. 安裝PHP4. 安裝phpMyAdmin

Apache配置SSLApache配置SSL

Windows下配置Apache的SSL服務

Apache2.4.x 配置檔案詳解Apache配置需要了解如下：開始講解：

配置apache支援PHP（win7）

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

詳解STM32單片機的堆棧