SparkSeesion讀寫操作資料庫

2023-05-27 16:23:00

SparkSeesion讀寫操作資料庫

(親測有效)

object JDBCDemo {
  def main(args: Array[String]): Unit = {
    //擷取spark的連接配接
    val session = SparkSession.builder()
      .master("local")
      .appName(JDBCDemo.getClass.getSimpleName)
      .getOrCreate()
    import session.implicits._
    //擷取mysql的連接配接
    val url = "jdbc:mysql://localhost:3306/web01?characterEncoding=utf-8"

    val tname = "v_ip"
    val driver = "com.mysql.jdbc.Driver"
    //（第一種）方式：從mysql中讀取資料，read.format方法，最後必須用load來執行
    val load = session.read.format("jdbc").options(
      Map("url" -> url,
        "dbtable" -> tname,
        "user" -> "root",
        "password" -> "root",
        "driver" -> driver
      )
    ).load()
    //檢視表結構
    load.printSchema()
    //輸出表的資料類型
    println(load.schema)

    //查詢表中cnts > 100 資料
    val read: Dataset[Row] = load.where("cnts > 100")
    //展示的内容用到show方法
    //        .show()

    //資料入庫，需要new一個Properties方法
    val conn = new Properties()

    //擷取資料庫的使用者名，密碼和運作的driver類
    conn.setProperty("user", "root")
    conn.setProperty("password", "root")
    conn.setProperty("driver", driver)

    //（第二種）方式讀取資料庫中資料
    val read2 = session.read.format("jdbc").jdbc(url, tname, conn)
    read2.show()

    //（第三種）方式讀取資料庫中内容
    val read3 = session.read.jdbc(url,tname,conn)

    //寫入資料庫的（第一種）方法(此方法是預設模式（存在該表就直接報錯）)
    //調用jdbc方法，方法裡面的參數第一個是定義的url資料庫連接配接，第二個是表名，第三個是Properties類的執行個體化對象（我們命名為conn）
    read.write.jdbc(url, "emp", conn)

    //寫入資料庫的（第二種）方法：調用mode方法并傳入 SaveMode.Append 參數  （就是存在該表的情況下就直接在表後面追加）
    read2.write.mode(SaveMode.Append).jdbc(url, "emp", conn)

    //寫入資料庫（第三種）方式，調用mode方法并傳入 SaveMode.Overwrite 參數 (吐過存在該表的情況下 覆寫裡面的資料)
    read3.write.mode(SaveMode.Overwrite).jdbc(url, "emp", conn)

    session.close()
  }

}

作者：Morgan_Mu

來源：CSDN

原文：https://blog.csdn.net/mys_35088/article/details/81042729?utm_source=copy

SparkSeesion讀寫操作資料庫

SparkSeesion讀寫操作資料庫

繼續閱讀

Spark的RDD轉換算子-雙value型Spark的RDD轉換算子-雙value型

SparkSQL項目練習1 準備資料2 需求：各區域熱門商品Top3

Scala中的match(模式比對)

延雲行業搜尋資料庫在大資料生态中位置和重要性大資料的挑戰大資料技術的現狀延雲行業搜尋資料庫

Spark在windows環境裡跑時報錯找不到org.apache.hadoop.fs.FSDataInputStream

《快學Scala》——基礎

《快學scala》第13章練習答案

Spark流式分析系統實作流式實時日志分析系統

Scala和Java二種方式實戰Spark Streaming開發

Spark基礎:Spark簡介及特點,運作模式,安裝Spark,Driver與Executor,Local模式,Standalone模式,Yarn模式,Mesos模式,WordCount案例,HA配置第1章 Spark概述第2章 Spark運作模式第3章案例實操

Spark實作wordcount

9.spark Core 進階2--Cashe

大資料排錯SparkSpark叢集啟動時候，JAVA_HOME is not sethadoop叢集，某台伺服器jps無任何輸出IDEAkafkahadoopspark sqlfile permissionsIDEA本地測試 - OutOfMemoryError: GC overhead limit exceededhdfs負載均衡

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

win10本地scala和spark安裝安裝scala安裝spark

scala (3) Function 和 Method