Spark修煉之道（進階篇）——Spark源碼閱讀：第十三節 Spark SQL之SQLContext（一)

2021-11-07 11:57:11

作者：周志湖

sqlcontext是spark sql進行結構化資料處理的入口，可以通過它進行dataframe的建立及sql的執行，其建立方式如下：

其對應的源碼為：

其調用的是私有的主構造函數：

當spark.sql.allowmultiplecontexts設定為true時，則允許建立多個sqlcontexts/hivecontexts，建立方法為newsession

其isrootcontext 被設定為false，否則會抛出異常，因為root sqlcontext隻能有一個，其它sqlcontext與root sqlcontext共享sparkcontext, cachemanager, sqllistener。如果spark.sql.allowmultiplecontexts為false，則隻允許一個sqlcontext存在

catalog用于登出表、登出表、判斷表是否存在等，例如當dataframe調用registertemptable 方法時

會sqlcontext的registerdataframeastable方法

sqlcontext.registerdataframeastable實質上調用的就是catalog的registertable 方法：

simplecatalog整體源碼如下：

sqlparser在sqlcontext的定義：

sparksqlparser為頂級的spark sql解析器，對spark sql支援的sql文法進行解析，其定義如下：

fallback函數用于解析其它非spark sql dialect的文法。

spark sql dialect支援的關鍵字包括：

用于解析ddl（data definition language 資料定義語言）

其支援的關鍵字有：

主要做三件事，分别是建立表、描述表和更新表

createtable方法具有如下（具體功能參考注釋說明）：

describetable及refreshtable代碼如下：

Spark修煉之道（進階篇）——Spark源碼閱讀：第十三節 Spark SQL之SQLContext（一)

繼續閱讀

實驗樓sql進階之成績管理系統的資料操作(window)

Spark流式分析系統實作流式實時日志分析系統

Scala和Java二種方式實戰Spark Streaming開發

Spark基礎:Spark簡介及特點,運作模式,安裝Spark,Driver與Executor,Local模式,Standalone模式,Yarn模式,Mesos模式,WordCount案例,HA配置第1章 Spark概述第2章 Spark運作模式第3章案例實操

HiveQl語句應用執行個體：WordCount具體步驟如下：

Spark實作wordcount

Oracle的基本操作

SQL優化SQL語句優化的目的

JAVA高效程式設計指南

關于SQL語言

SQL語言基礎：常用的資料查詢語句

大資料排錯SparkSpark叢集啟動時候，JAVA_HOME is not sethadoop叢集，某台伺服器jps無任何輸出IDEAkafkahadoopspark sqlfile permissionsIDEA本地測試 - OutOfMemoryError: GC overhead limit exceededhdfs負載均衡

neo4j之cypher使用文檔

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

【python】【資料處理】畫多元資料分布圖

sqlServer根據經緯查距離