天天看點

Hive On Spark和SparkSQL

SparkSQL和Hive On Spark都是在Spark上實作SQL的解決方案。Spark早先有Shark項目用來實作SQL層,不過後來推翻重做了,就變成了SparkSQL。這是Spark官方Databricks的項目,Spark項目本身主推的SQL實作。

Hive On Spark比SparkSQL稍晚。Hive原本是沒有很好支援MapReduce之外的引擎的,而Hive On Tez項目讓Hive得以支援和Spark近似的Planning結構(非MapReduce的DAG)。是以在此基礎上,Cloudera主導啟動了Hive On Spark。這個項目得到了IBM,Intel和MapR的支援(但是沒有Databricks)。

繼續閱讀