天天看點

國内Spark開發者的免費入門寶典!首發作者陣容高手雲集!

《Apache Spark 中文實戰攻略》重磅來襲!

點選下載下傳

>>《Apache Spark 中文實戰攻略(上冊)》<<

或者複制該連結到浏覽器完成下載下傳或分享: https://developer.aliyun.com/topic/download?id=821

《Apache Spark 中文實戰攻略》上下兩冊電子書重磅來襲,本書集結國内外頂級大廠技術專家,彙集多年實戰經驗,帶你走進全球頂級開源社群之一 Apache Spark,探秘時下最流行的開源分布式記憶體式大資料處理引擎。

《Apache Spark 中文實戰攻略(上冊)》—— 讓你的資料處理更簡單!Spark+AI Summit 2020 中文精華版峰會全新收錄!Apache Spark 3.0 性能優化與基礎實戰一書看遍!

國内Spark開發者的免費入門寶典!首發作者陣容高手雲集!
國内Spark開發者的免費入門寶典!首發作者陣容高手雲集!
想看全套電子書?沒問題!點選下面連結一鍵下載下傳《Apache Spark 中文實戰攻略(下冊)》:
https://developer.aliyun.com/topic/download?id=822

關于 Apache Spark

Apache Spark是快速、易于使用的架構,允許你解決各種複雜的資料問題,無論是半結構化、結構化、流式,或機器學習、資料科學。它也已經成為大資料方面最大的開源社群之一,擁有來自250多個組織的超過1000個貢獻者,以及遍布全球570多個地方的超過30萬個Spark Meetup社群成員。

精彩導讀

Apache Spark 3.0:十年回顧,展望未來

Spark 3.0是Spark有史以來最大的Release,共包含3400多個patch,幾乎一半的patch都屬于Spark SQL。Spark SQL 的優化不僅服務于SQL language,還服務于機器學習、流計算和Dataframes等計算任務,這使得社群對Spark SQL的投 入非常大。此外,Spark團隊還付出了大量努力使Spark 2.0的使用者友善地更新到3.0。

今年是Spark釋出的第十年,回顧Spark如何一步步發展到今天,其發展過程所積累的經 驗,以及這些經驗對Spark未來發展的啟發,對Spark大有脾益。Databricks Spark研發部主管李潇帶來了《Apache Spark 3.0簡 介:回顧過去的十年,并展望未來》的全面解析,為大家介紹了Spark的起源、發展過程及最新進 展,同時展望了Spark的未來。

點選檢視更多内容: https://developer.aliyun.com/article/769210?spm=a2c6h.12873581.0.0.cf4c3a18YeGsE7&groupCode=apachespark

資料湖:資料工程師的得力助手

相信作為一個資料工程師,心中都有這麼一個理想的工具:

  • 可以持續不斷地對各種各樣的資料源進行增量處理;
  • 批流合一;
  • 處理速率高效,智能化生成報表。

Databricks開源組技術主管範文臣從資料工程師的角度出發向大家介紹了Delta Lake

https://developer.aliyun.com/article/768353?spm=a2c6h.12873581.0.0.cf4c3a18YeGsE7&groupCode=apachespark

實時數倉,快速建構Near-RealTime的Data Pipeline.

當離線的同步方案已經不能滿足業務需求,現有離線任務基本都是動辄幾百行SQL,邏輯複雜,核桃程式設計資料架構師盧聖剛分享了核桃程式設計應用EMR建設 Delta Lake 實時數倉的實踐。

https://developer.aliyun.com/article/747448?spm=a2c6h.12873581.0.0.4c7347b4kZF5up&groupCode=aliyunemr

SQL性能改進:不斷進化

從spark 2.4開始,大概有超過 一年半的時間。對于一個比較活躍的開源項目來說,這個時間是非常長的。是以裡面包含了大量的 這種功能增強,性能優化,等各方面的新的feature在裡面。大概超過50%的相關的issue都是和 SQL相關的。阿裡巴巴進階技術專家李呈祥為大家帶來Apache Spark 3.0中的SQL性能改進概覽的介紹。

https://developer.aliyun.com/article/768262?spm=a2c6h.12873581.0.0.cf4c3a18YeGsE7&groupCode=apachespark

更多精彩技術集錦,加入Apache Spark 釘釘技術交流群

國内Spark開發者的免費入門寶典!首發作者陣容高手雲集!

藏經閣系列電子書

阿裡雲開發者社群——藏經閣系列電子書,彙聚了一線大廠的技術沉澱精華,爆款不斷。

點選連結擷取海量免費電子書:

https://developer.aliyun.com/ebook
國内Spark開發者的免費入門寶典!首發作者陣容高手雲集!

繼續閱讀