《Apache Spark 中文實戰攻略》重磅來襲!
點選下載下傳
>>《Apache Spark 中文實戰攻略(上冊)》<<
或者複制該連結到浏覽器完成下載下傳或分享: https://developer.aliyun.com/topic/download?id=821
《Apache Spark 中文實戰攻略》上下兩冊電子書重磅來襲,本書集結國内外頂級大廠技術專家,彙集多年實戰經驗,帶你走進全球頂級開源社群之一 Apache Spark,探秘時下最流行的開源分布式記憶體式大資料處理引擎。
《Apache Spark 中文實戰攻略(上冊)》—— 讓你的資料處理更簡單!Spark+AI Summit 2020 中文精華版峰會全新收錄!Apache Spark 3.0 性能優化與基礎實戰一書看遍!

想看全套電子書?沒問題!點選下面連結一鍵下載下傳《Apache Spark 中文實戰攻略(下冊)》:https://developer.aliyun.com/topic/download?id=822
關于 Apache Spark
Apache Spark是快速、易于使用的架構,允許你解決各種複雜的資料問題,無論是半結構化、結構化、流式,或機器學習、資料科學。它也已經成為大資料方面最大的開源社群之一,擁有來自250多個組織的超過1000個貢獻者,以及遍布全球570多個地方的超過30萬個Spark Meetup社群成員。
精彩導讀
Apache Spark 3.0:十年回顧,展望未來
Spark 3.0是Spark有史以來最大的Release,共包含3400多個patch,幾乎一半的patch都屬于Spark SQL。Spark SQL 的優化不僅服務于SQL language,還服務于機器學習、流計算和Dataframes等計算任務,這使得社群對Spark SQL的投 入非常大。此外,Spark團隊還付出了大量努力使Spark 2.0的使用者友善地更新到3.0。
今年是Spark釋出的第十年,回顧Spark如何一步步發展到今天,其發展過程所積累的經 驗,以及這些經驗對Spark未來發展的啟發,對Spark大有脾益。Databricks Spark研發部主管李潇帶來了《Apache Spark 3.0簡 介:回顧過去的十年,并展望未來》的全面解析,為大家介紹了Spark的起源、發展過程及最新進 展,同時展望了Spark的未來。
點選檢視更多内容: https://developer.aliyun.com/article/769210?spm=a2c6h.12873581.0.0.cf4c3a18YeGsE7&groupCode=apachespark
資料湖:資料工程師的得力助手
相信作為一個資料工程師,心中都有這麼一個理想的工具:
- 可以持續不斷地對各種各樣的資料源進行增量處理;
- 批流合一;
- 處理速率高效,智能化生成報表。
Databricks開源組技術主管範文臣從資料工程師的角度出發向大家介紹了Delta Lake
https://developer.aliyun.com/article/768353?spm=a2c6h.12873581.0.0.cf4c3a18YeGsE7&groupCode=apachespark
實時數倉,快速建構Near-RealTime的Data Pipeline.
當離線的同步方案已經不能滿足業務需求,現有離線任務基本都是動辄幾百行SQL,邏輯複雜,核桃程式設計資料架構師盧聖剛分享了核桃程式設計應用EMR建設 Delta Lake 實時數倉的實踐。
https://developer.aliyun.com/article/747448?spm=a2c6h.12873581.0.0.4c7347b4kZF5up&groupCode=aliyunemr
SQL性能改進:不斷進化
從spark 2.4開始,大概有超過 一年半的時間。對于一個比較活躍的開源項目來說,這個時間是非常長的。是以裡面包含了大量的 這種功能增強,性能優化,等各方面的新的feature在裡面。大概超過50%的相關的issue都是和 SQL相關的。阿裡巴巴進階技術專家李呈祥為大家帶來Apache Spark 3.0中的SQL性能改進概覽的介紹。
https://developer.aliyun.com/article/768262?spm=a2c6h.12873581.0.0.cf4c3a18YeGsE7&groupCode=apachespark
更多精彩技術集錦,加入Apache Spark 釘釘技術交流群
藏經閣系列電子書
阿裡雲開發者社群——藏經閣系列電子書,彙聚了一線大廠的技術沉澱精華,爆款不斷。
點選連結擷取海量免費電子書:
https://developer.aliyun.com/ebook