國内Spark開發者的免費入門寶典！首發作者陣容高手雲集！

《Apache Spark 中文實戰攻略》重磅來襲！

點選下載下傳

>>《Apache Spark 中文實戰攻略（上冊）》<<

或者複制該連結到浏覽器完成下載下傳或分享： https://developer.aliyun.com/topic/download?id=821

《Apache Spark 中文實戰攻略》上下兩冊電子書重磅來襲，本書集結國内外頂級大廠技術專家，彙集多年實戰經驗，帶你走進全球頂級開源社群之一 Apache Spark，探秘時下最流行的開源分布式記憶體式大資料處理引擎。

《Apache Spark 中文實戰攻略（上冊）》—— 讓你的資料處理更簡單！Spark+AI Summit 2020 中文精華版峰會全新收錄！Apache Spark 3.0 性能優化與基礎實戰一書看遍！

想看全套電子書？沒問題！點選下面連結一鍵下載下傳《Apache Spark 中文實戰攻略（下冊）》：

https://developer.aliyun.com/topic/download?id=822

關于 Apache Spark

Apache Spark是快速、易于使用的架構，允許你解決各種複雜的資料問題，無論是半結構化、結構化、流式，或機器學習、資料科學。它也已經成為大資料方面最大的開源社群之一，擁有來自250多個組織的超過1000個貢獻者，以及遍布全球570多個地方的超過30萬個Spark Meetup社群成員。

精彩導讀

Apache Spark 3.0：十年回顧，展望未來

Spark 3.0是Spark有史以來最大的Release，共包含3400多個patch，幾乎一半的patch都屬于Spark SQL。Spark SQL 的優化不僅服務于SQL language，還服務于機器學習、流計算和Dataframes等計算任務，這使得社群對Spark SQL的投入非常大。此外，Spark團隊還付出了大量努力使Spark 2.0的使用者友善地更新到3.0。

今年是Spark釋出的第十年，回顧Spark如何一步步發展到今天，其發展過程所積累的經驗，以及這些經驗對Spark未來發展的啟發，對Spark大有脾益。Databricks Spark研發部主管李潇帶來了《Apache Spark 3.0簡介:回顧過去的十年，并展望未來》的全面解析，為大家介紹了Spark的起源、發展過程及最新進展，同時展望了Spark的未來。

點選檢視更多内容： https://developer.aliyun.com/article/769210?spm=a2c6h.12873581.0.0.cf4c3a18YeGsE7&groupCode=apachespark

資料湖：資料工程師的得力助手

相信作為一個資料工程師，心中都有這麼一個理想的工具:

可以持續不斷地對各種各樣的資料源進行增量處理;
批流合一;
處理速率高效，智能化生成報表。

Databricks開源組技術主管範文臣從資料工程師的角度出發向大家介紹了Delta Lake

https://developer.aliyun.com/article/768353?spm=a2c6h.12873581.0.0.cf4c3a18YeGsE7&groupCode=apachespark

實時數倉，快速建構Near-RealTime的Data Pipeline.

當離線的同步方案已經不能滿足業務需求，現有離線任務基本都是動辄幾百行SQL，邏輯複雜，核桃程式設計資料架構師盧聖剛分享了核桃程式設計應用EMR建設 Delta Lake 實時數倉的實踐。

https://developer.aliyun.com/article/747448?spm=a2c6h.12873581.0.0.4c7347b4kZF5up&groupCode=aliyunemr

SQL性能改進：不斷進化

從spark 2.4開始，大概有超過一年半的時間。對于一個比較活躍的開源項目來說，這個時間是非常長的。是以裡面包含了大量的這種功能增強，性能優化，等各方面的新的feature在裡面。大概超過50%的相關的issue都是和 SQL相關的。阿裡巴巴進階技術專家李呈祥為大家帶來Apache Spark 3.0中的SQL性能改進概覽的介紹。

https://developer.aliyun.com/article/768262?spm=a2c6h.12873581.0.0.cf4c3a18YeGsE7&groupCode=apachespark

更多精彩技術集錦，加入Apache Spark 釘釘技術交流群

藏經閣系列電子書

阿裡雲開發者社群——藏經閣系列電子書，彙聚了一線大廠的技術沉澱精華，爆款不斷。

點選連結擷取海量免費電子書：

https://developer.aliyun.com/ebook

國内Spark開發者的免費入門寶典！首發作者陣容高手雲集！

《Apache Spark 中文實戰攻略》重磅來襲！

關于 Apache Spark

精彩導讀

Apache Spark 3.0：十年回顧，展望未來

資料湖：資料工程師的得力助手

實時數倉，快速建構Near-RealTime的Data Pipeline.

SQL性能改進：不斷進化

藏經閣系列電子書

繼續閱讀

Apache靜态檔案通路配置（書封伺服器）

apache httpd 配置

大資料排錯SparkSpark叢集啟動時候，JAVA_HOME is not sethadoop叢集，某台伺服器jps無任何輸出IDEAkafkahadoopspark sqlfile permissionsIDEA本地測試 - OutOfMemoryError: GC overhead limit exceededhdfs負載均衡

Ubuntu16.04安裝Apache+MySQL+PHP1. 安裝Apache2. 安裝MySQL3. 安裝PHP4. 安裝phpMyAdmin

淺談企業活動中進行資料分析的重要性

Apache配置SSLApache配置SSL

Windows下配置Apache的SSL服務

Apache2.4.x 配置檔案詳解Apache配置需要了解如下：開始講解：

配置apache支援PHP（win7）

neo4j之cypher使用文檔

Ambari介紹和架構原理

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

【python】【資料處理】畫多元資料分布圖

NOSQL安全攻擊

sqlServer根據經緯查距離

win10本地scala和spark安裝安裝scala安裝spark