天天看點

開發者社群精選直播合集 | Spark最佳實踐

往期精選合集包 (戳我前往)

囊括了:AI、架構師、 Serverless 、AIoT、DevOps、容器化、機器學習、雲計算、K8s、微服務、雲原生、視覺AI、大資料、小程式、物聯網等各種主題直播合集。

開發者社群精選直播合集 | Spark最佳實踐

Spark SQL模型變為線上服務

開發者社群精選直播合集 | Spark最佳實踐

講師:王太澤,第四範式特征工程資料庫負責人

推薦理由:SparkSQ在機器學習場景中應用模型從批量到實時面臨的問題諸如SparkSQL轉換成實時執行成本高、離線特征和線上特征保持一緻困難、離線效果與線上效果差距大等如何解?本視訊一直緻力于解決機器學習模型從離線到線上特征一緻性問題和性能問題的第四範式特征工程資料庫負責人王太澤給你分享經驗,并用SparkSQL實時上線demo給你分析他們與傳統實作方式的優勢。

戳我觀看

基于 Spark 打造高效雲原生資料分析引擎

開發者社群精選直播合集 | Spark最佳實踐

講師:辛庸,阿裡巴巴計算平台事業部 EMR 技術專家

推薦理由:由阿裡巴巴 EMR 團隊送出的 TPC-DS 成績如何能在九月份的榜單中取得了排名第一的成績?本視訊阿裡巴巴計算平台事業部 EMR 技術專家選取一些有代表性的優化點,深入到技術細節做詳細介紹,帶你了解動态過濾、CBO增強、TopK排序等等,給你展示這個成績背後EMR 團隊對 Spark 執行引擎持續不斷的優化成果。

Tblestore結合Spark的雲上流批一體大資料架構

開發者社群精選直播合集 | Spark最佳實踐

講師:王卓然, 花名琸然 阿裡雲存儲服務技術專家

推薦理由:傳統Lambda架構元件多運維複雜,如何使用一套存儲和一套計算來實作流批架構充分享受技術紅利?以Delta Lake為代表的新型資料湖方案越來越流行,傳統的Lambda架構如何向資料湖架構進行擴充?以及結構化資料結合Delta Lake的最佳解決方案是什麼。本視訊阿裡雲存儲服務技術專家琸然結合理論講解和實際場景為你一一解答。

基于Spark與TensorFlow的機器學習實踐

開發者社群精選直播合集 | Spark最佳實踐

講師:吳威(無謂), 阿裡巴巴進階技術專家

推薦理由:Apache Spark是目前最火熱的計算架構, TensorFlow是目前最火熱的機器學習架構,兩者個碰撞到一起會産生什麼巨大的火花?本視訊通過EMR和PAI在這個上面的實踐給你展示。

Spark Relational Cache實作亞秒級響應的互動式分析

開發者社群精選直播合集 | Spark最佳實踐

講師:王道遠(健身),阿裡雲EMR技術專家

推薦理由:Apache Spark被廣泛用于超大規模的資料分析處理,在互動式分析等時間敏感的場景中,超大規模資料量的處理時間可能無法滿足使用者快速響應的需求怎麼辦?本視訊阿裡雲EMR技術專家王道遠通過Spark Relational Cache的實作原理和使用場景,帶你了解如何通過資料的預組織和預計算,将頻繁通路的資料和計算提前執行并儲存在Relational Cache中,優化後續特定模式的查詢,顯著提高查詢速度,實作亞秒級的響應。

繼續閱讀