這一次,開發者社群為正在“宅家辦公”的小夥伴們獻上福利~這次的合集整理了一些比較受開發者歡迎的關于大資料技術領域的優質文章。
不管是初涉該領域,還是已經有一定了解,相信都能從文章中獲益。大家快來學習吧~
1. 資料工程師必須掌握的7個大資料實戰項目
檢視原文- 值得收藏,資料工程師必須掌握的7個大資料實戰項目
2. 阿裡雲大資料+AI技術沙龍上海站回顧 | 揭秘TPC-DS 榜單第一名背後的強大引擎
- 11月16日的大資料+AI沙龍上海站取得圓滿成功! EMR 團隊在國内營運最大的 Spark 社群,為了更好地傳播和分享業界最新技術和最佳實踐,現在聯合開源社群同行,打造一個純粹的技術交流線下沙龍《大資料 + AI》,定期為大家做公益分享。本次分享,揭秘TPC-DS 榜單第一名背後的強大引擎,探索Pyboot如何打通大資料生态,一同學習業内最新的存儲方案和機器學習平台。
3. 數字化與資料中台的價值思考——徐季秋
- 資料中台是指通過資料技術,對海量資料進行采集、計算、存儲、加工,同時統一标準和口徑。資料中台把資料統一之後,會形成标準資料,再進行存儲,形成大資料資産層,進而為客戶提供高效服務。 狹義的資料中台單指資料技術,比如對海量資料進行采集、計算、存儲、加工的一系列技術集合,時下我們談到的資料中台還包括資料模型,算法服務,資料産品,資料管理以及方法論。 本篇主要從傳統企業數字化轉型的角度,淺析了數字中台的價值。
4. 【精品問答】大資料計算技術1000問
- 開發者社群策劃了大資料計算技術1000問内容,包含Flink、Spark等流式計算(實時計算)、離線計算、Hbase等實踐中遇到的技術問題和面試問題等次元内容。
5. 如何分析及處理 Flink 反壓?
- 反壓(backpressure)是實時計算應用開發中,特别是流式計算中,十分常見的問題。反壓意味着資料管道中某個節點成為瓶頸,處理速率跟不上上遊發送資料的速率,而需要對上遊進行限速。
6. 開放下載下傳!《阿裡巴巴大資料及AI實戰》深度解析典型場景大資料實踐
- 深度剖析淘寶、高德、友盟+、1688、優酷、阿裡媽媽、阿裡影業大資料實戰場景,2020不容錯過的企業大資料實戰手冊。
7. 獨家下載下傳 |《大資料工程師必讀手冊》揭秘阿裡如何玩轉大資料
- 阿裡巴巴如何玩轉大資料?十位阿裡巴巴大資料專家深度分析 ,飛天大資料平台八款産品最新玩法,2019不容錯過的大資料手冊——《大資料工程師必讀手冊》現在可以免費下載下傳閱讀啦,趕緊先睹為快吧。
8. 獨家下載下傳 |《大資料工程師必讀手冊》揭秘阿裡如何玩轉大資料
- 阿裡巴巴如何玩轉大資料?十位阿裡巴巴大資料專家深度分析 ,飛天大資料平台八款産品最新玩法,2019不容錯
9. 帶你讀《Apache Kylin權威指南》之一:Apache Kylin概述
- 從最早使用大資料技術來做批量處理,到現在越來越多的人要求大資料平台也能夠如傳統資料倉庫技術一樣支援互動式分析,随着資料量的不斷膨脹、資料平民化的不斷推進,低延遲、高并發地在Hadoop之上提供标準SQL查詢能力成為必須攻破的技術難題。而Apache Kylin的誕生正是基于這個背景,并成功地完成了很多人認為不可能實作的突破。
10. 帶你讀《Apache Kylin權威指南》之二:快速入門
- 本章介紹了使用Apache Kylin前必須了解的基本概念,如星形資料模型、事實表、維表、次元、度量等,并在了解這些基本概念的基礎上快速建立了基于Sample Data的模型,建構Cube,最後執行SQL查詢。帶領讀者體驗了Apache Kylin的主要使用過程。
11. 帶你讀《Apache Kylin權威指南》之三:Cube優化
- 本章從多個角度介紹了Cube的優化方法:從Cuboid剪枝的角度、從并發粒度控制的角度、從Rowkey設計的角度,還有從度量精度選擇的角度。總的來說,Cube優化需要Cube管理者對Kylin有較為深刻的了解和認識,這也無形中提高了使用和管理Kylin的門檻。
12. 賈揚清談大資料&AI發展的新挑戰和新機遇
- 2019雲栖大會大資料&AI專場,阿裡巴巴進階研究員賈揚清為我們帶來《大資料AI發展的新機遇和新挑戰》的分享。本文主要從人工智能的概念開始講起,談及了深度學習的發展和模型訓練,以及資料的爆發增長,着重闡述了算法、資料和算力的閉環。
13. 大資料團隊從0到1
- “大資料”這個詞,大家都已經不陌生了,已經從一個新興的詞彙變成了一個百姓茶餘飯後都會聊到的概念。各種大大小小的網際網路公司也都會建立自己的大資料團隊,我也曾經在多家公司從事過大資料領域的開發和團隊管理工作,這裡寫一下我自己的經曆和感受。
14. 詳解阿裡雲資料中台,一篇文章全面了解大資料“網紅”
- 一直想寫一篇關于資料中台正面文章,現在有閑時做些總結,想充分诠釋一下DT内部人如何看待資料中台。 資料中台的概念是最早由阿裡巴巴首次提出,是為了應對内部衆多業務部門千變萬化的資料需求和高速時效性的要求而成長起來的,它既要滿足業務部門日常性的多個業務前台的資料需求,又要滿足像雙十一,六一八這樣的業務高峰、應對大規模資料的線性可擴充問題、應對複雜活動場景業務系統的解耦問題,而在技術、組織架構等方面采取的一些變革。
15. 大資料人才培養經驗分享
- 總結了一下過去5年在各個高校進行大資料人才培養的經驗。