金秋桂花香,正是上海相聚好時節。還記得盛夏降臨時我們舉辦的大資料+AI Meetup第一站嗎,雖然疫情目前采用了線上直播的形式,但是我們仍然邀請了來自阿裡巴巴、Databricks、快手、網易雲音樂的7位技術專家,在北京、上海、杭州3地,集中解讀上半年大資料的熱門話題。時隔4個月,大資料江湖又有哪些風起雲湧的技術突破,網際網路大廠又探索出怎樣的無價經驗,敬請期待由阿裡雲計算平台事業部與阿裡雲開發者社群聯合主辦的大資料+AI meetup 2020第二站·上海。
線上線下,各有千秋,會場名額有限,報名搶入場券:
http://hdxu.cn/1q8ZL
議題亮點
8個議題無不凸顯宇宙真理:開源屆前浪後浪全員兇猛,合體也成為主流。我們将會一睹Flink和Iceberg,Flink和 Hologres,Flink和Pulsar的深度融合的火花、Spark高性能向量化查詢引擎解析、熱度沖天的資料湖存儲架構選型、bilibili 和滴滴的kafka平台優化方案;還有Elasticsearch、開源流式存儲系統 Pravega 的實踐探索也不容錯過。
議題摘要
更低延時和更高吞吐量的流存儲, Pravega性能詳解
嘉賓簡介:
雷璐,DellEMC, Senior Principal Engineer, 在分布式對象存儲和流存儲産品上有着10年+設計架構經驗。現主要專注于流式系統上資料全文檢索方向-Pravega Search.
演講簡介:
選取流系統幾個标準場景去比較Pravega, Kafka, and Pulsar性能,并且會公開所有技術細節
基于spark的高性能向量化查詢引擎基于spark的高性能向量化查詢引擎
範文臣,Databricks 開源組技術主管,Apache Spark Committer、PMC成員,Spark開源社群核心開發之一。
本次演講将向大家分享Databricks在建構向量化查詢引擎過程中的一些實踐經驗。
資料湖存儲架構選型
鄭锴,花名鐵傑,阿裡巴巴進階技術專家,Apache Hadoop PMC。專注于在阿裡雲上研發業界領先的 Hadoop/Spark 大資料平台和資料湖解決方案産品。
着重讨論資料湖架構和應用在存儲上面臨的主要挑戰,方案選型和最佳實踐。
Flink + Hologres 雲原生實時數倉最佳實踐
劉一鳴,花名合一, 阿裡雲進階産品專家,主要負責Hologres産品的演進和商業化。Apache Kylin PMC & Committer。
分享Hologres設計理念和架構體系,解析大資料如何支援分析服務一體化,分享實時數倉建設實踐案例。
Iceberg+Flink 應用場景深度分析
李勁松,花名之信,阿裡巴巴技術專家,Apache Flink&Iceberg Committer,長期專注于流批一體的計算與數倉架構。
1.Iceberg及資料湖介紹
2.建構數倉Data Pipeline
3.數倉實時化流批統一,Backfilling: 流作業Bootstrap
4.建構CDC Pipeline
萬億級消息隊列Kafka在滴滴的實踐
張亮,滴滴大資料架構部,進階技術專家, 2014年加入滴滴,具有豐富的高并發、高吞吐場景的架構設計與研發經驗。
分享滴滴在Kafka高可用建設上在架構與引擎上的針對性優化;在Kafka可觀察性與運維友好性上在Kafka雲平台的建設實踐。
Kafka practice at bilibili
張辰安,bilibili 資深開發工程師
介紹在大流量下kafka的痛點及解決方案。
Apache Pulsar + Flink:統一批流處理最佳實踐
趙建雲,StreamNative 工程師,Apache Pulsar Contributor
介紹批流融合帶來的新特性,例如并行批處理讀取使用批處理工作負載、Key_Shared訂閱等,分享批流融合處理的最佳實踐案例。
Elasticsearch 大資料應用能力探查
李猛,上海力萌資訊科技有限公司,資料技術專家。
1.全面介紹Elastic Stack自有大資料的處理能力、應用場景案例。
2.了解Elasticsearch與其它大資料産品混合能力、應用場景案例。
更多議題詳情請見後續文章。線上同樣精彩,本次會議仍然保留直播,為不能到現場的同學同步精彩分享,速來預約直播,不錯過當日推送。
免費報名搶入場券: 直播間位址: https://developer.aliyun.com/live/245461
行程小助手:
- 73coffee位于上海地鐵10号線江灣體育場地鐵站,10号口步行604米處。
- 前樓有地下停車場10元/小時
了解更多資訊請加入大資料+AI釘釘群:
———— 合作夥伴 ————