阿裡雲大資料+AI技術沙龍上海站

時間：2019年11月16日（周六）下午

地點：上海市徐彙區裕德路126号（氪空間徐家彙社群）

報名連結:

https://www.slidestalk.com/m/61

活動日程

13:00 - 13:30 活動簽到

13:30 - 13:40 開場

13:40 - 14:20 基于Spark打造高效雲原生資料分析引擎

14:20 - 15:00 使用分布式自動機器學習進行時間序列分析

15:00 - 15:30 茶歇 & 自由交流

15:30 - 16:10 雲上大資料的存儲方案設計和選擇

16:10 - 16:50 從Python 到Java ，Pyboot加速大資料和AI的融合

16:50 - 17:00 活動抽獎環節

17:00 - 與EMR / Intel團隊技術專家自由交流讨論。

活動福利

現場簽到處，會提供100份禮品，先到先得；

每個議題後也都有隐藏禮物，更有和專家大咖一對一交流機會哦！

報名時請加入Apache Spark中國技術交流社群釘釘群，相關資料會在釘釘群内共享。

議題看點

議題一：

基于 Spark 打造高效雲原生資料分析引擎

辛庸，阿裡巴巴計算平台事業部 EMR 技術專家。Apache Hadoop，Apache Spark contributor。對 Hadoop、Spark、Hive、Druid 等大資料元件有深入研究。目前從事大資料雲化相關工作，專注于計算引擎、存儲結構、資料庫事務等内容。

議題簡介：

由阿裡巴巴 EMR 團隊送出的 TPC-DS 成績在九月份的榜單中取得了排名第一的成績。這個成績背後離不開 EMR 團隊對 Spark 執行引擎持續不斷的優化。

本次分享将選取一些有代表性的優化點，深入到技術細節做詳細介紹，包括但不限于動态過濾、CBO增強、TopK排序等等。

議題二：

使用分布式自動機器學習進行時間序列分析

喻杉，Intel大資料分析團隊軟體工程師。她目前專注于在analytics-zoo大資料和人工智能平台上開發自動機器學習元件。在加入intel前，她在浙江大學獲得了學士和碩士學位。

内容簡介：

對于時間序列預測搭建機器學習應用的過程非常繁瑣且需要大量經驗。為了提供一個簡單易用的時間序列預測工具，我們将自動機器學習應用于時間序列預測，将特征生成，模型選擇和超參數調優等過程實作自動化。我們的工具基于Ray（UC Berkeley RISELab開源的針對進階AI 應用的分布式架構，并作為Analytics zoo（由intel開源的統一的大資料分析和人工智能平台）的一部分功能提供給使用者。

議題三：

雲上大資料的存儲方案設計和選擇

姚舜揚，花名辰山，阿裡巴巴計算平台事業部 EMR 進階開發工程師，目前從事大資料存儲方面的開發和優化工作；

蘇昆輝，花名撫月，阿裡巴巴計算平台事業部 EMR 進階工程師, 曾就職于華為、網易. Apache HDFS committer. 對Hadoop、HBase等有深入研究, 對分布式存儲、高性能優化有豐富經驗. 目前從事大資料雲化相關工作.

上雲拐點已來，開源大資料上雲是業界共識。如何滿足在雲上低成本存儲海量資料的同時又實作高效率彈性計算的潛在需求？放眼業界，都有哪些成熟存儲方案和選擇？各自适用的存儲和計算場景是什麼？背後的技術關鍵和考慮因素都有哪些？歡迎大資料技術愛好者面對面交流和探讨！

議題四：

從Python 到Java ，Pyboot加速大資料和AI的融合

鄭锴，花名鐵傑，阿裡巴巴進階技術專家，Apache Hadoop PMC，Apache Kerby 創立者。深耕分布式系統開發和開源大資料多年，目前專注于在阿裡雲上提供更好用更有彈性的 Hadoop/Spark 大資料平台；

孫大鵬，花名誠曆，阿裡巴巴計算平台事業部 EMR 技術專家，Apache Sentry PMC，Apache Commons Committer，目前從事開源大資料存儲和優化方面的工作；

Python 代表機器學習生态，而以 Hadoop/Spark 為核心的開源大資料則以 Java 為主。前者擁有數不清的算法庫和程式，後者承載着海量資料和大量的企業應用。除了 SQL 這個标準方式和各種五花八門的協定接口，還有沒有更高效的一手資料通道，将兩個生态對接起來，乃至深度融合？Pyboot 是我們在這個方向上的探索。有興趣的同學歡迎現場觀摩示範和技術交流。

溫馨提示：

周邊交通：

1号線上海體育館站8号口步行10分鐘

4号線上海體育館站4号口步行10分鐘

3号線宜山路站2号口步行13分鐘

9号線宜山路站3号口步行11分鐘

阿裡雲 EMR 團隊，緻力于為客戶提供開源大資料 Hadoop/Spark 生态基于雲端的一站式，高可用彈性計算平台。EMR 團隊在國内營運最大的 Spark 社群（釘釘群号：21784001，團隊群号：HPRX8117），為了更好地傳播和分享業界最新技術和最佳實踐，現在聯合Intel及開源社群同行，打造一個純粹的技術交流線下沙龍《大資料 + AI》，定期為大家做公益分享。

阿裡雲大資料+AI技術沙龍上海站

繼續閱讀

Apache靜态檔案通路配置（書封伺服器）

apache httpd 配置

大資料排錯SparkSpark叢集啟動時候，JAVA_HOME is not sethadoop叢集，某台伺服器jps無任何輸出IDEAkafkahadoopspark sqlfile permissionsIDEA本地測試 - OutOfMemoryError: GC overhead limit exceededhdfs負載均衡

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

Ubuntu16.04安裝Apache+MySQL+PHP1. 安裝Apache2. 安裝MySQL3. 安裝PHP4. 安裝phpMyAdmin

淺談企業活動中進行資料分析的重要性

Apache配置SSLApache配置SSL

Windows下配置Apache的SSL服務

Apache2.4.x 配置檔案詳解Apache配置需要了解如下：開始講解：

配置apache支援PHP（win7）

無人機--飛控科普

Ambari介紹和架構原理

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark