本講義出自<b>seth dobrin</b>在spark summit east 2017上的演講,主要分享了如何基于混合雲上的spark技術以及kafka幫助資料科學進行變革轉型。
大多數企業的業務還是需要在之前的環境中運作,簡單粗暴地上雲絕對不是大多數公司的選擇。遷移上雲需要大量的資料和應用,而在使用圍繞資料的應用建立資料資産的過程中,很關鍵的一個部分就是需要用到spark以及一些開源工具。如果非要等到大型企業都以經準備好上雲時,你已經錯失了使用混合雲的最佳時機,而混合雲卻能為我們在建構長期的雲計算政策的同時提供在雲上使用spark等開源技術的機會。