轉載wangshen
主要是大資料應用方向
早上第一個聽了ibm 企業海量資料以及全面雲資料服務實踐,主要介紹 了ibm 雲計算的應用場景,主要是介紹ibm 在雲資料服務方面的應用,主要是分享了幾個客戶案例,其中一個是央視的西藏騎行的電視直播,中間涉及實體裝置資料采集,背後實時的資料分析,結合地理位置 資料,地圖以及運動員資料同時支援可視化,提升活動本身的參與性,整體全部基于ibm雲服務來做。整個開發周期10天,可見ibm在解決方案級别的能力較強,其次主要介紹了ibm 的雲服務。如下:


其次就是阿裡巴巴的神盾介紹集團的風控平台,整體建設思路和螞蟻的風控平台類似。
這裡融合計算概念沒有講的很清楚,其次基于zk 做名額邏輯的動态更新,而不需要中斷名額計算。
接下來主要是基于elastic stack 做的大資料多元分析。目前國内應用較多的大資料多元分析工具,一個是apache kylin 一個就是es。這裡主要介紹如何應用es 做名額分析。
1)資料收集:logstash+beats
logstash:在 server 端,處理傳入的日志,采用pipeline 的模式過濾計算資料,不支援資料之間的聚合操作。
beats:在client端,用于采集各種情況下的日志,日志包括db,redis,http,top,file,消息隊列。
2)資料分析:elasticsearch
elasticsearch 可以作為olap引擎來用。
elasticsearch目前加入了很多聚合的功能,包括
a)支援一些資料分析功能,包括柱狀圖、分布、統計、地理
b)支援任何資料:隻要資料能被查詢,就可以被分析
c)按需計算和實時性:可以按需實時計算、實時性在秒左右
d)可嵌套組合
3)資料展現:kibana kibana被用作資料展示工具,web 界面,用來搜尋和可視化日志。
現場看了一下es的示範,因為結合了可視化,資料采集以及資料清洗以及多元分析的能力,整體體驗較為不錯。
下午重點:
主要是攜程推薦平台負責人介紹了攜程推薦平台的介紹,核心點主要是rerank 以及abtest ,根據攜程的業務特有的推薦特征篩選等等。
另外比較重要的就是阿裡巴巴宗超介紹了集團在海量資料下資料研發體系的建設和管理,由于資料的暴增如何解決多樣資料的規範化存儲以及開發等等,核心觀念如何統一資料資産以及工具研發體系的标準化。
<a href="/go/1/4?postion=1" target="_blank">大資料計算服務(maxcompute)</a>
快速、完全托管的tb/pb級資料倉庫解決方案,向使用者提供了完善的資料導入方案以及多種經典的分布式計算模型,能夠更快速的解決使用者海量資料計算問題,有效降低企業成本,并保障資料安全。
<a href="/go/1/4?postion=1" target="_blank">了解更多</a>
歡迎加入“數加·maxcompute購買咨詢”釘釘群(群号: 11782920)進行咨詢,群二維碼如下: