天天看點

開源大資料周刊-第97期資訊技術

資訊

機器學習雖然在過去幾年取得了重大進展,也出現了很多相關的架構,但因為缺乏事實上的标準,在重用和整合機器學習模型時通常涉及大量的定制化工作,而且在性能方面也存在不足。甲骨文開源的 GraphPipe 旨在解決這些問題,讓機器學習變得更加簡單,使企業更容易從任何架構部署和查詢機器學習模型。

Apache Flink 1.6.0在上周釋出,涵蓋多項重要更新,此版本繼續使 Flink 使用者能夠無縫地運作快速資料處理并輕松建構資料驅動和資料密集型應用程式。

雲端逐漸成為大資料企業的必争之地,近期開源分布式存儲系統Alluxio釋出1.8版本,加速針對資料分析及機器學習的雲端部署,新版本的功能包括了支援FUSE、針對不同雲端存儲方案的優化等。

技術

馬蜂窩大資料平台自 2017 年下半年引入 Apache Kylin 以來,極大的提升了資料分析師對于資料探索的效率。因為使用了 Apache Kylin,資料分析師可以直接查詢大資料、無需排隊、亞秒級響應,整體開發效率提高了 10 倍以上。

本文介紹了傳統Spark生态系統的架構,以及MongoDB作為一個資料庫存儲引擎在Spark生态的角色,着重介紹了使用MongoDB替換傳統HDFS後帶來的好處。

本文來自于王新春在2018年7月29日 Flink China社群線下 Meetup·上海站的分享,演講者分享了唯品會實時平台現狀,實時看闆、實時ETL等Flink應用場景,以及Flink在Kubernetes上的部署情況。

近年來,随着大資料與人工智能相關技術的迅速發展,新技術逐漸在全社會各行各業得到應用。銀行業作為一個高度資訊化的行業,首當其沖面臨着網際網路新技術應用的挑戰。民生銀行從2013年開始布局分布式、大資料及人工智能技術等領域,在支撐業務應用場景發展的同時,建設了幾大平台,支援可視化機器學習、實時推薦引擎、資料開放等場景。