資訊

阿裡雲E-MapReduce新版工作流管理正式上線

新版E-MapReduce工作流管理功能正式釋出上線，工作流排程和編排是大資料開發的重要場景。此次更新新增作業DAG執行，作業臨時查詢等功能，拖拽編輯工作流節點等功能，在作業并行化縮短執行時間，提升了易用性。歡迎了解更多E-MapReduce産品

詳情

。

2018 Gartner全球雲存儲魔力象限解讀：阿裡雲躍升至挑戰者雲存儲催熱資料湖

7月外媒披露了最新的Gartner全球雲存儲魔力象限，全球前四依然是亞馬遜AWS、微軟Azure、谷歌GCP和阿裡雲，與去年相比最大變化是，谷歌和阿裡雲各自躍升了一個象限，分别跻身上司者和挑戰者象限，這是中國雲計算廠商首次進入Gartner雲存儲挑戰者象限。

TensorFlow 版本 1.10.0 釋出

TensorFlow 1.10 預建構二進制檔案是針對 NCCL 2.2 建構的，并且在二進制安裝中不再包含 NCCL。使用多個 GPU 和 NCCL 的需要将 NCCL 更新到 2.2。

技術

Flink 在餓了麼的應用與實戰

餓了麼每天處理的資料量60TB資料，400個計算節點。文章詳細介紹了Storm，SparkStreaming，Flink 3種流式計算架構在餓了麼的應用優劣勢。

一種堆外記憶體緩存政策加速資料寫OSS

EMR叢集中作業寫資料到OSS時，需要先将資料緩存在本地，然後再一次性上傳到OSS中。本文介紹了堆外記憶體緩存政策加速資料寫OSS的方法。

斯坦福開源Weld：高效實作資料分析的端到端優化

Weld 是斯坦福大學 DAWN 實驗室的一個開源項目，在 CIDR 2017 論文中描述了它的初始原型。Weld 用于對結合了資料科學庫和函數的現有工作負載進行優化，而無需使用者修改代碼。我們在 VLDB 2018 論文中提出了 Weld 的自适應優化器，并得出了一些可喜的結果：通過在 Weld IR 上自動應用轉換可以實作工作負載數量級的加速。消融研究表明，循環融合等優化具有非常大的影響。本文主要介紹如何使用 Weld 的自适應優化器進行資料分析的端到端優化。

NVIDIA研究人員采用128塊Tesla V100 4小時完成40G文本訓練

近日，英偉達發表了一篇大規模語言模組化的論文，他們使用 128 塊 GPU 在 4 小時内使得 mLSTM 可以收斂，值得注意的是，他們使用的 Amazon Reviews 資料集包含 40GB 的文本，這在以前通常需要花費數周的時間進行訓練。這樣的大規模語言模型能作為一種預訓練模型遷移大量的語言知識，也就是說如果将其應用到機器翻譯、機器閱讀了解和情感分析等 NLP 任務，資料需求量和計算量都能得到大幅度的降低。

開源大資料周刊-2018年08月10日第96期資訊技術

資訊

技術

繼續閱讀

疾病研究：重症肌無力

Nacos 2.0 更新前後性能對比壓測

人工智能如何有效地運用于自然語言處理

尚矽谷—韓順平—圖解 Java設計模式（結構型）（55～）

Storm編譯打包過程中遇到的一些問題及解決方法

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

9.spark Core 進階2--Cashe

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

淺談企業活動中進行資料分析的重要性

無人機--飛控科普

Ambari介紹和架構原理

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark

開源大資料周刊-2018年08月10日 第96期資訊技術

資訊

技術

繼續閱讀

開源大資料周刊-2018年08月10日第96期資訊技術