TensorFlow 與 Apache Spark 結合：雅虎開源“TensorFlowOnSpark”

2021-11-10 00:17:41

雅虎昨日宣布開源 tensorflowonspark。

衆所周知，深度學習有海量資料需求。雷鋒網了解到，許多業内公司利用 spark 對超大規模的資料集進行管理。讓深度學習架構直接、友善地擷取這部分資料，将為 ml 開發提供極大助力。

雅虎在官方部落格中宣布了這一消息，并解釋了此前雅虎 big ml 開發團隊遇到的問題：

“現有的深度學習架構，往往需要設立單獨的深度學習資料組。這強迫我們為同一個機器學習流水線建立多個程式。維護多個獨立的資料組，要求我們在它們之間傳輸海量資料集——這導緻不必要的系統複雜性和端到端的學習延遲。”

為解決這一問題，雅虎此前開發了 caffeonspark。它使得基于 caffe 機器學習架構開發的程式，能與 apache spark 相容。雷鋒網(公衆号：雷鋒網)了解到，雅虎已将基于 caffeonspark 的程式，用于鑒别搜尋中的不恰當搜尋結果，以及自動探測電子競技遊戲直播視訊中的關鍵看點。

雅虎去年開源了 caffeonspark。如今它對 tensorflow 做了同樣的工作。兩者的原理幾乎相同，隻是把機器學習架構換成了 tensorflow。

雅虎表示，把 tensorflow 程式移植到 tensorflowonspark 相對友善，并經過反公司内部的反複驗證。

“這通常隻需要修改十行以内的 python 代碼。許多使用 tensorflow 的雅虎開發者已輕松地把 tensorflow 程式，移植到 tensorflowonspark 執行。”

<a href="https://www.leiphone.com/news/201701/ie9sclcu8nkb76jz.html">英特爾開源bigdl，可直接在spark架構下運作深度學習</a>

TensorFlow 與 Apache Spark 結合：雅虎開源“TensorFlowOnSpark”

繼續閱讀

httpd dead but subsys locked;No space left on device:Couldn't create accept loc

apache (httpd)不支援中文路徑問題先解除安裝yum安裝的httpd再用源碼安裝，重裝httpd再安裝支援中文的插件遇到問題

搭建httpd服務

windows下配置Apache的vhost初次接觸，強烈歡迎拍磚，指出錯誤

Apache與PHP環境下配置本地虛拟主機

Linux 7 中配置Apache服務，及禁止ip通路，删除apache廣告頁面。

Apache配置檔案中的deny和allow的使用

Apache 配置預設編碼

伺服器配置——Apache

Apache靜态檔案通路配置（書封伺服器）

apache httpd 配置

Ubuntu16.04安裝Apache+MySQL+PHP1. 安裝Apache2. 安裝MySQL3. 安裝PHP4. 安裝phpMyAdmin

Apache配置SSLApache配置SSL

Windows下配置Apache的SSL服務

Apache2.4.x 配置檔案詳解Apache配置需要了解如下：開始講解：

配置apache支援PHP（win7）