天天看點

圖形化機器學習系統 EasyML

easyml 詳細介紹

easyml(easy machine learning)是一個簡單機器學習系統。

在該系統中,一個學習任務被構造為一個有向非循環圖(dag/directed acyclic graph),每個節點表征一步操作(即機器學習算法),每一條邊表征從一個節點到後一個即節點的資料流。

任務可被人工定義,或根據現有任務/模闆進行克隆。在把任務送出到雲端之後,每個節點将根據 dag 自動執行。圖形使用者界面被實作,進而可使使用者以拖拉的方式建立、配置、送出和監督一項任務。

系統包含三個主要元件:

不僅能實作流行的機器學習算法,也能實作資料預處理/後處理、資料格式轉變、特征生成、表現評估等算法。這些算法主要是基于 spark 實作的。

能讓使用者以拖放的方式創造、安裝、送出、監控、共享他們的機器學習流程。機器學習庫中所有的算法都可在此開發環境系統中獲得并安裝,它們是建構機器學習任務的主要基礎。

圖形化機器學習系統 EasyML

該服務基于開源的 hadoop 和 spark 大資料平台建立,在 docker 上組織了伺服器叢集。從 gui 上接受一個 dag 任務之後,在所有的獨立資料源準備好時,每個節點将會自動安排運作。對應節點的算法将會依據實作在 linux、spark 或者 map-reducecite 上自動安排運作。

圖形化機器學習系統 EasyML