天天看點

微軟推 Azure 機器學習工具:Algorithm Cheat Sheet

Azure Machine Learning Studio 有着大量的機器學習算法,現在你可以使用它來建構預測分析解決方案。這些算法可用于一般的機器學習:回歸分析、分類、聚類和異常檢測,且每一個都可以解決不同類型的機器學習問題。

現在的問題是,是否有什麼工具之類的東西可幫助找出如何選擇一個合适的機器學習算法,并根據具體的方案?

微軟推 Azure 機器學習工具:Algorithm Cheat Sheet

點選這裡檢視大圖。

點選此處下載下傳 Cheat Sheet:Microsoft Azure Machine Learning Algorithm Cheat Sheet

微軟 Azure 的機器學習 Algorithm Cheat Sheet 旨在幫助你篩選可用的機器學習算法,并選擇合适的一個來用于預測分析解決方案。Cheat Sheet 會詢問你這兩個問題:資料的性質、你工作想要解決的問題等,然後提出一個你可以嘗試的算法的建議。

Azure Machine Learning Studio 為你提供了靈活的體驗:嘗試一種算法,如果你對結果不滿意,那就嘗試另一種。(Azure 機器學習是免費的,也不需要什麼許可,點選這裡試用。)這裡有一個來自 Azure Machine Learning Gallery 的例子,該實驗是嘗試用幾種不同的算法用在相同的資料上,然後進行結果比較:Compare Multi-class Classifiers: Letter recognition。

  • 對于不同類型的機器學習算法和如何使用的深入讨論,參見:How to choose an algorithm in Azure Machine Learning。
  • 所有的機器學習算法清單都在 Machine Learning Studio 中可獲得,參見:Initialize Model。

關于 Azure Machine Learning Studio

Azure Machine Learning Studio 提供了許多不同的先進機器學習算法來幫助你生成分析模型。首先,确定要執行的機器學習任務的正常類型,因為歸組在每個類别中的算法适合特定的預測任務。

選擇一種算法并配置其參數後,可以使用訓練子產品之一通過標明算法運作資料,也可以使用掃描參數循環通路所有可能的參數并确定任務和資料的最佳配置。

學習算法的類别

Azure Machine Learning Studio 提供了以下各種類型的機器學習算法,它們按典型的機器學習方案來分組。

  • 異常檢測

異常檢測包含許多機器學習方面的重要任務,異常檢測技術适用于各種行業:

1. 辨別可能具有欺詐性的事務。
2. 學習訓示發生了網絡入侵的模式
3. 查找異常的患者群集
4. 檢查輸入到系統的值
           

根據定義,異常屬于罕見事件,是以可能很難收集有代表性的資料樣本來進行模組化。本節中包含的算法已經過專門設計,可以解決異常檢測的核心建構和訓練模型問題。

此類别包括以下子產品:單類支援向量機、基于 PCA 的異常檢測。

  • 分類

分類算法用于預測單個資料執行個體的類或類别。例如,電子郵件篩選器使用二進制分類來确定某封電子郵件是否為垃圾郵件。有兩種形式的分類任務。一種是旨在預測兩個結果之一的二進制分類,另一種是旨在預測多個結果之一的多類分類。分類算法的輸出為分類器,可用于預測新的(未标記)執行個體的标簽。

類别 Modules References.Machine Learning.Initialize Model.Classification 包括以下子產品:多類決策林、多類決策森林、多類邏輯回歸、多類神經網絡、一對多多類、雙類平均感覺器、雙類貝葉斯點機、雙類提升決策樹、雙類決策林、雙類決策森林、雙類邏輯回歸、雙類神經網絡、雙類支援向量機、雙類局部深層支援向量機。

  • 聚類

聚類算法可以基于一組特征學習了解如何将一組項分組在一起。例如,聚類通常在文本分析中使用,以便将包含常見單詞的文本片段分組在一起。可以使用聚類通過找出最接近的資料點,然後确定每種組合的質心或中心點,來分組未标記的資料。訓練算法後,可以使用它來預測資料執行個體所屬的聚類。

類别 Modules References.Machine Learning.Initialize Model.Clustering 包括子產品:K 平均值聚類

  • 回歸

回歸算法是學習預測單個資料執行個體的實際函數字的算法。例如,房價預測器可以使用回歸算法來預測目前的房價。回歸算法确定要執行回歸函數的資料的每個特征分布。算法訓練用于預測标記資料的函數後,可用于預測新的(未标記)執行個體的标簽。

類别 Modules References.Machine Learning.Initialize Model.Regression

英文原文:Microsoft Azure Machine Learning Algorithm Cheat Sheet

極客頭條正式開通了微信公衆号,在微信搜尋“csdn_geek”或掃描下方的二維碼即可關注。

微軟推 Azure 機器學習工具:Algorithm Cheat Sheet

繼續閱讀