天天看點

人工智能和機器學習領域中10個開源項目

graphlab

graphlab是一種新的面向機器學習的并行架構。graphlab提供了一個完整的平台,讓機構可以使用可擴充的機器學習系統建立大資料以 分析産品,該公司客戶包括zillow、adobe、zynga、pandora、bosch、exxonmobil等,它們從别的應用程式或者服務中抓 取資料,通過推薦系統、欺詐監測系統、情感及社交網絡分析系統等系統模式将大資料理念轉換為生産環境下可以使用的預測應用程式。( 詳情 )

項目首頁: http://graphlab.org/

vowpal wabbit

vowpal wabbit (fast online learning)最初是由雅虎研究院建設的一個機器學習平台,目前該項目在微軟研究院。它是由john langford啟動并主導的項目。

項目位址: http://hunch.net/~vw/

scikits.learn

scikit-learn是一個開源的、建構在scipy之上用于機器學習的 python 子產品。它包括簡單而高效的工具,可用于資料挖掘和資料分析,适合于任何人,可在各種情況下重複使用、建構在 numpy、scipy和 matplotlib 之上,遵循bsd 協定。( 詳情 )

項目位址: http://scikit-learn.org/stable

theano

theano是一個python庫,用來定義、優化和模拟數學表達式計算,用于高效的解決多元數組的計算問題。它使得寫深度學習模型更加容易,同時也給出了一些關于在gpu上訓練它們的選項。( 詳情 )

項目位址: http://deeplearning.net/software/theano/

mahout

mahout 是 apache software foundation(asf) 旗下的一個開源項目,提供一些可擴充的機器學習領域經典算法的實作,旨在幫助開發人員更加友善快捷地建立智能應用程式。mahout包含許多實作,包括聚 類、分類、推薦過濾、頻繁子項挖掘。此外,通過使用 apache hadoop 庫,mahout 可以有效地擴充到雲中。

項目首頁: http://mahout.apache.org/

pybrain

pybrain是python的一個機器學習子產品,它的目标是為機器學習任務提供靈活、易應、強大的機器學習算法。pybrain包括神經網絡、強化學習(及二者結合)、無監督學習、進化算法。以神經網絡為核心,所有的訓練方法都以神經網絡為一個執行個體。

項目首頁: http://pybrain.org/

opencv

opencv是一個基于(開源)發行的跨平台計算機視覺庫,可以運作在linux、windows和mac os作業系統上。它輕量級而且高效——由一系列 c 函數和少量 c++ 類構成,同時提供了python、ruby、matlab等語言的接口,實作了圖像處理和計算機視覺方面的很多通用算法。( 詳情 )

項目首頁: http://opencv.org/

orange

orange 是一個基于元件的資料挖掘和機器學習軟體套裝,它的功能即友好,又很強大,快速而又多功能的可視化程式設計前端,以便浏覽資料分析和可視化,基綁定了 python以進行腳本開發。它包含了完整的一系列的元件以進行資料預處理,并提供了資料帳目,過渡,模組化,模式評估和勘探的功能。

項目首頁: http://orange.biolab.si/

nltk

nltk(natural language toolkit)是python的自然語言處理工具包。2001年推出,至今發展非常活躍。它的主要作用是為了教學,至今已經在20多個國家60多所高校 使用,裡面包括了大量的詞料庫,以及自然語言處理方面的算法實作:分詞, 詞根計算, 分類, 語義分析等。

項目首頁: http://nltk.org/

nupic

nupic是一個開源的人工智能平台。該項目由grok(原名 numenta)公司開發,其中包括了公司的算法和軟體架構。 nupic 的運作接近于人腦,“當模式變化的時候,它會忘掉舊模式,記憶新模式”。如人腦一樣,cla 算法能夠适應新的變化。( 詳情 )

項目首頁: http://numenta.org/nupic.html

原文釋出時間為:2014-12-10

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号