天天看點

推薦!國外程式員整理的機器學習資源大全

計算機視覺

MLPack

DLib

ecogg

shark

Closure Toolbox—Clojure語言庫與工具的分類目錄

go-porterstemmer—一個Porter詞幹提取算法的原生Go語言淨室實作

paicehusk—Paice/Husk詞幹提取算法的Go語言實作

snowball—Go語言版的Snowball詞幹提取器

Go Learn— Go語言機器學習庫

go-pr —Go語言機器學習包.

bayesian—Go語言樸素貝葉斯分類庫。

go-galib—Go語言遺傳算法庫。

Hadoop—大資料分析平台

Spark—快速通用的大規模資料處理引擎。

Impala —為Hadoop實作實時查詢

Twitter-text-js —JavaScript實作的推特文本處理庫

NLP.js —javascript及coffeescript編寫的NLP工具

natural—Node下的通用NLP工具

Knwl.js—JS編寫的自然語言處理器

通用機器學習

Topic Models —Julia下的主題模組化

Text Analysis—Julia下的文本分析包

Lua

NLP —一個Matlab的NLP庫

OpenCVDotNet —包裝器,使.NET程式能使用OpenCV代碼

Emgu CV—跨平台的包裝器,能在Windows, Linus, Mac OS X, iOS, 和Android上編譯。

numl —numl這個機器學習庫,目标就是簡化預測和聚類的标準模組化技術。

Math.NET Numerics— Math.NET項目的數值計算基礎,着眼提供科學、工程以及日常數值計算的方法和算法。支援 Windows, Linux 和 Mac上的 .Net 4.0, .Net 3.5 和 Mono ,Silverlight 5, WindowsPhone/SL 8, WindowsPhone 8.1 以及裝有 PCL Portable Profiles 47 及 344的Windows 8, 裝有 Xamarin的Android/iOS 。

Sho — Sho是資料分析和科學計算的互動式環境,可以讓你将腳本(IronPython語言)和編譯的代碼(.NET)無縫連接配接,以快速靈活的建立原型。這個環 境包括強大高效的庫,如線性代數、資料可視化,可供任何.NET語言使用,還為快速開發提供了功能豐富的互動式shell。

SimpleCV—開源的計算機視覺架構,可以通路如OpenCV等高性能計算機視覺庫。使用Python編寫,可以在Mac、Windows以及Ubuntu上運作。

SciPy —基于Python的數學、科學、工程開源軟體生态系統。

NumPy—Python科學計算基礎包。

Numba —Python的低級虛拟機JIT編譯器,Cython and NumPy的開發者編寫,供科學計算使用

NetworkX —為複雜網絡使用的高效軟體。

Pandas—這個庫提供了高性能、易用的資料結構及資料分析工具。

Open Mining—Python中的商業智能工具(Pandas web接口)。

PyMC —MCMC采樣工具包。

zipline—Python的算法交易庫。

PyDy—全名Python Dynamics,協助基于NumPy, SciPy, IPython以及 matplotlib的動态模組化工作流。

SymPy —符号數學Python庫。

statsmodels—Python的統計模組化及計量經濟學庫。

astropy —Python天文學程式庫,社群協作編寫

matplotlib —Python的2D繪圖庫。

bokeh—Python的互動式Web繪圖庫。

plotly —Python and matplotlib的協作web繪圖庫。

vincent—将Python資料結構轉換為Vega可視化文法。

d3py—Python的繪圖庫,基于D3.js。

ggplot —和R語言裡的ggplot2提供同樣的API。

Kartograph.py—Python中渲染SVG圖的庫,效果漂亮。

pygal—Python下的SVG圖表生成器。

pycascading

自然語言處理

Ruby Machine Learning —Ruby實作的一些機器學習算法。

Machine Learning Ruby

jRuby Mahout —精華!在JRuby世界中釋放了Apache Mahout的威力。

CardMagic-Classifier—可用貝葉斯及其他分類法的通用分類器子產品。

Neural Networks and Deep Learning—《神經網絡和深度學習》一書的示例代碼。

資料分析/資料可視化

MLlib in Apache Spark—Spark下的分布式機器學習庫

Scalding —CAscading的Scala接口

Summing Bird—用Scalding 和 Storm進行Streaming MapReduce

Algebird —Scala的抽象代數工具

xerial —Scala的資料管理工具

simmer —化簡你的資料,進行代數聚合的unix過濾器

PredictionIO —供軟體開發者和資料工程師用的機器學習伺服器。

BIDMat—支援大規模探索性資料分析的CPU和GPU加速矩陣庫。

繼續閱讀