天天看點

去年6月在師門會議上分享的Python技術架構報告

新入門Python資料分析的碩士、博士們,請拿取參考:

1、桌面軟體開發

WxPython、Tkinler

2、網站開發

Django、Web2py、Web.py、Zope2 [Python + HTML + MySQL(or PostgreSQL)]

3、遊戲開發

Pygame、cocos2d

4、科學計算

Pandas:Python資料分析庫

NumPy:一個定義了數值數組和矩陣類型和它們的基本運算的語言擴充

SciPy:另一種使用NumPy來做高等數學、信号處理、優化、統計和許多其它科學任務的語言擴充

Matplotlib:繪圖的語言擴充

5、機器學習

scikit-learn:該項目文檔齊全、講解清晰,功能齊備,使用友善,而且社群活躍

PyBrain:Python的一個機器學習子產品,它的目标是為機器學習任務提供靈活、易應、強大的機器學習算法。PyBrain正如其名,包括神經網絡、強化學習(及二者結合)、無監督學習、進化算法。因為目前的許多問題需要處理連續态和行為空間,必須使用函數逼近(如神經網絡)以應對高維資料。以神經網絡為核心,所有的訓練方法都以神經網絡為一個執行個體

Orange:機器學習隻是其的功能之一,主要還是側重資料挖掘,可以用可視化語言或Python進行操作,擁有機器學習元件,還具有生物資訊學以及文本挖掘的插件

Shogun:文檔齊全,開發活躍,更新快,運算速度也很快。主攻大尺度的核函數,尤其是大尺度核函數下的SVM。具有很多SVM的進階用法,比如多核配用等

6、深度學習

Theano

pylearn2

keras

nolearn + lasagna

Caffe

Expresso:基于Python之Caffe的深度學習圖形化設計/訓練/浏覽架構

Minerva:擁有python程式設計接口。多GPU幾乎達到線性加速。在4塊GPU上能在4天内将GoogLeNet訓練到68.7%的top-1以及89.0%的top-5準确率。和同為dmlc項目的cxxnet相比,采用動态資料流引擎,提供更多靈活性。