繼推出2017年機器學習開源項目Top 30榜單後,Mybridge AI又推出了一個Python開源項目Top 30榜單,包括開源Python庫、工具等。該榜單基于項目品質、使用者參與度以及其他幾個方面進行了評估,從大約15000個開源項目中挑選了Top 30,差不多都是在2017年1-12月釋出。這些項目在Github上的平均star為3707。
No 1:Home-assistant (v0.6+)
基于Python 3的開源家庭自動化平台[Github 11357 stars,由Paulus Schoutsen提供]
https://github.com/home-assistant/home-assistant
No 2:Pytorch
PyTorch是使用GPU和CPU優化的深度學習張量庫,基于Python語言編寫。[Github 11019 stars,由PyTorch團隊的Adam Paszke和其他人提供]
https://github.com/pytorch/pytorch
No 3:Grumpy
Grumpy是一個Python to Go的源代碼翻譯編譯器和運作時,旨在取代CPython 2.7。關鍵差別在于,Grumpy是将Python源碼編譯為Go源代碼,然後将其編譯為native code,而不是bytecode。這也就意味着Grumpy沒有虛拟機(VM)。編譯好的Go源碼是對Grumpy運作時的一系列調用,一個Go庫服務于具有相似目的的Python C API。 [Github 8367 stars,由Google的Dylan Trotter及其他從業人員提供]。
https://github.com/google/grumpy
No 4:Sanic
該項目是一個類 Flask 的 Python 3.5+ 網頁伺服器,專為加速而設計。Sanic支援異步請求處理,意味着你可以使用Python 3.5中一些async/await文法。。[Github 8028 stars,由Channel Cat和Eli Uriegas提供]
https://github.com/channelcat/sanic
No 5:Python-fire
一個可以從任何Python對象自動生成指令行界面(CLI)的庫。 [Github 7775 stars,來自Google Brain 的 David Bieber]
https://github.com/channelcat/sanic
No 6:spaCy(v2.0)
該項目是一個使用Python和Cython的進行進階自然語言處理(NLP)的開源庫 [Github 7633 stars,由Matthew Honnibal提供]
https://github.com/explosion/spaCy
No 7:Pipenv
Python.org官方推薦的Python打包工具。它會自動為項目建立和管理virtualenv,并在安裝/解除安裝軟體包時從Pipfile中添加/删除軟體包。 [Github 7273 stars,由Kenneth Reitz提供]
https://github.com/pypa/pipenv
No 8:MicroPython
一個脫胎于Python且非常高效的Python實作,主要是為了能在嵌入式硬體上(這裡特指微控制器級别)更簡單地實作對底層的操作。[Github 5728 stars]
https://github.com/micropython/micropython
No 9:Prophet
該工具是Facebook開源的一款用于為多周期性的線性或非線性時間序列資料生成高品質預測的工具。[Github 4369 stars,由Facebook提供]
https://github.com/facebook/prophet
No 10:Serpent AI
該項目是一個Python寫的遊戲代理架構,簡單而強大,可幫助開發者建立遊戲代理。可将任何視訊遊戲變成一個Python寫成的成熟沙箱環境。該架構的目的是為機器學習和AI研究提供一個有價值的工具,不過對于愛好者來說也是非常有趣的。[Github 3411 stars,由Nicholas Brochu提供]
https://github.com/SerpentAI/SerpentAI
No 11:Dash
Dash是一個純Python寫成的架構,無需JavaScript即可建構互動式的分析類web應用程式。[Github 3281 stars,由Chris P提供]
https://github.com/plotly/dash
No 12:InstaPy
Instagram機器人,喜歡/評論/Follow 自動化腳本。[Github 3179 stars,由TimG提供]。
https://github.com/timgrossmann/InstaPy
No 13:Apistar
專為Python 3定制的Web API架構[Github 3024 stars,Tom Christie提供]。
https://github.com/encode/apistar
No 14:Faiss
用于密集向量的高效相似性搜尋庫和聚類的庫 [GitHub 2717 stars,貢獻者Facebook Research]
https://github.com/facebookresearch/faiss
No 15:MechanicalSoup
一個與網站自動互動的Python庫,自動存儲和發送cookies,支援重定向,并可以跟蹤連結和送出表格。[Github 2244 stars]
https://github.com/MechanicalSoup/MechanicalSoup
No 16:Better-exceptions
該項目以更友好的形式展示Python中的異常資訊。[Github 2121 stars,貢獻者Qix]
https://github.com/Qix-/better-exceptions
No 17:Flashtext
該項目基于FlashText算法,用以高效搜尋句子中的關鍵詞并進行替代。[Github 2019 stars,由Vikash Singh提供]。
https://github.com/vi3k6i5/flashtext
No 18:Maya
在不同系統上的不同語言環境中,Python對日期時間的處理非常不暢,Maya主要就是為了解決解析網站時間資料問題。[Github 1828 stars,Kenneth Reitz提供]
https://github.com/kennethreitz/maya
No 19:Mimesis
是一個快速易用的Python庫,可以用不同語言為基于不同的目的生成合成資料。這些資料在軟體開發和測試階段非常有用。[Github 1732 stars,由LíkieGeimfari提供]
https://github.com/lk-geimfari/mimesis
No 20:Open-paperless
該項目是一個一個檔案管理系統,可掃描、索引和歸檔所有紙張文檔。[Github 1717 stars,由Tina Zhou提供]
https://github.com/zhoubear/open-paperless
No 21:Fsociety
黑客工具包,滲透測試架構。[Github 1585 stars,Manis Manisso提供]
No 22:LivePython
Python代碼實時可視化跟蹤。[Github 1577 stars,由Anastasis Germanidis提供]
https://github.com/agermanidis/livepython
No 23:Hatch
一個Python項目、包以及虛拟環境的管理工具。[Github 1537 stars,由Ofek Lev提供]
https://github.com/ofek/hatch
No 24:Tangent
該項目是谷歌開源的一個用于自動微分的源到源純Python庫。[Github 1433 stars,來自Google Brain的Alex Wiltschko以及其他人]。
https://github.com/google/tangent
No 25:Clairvoyant
一個Python程式,用于識别和監控短期庫存移動的曆史線索[Github 1159 stars,由Anthony Federico提供]。
https://github.com/anfederico/Clairvoyant
No 26:MonkeyType
該項目是Instagram開源的一款适用于Python的工具,通過收集運作時類型來生成靜态類型注釋。[Github 1137 stars,由Instagram工程師Carl Meyer提供]。
https://github.com/Instagram/MonkeyType
No 27:Eel
該項目是一個小型Python庫,用于制作簡單的類似 Electron的離線HTML/JS GUI應用程式,目前僅支援Python3。 [Github 1137 stars]
https://github.com/ChrisKnott/Eel
No 28:Surprise v1.0
用于建構和分析推薦系統的Python scikit [Github 1103 stars]
https://github.com/NicolasHug/Surprise
No 29:Gain
Web爬蟲架構。[Github 1009 stars,由高久力提供]
https://github.com/gaojiuli/gain
No 30:PDFTabExtract
一組用于從PDF檔案中提取表格的工具,有助于在掃描的文檔上進行資料挖掘。 [Github 722 stars]
https://github.com/WZBSocialScienceCenter/pdftabextract
原文位址:https://medium.mybridge.co/30-amazing-python-projects-for-the-past-year-v-2018-9c310b04cdb3