在這篇文章中,我們将介紹幾個頂級的開源 linux 生态系統的人工智能(ai)工具。目前,ai 是科學和技術中不斷進步的領域之一,很多人都在緻力于建構軟體和硬體來解決諸如醫療,教育,安全,制造業,銀行等領域的日常挑戰。
下面是一系列旨在并開發成用于支援 ai 的平台,允許你用在 linux 或可能許多其它的作業系統上。名單排列順序沒有意義。
1.deep learning for java(deeplearning4j)
deeplearning4j 是 java 和 scala 程式設計語言的,商業級的,開放源碼的,即插即用,分布式的深度學習庫。它專為企業相關的應用程式而設計,并在分布式 cpu 和 gpu 的基礎上繼承了 hadoop 和 spark。
dl4j 在 apache 2.0 許可證下釋出,提供 gpu 支援 aws,并适用于微服務架構。

2.caffe ——深度學習架構
caffe 是一個基于速度的子產品化和富有表現力的深度學習架構。它在 bsd 2-clause 許可下釋出,并且已經在諸如研究,啟動原型,以及視覺、語音及多媒體等工業應用領域支援了若幹社群項目。
h20 ——分布式機器學習架構
h20 是一個開源的,快速的,可擴充和分布式的機器學習架構,還有架構配備的算法。它支援更智能的應用程式,如深度學習,梯度 boosting,随機森林,廣義線性模型(即邏輯回歸,彈性網絡)等等。
這是一個面向業務用于決策資料的人工智能工具,它能夠讓使用者使用更快更好的預測模型來繪制來自于他們對資料的見解。
mllib ——機器學習庫
mllib是一個開源的,易于使用和高性能的機器學習庫,作為apache soark的一部分而開發。本質上它易于部署,并且可以在現有的 hadoop 群集和資料上運作。
mllib 還附帶分類、回歸、推薦、聚類、生存分析等等的算法集合。重要的是,它可以用于 python、java、scala 和 r 程式設計語言。
5.apache mahout
mahout 是一個開源架構,設計用于建構可拓展的機器學習應用程式,它有以下三個顯著的特點:
提供簡單和可擴充的程式設計工作場所
提供 scala+ apache spark,h20 以及 apache flik 的各種預包裝算法
包括 samaras,矢量數學實驗帶有 r 之類文法的工作場所
6.open neural networks library(opennn)
opennn 也是一個用 c ++ 編寫的用于深度學習的開源類庫,用于煽動神經網絡。然而,它隻是有經驗的 c ++ 程式員和有極高機器學習技能人員的最佳選擇。它側重于深度架構和高性能。
oryx 2
oryx 2 是初始 oryx 項目的延續,是在 apache spark 和 apache kafka 的基礎上作為 lambda 架構的重新架構而開發的,雖然專用于實作實時機器學習。
它是一個應用程式開發和附帶某些應用程式用于協同過濾、分類、回歸和叢集用途的平台。
opencyc
opencyc 是一個開源門戶,面向最大和最全面的通用知識基礎和常識推理引擎。它包括大量 cyc 術語,用一種精确設計的方式排列,在針對應用程式諸如這樣的領域:
豐富的領域模組化
特定領域的專家系統
文本的了解
語義資料內建以及ai遊戲等等。
9.apache systemml
systemml 是用于機器學習非常适合大資料的開源人工智能平台。其主要特點是——運作在 r 和 python 這樣的文法上,專注于大資料并專門針對高層次數學而設計。它是如何工作的在首頁上有很好的解釋,其中包括明确說明的視訊示範。
有幾種方法來使用它,包括 apache spark、apache hadoop、jupyter 和 apache zeppelin。一些顯著用途包括汽車,機場交通和社會銀行業。
nupic
nupic 是一個開源架構,用于機器學習的開源架構,基于 heirarchical temporary memory (htm),一個新皮層理論。內建了 nupic的htm 程式可實施分析實時的流資料,并且它在那裡可學習到現有資料的基于時間的模式,預測即将值以及揭示任何不規則性行為。
它的顯著特點包括:
持續線上學習
時空格局
實時流資料
預測和模組化
強大的異常檢測
分層時間記憶