天天看点

人工智能和机器学习领域中10个开源项目

graphlab

graphlab是一种新的面向机器学习的并行框架。graphlab提供了一个完整的平台,让机构可以使用可扩展的机器学习系统建立大数据以 分析产品,该公司客户包括zillow、adobe、zynga、pandora、bosch、exxonmobil等,它们从别的应用程序或者服务中抓 取数据,通过推荐系统、欺诈监测系统、情感及社交网络分析系统等系统模式将大数据理念转换为生产环境下可以使用的预测应用程序。( 详情 )

项目主页: http://graphlab.org/

vowpal wabbit

vowpal wabbit (fast online learning)最初是由雅虎研究院建设的一个机器学习平台,目前该项目在微软研究院。它是由john langford启动并主导的项目。

项目地址: http://hunch.net/~vw/

scikits.learn

scikit-learn是一个开源的、构建在scipy之上用于机器学习的 python 模块。它包括简单而高效的工具,可用于数据挖掘和数据分析,适合于任何人,可在各种情况下重复使用、构建在 numpy、scipy和 matplotlib 之上,遵循bsd 协议。( 详情 )

项目地址: http://scikit-learn.org/stable

theano

theano是一个python库,用来定义、优化和模拟数学表达式计算,用于高效的解决多维数组的计算问题。它使得写深度学习模型更加容易,同时也给出了一些关于在gpu上训练它们的选项。( 详情 )

项目地址: http://deeplearning.net/software/theano/

mahout

mahout 是 apache software foundation(asf) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。mahout包含许多实现,包括聚 类、分类、推荐过滤、频繁子项挖掘。此外,通过使用 apache hadoop 库,mahout 可以有效地扩展到云中。

项目主页: http://mahout.apache.org/

pybrain

pybrain是python的一个机器学习模块,它的目标是为机器学习任务提供灵活、易应、强大的机器学习算法。pybrain包括神经网络、强化学习(及二者结合)、无监督学习、进化算法。以神经网络为核心,所有的训练方法都以神经网络为一个实例。

项目主页: http://pybrain.org/

opencv

opencv是一个基于(开源)发行的跨平台计算机视觉库,可以运行在linux、windows和mac os操作系统上。它轻量级而且高效——由一系列 c 函数和少量 c++ 类构成,同时提供了python、ruby、matlab等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。( 详情 )

项目主页: http://opencv.org/

orange

orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。

项目主页: http://orange.biolab.si/

nltk

nltk(natural language toolkit)是python的自然语言处理工具包。2001年推出,至今发展非常活跃。它的主要作用是为了教学,至今已经在20多个国家60多所高校 使用,里面包括了大量的词料库,以及自然语言处理方面的算法实现:分词, 词根计算, 分类, 语义分析等。

项目主页: http://nltk.org/

nupic

nupic是一个开源的人工智能平台。该项目由grok(原名 numenta)公司开发,其中包括了公司的算法和软件架构。 nupic 的运作接近于人脑,“当模式变化的时候,它会忘掉旧模式,记忆新模式”。如人脑一样,cla 算法能够适应新的变化。( 详情 )

项目主页: http://numenta.org/nupic.html

原文发布时间为:2014-12-10

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“bigdatadigest”微信公众号