天天看点

数据分析和数据挖掘相关模块

numpy 一般使用numpy+mkl       
pandas:数据分析和处理模块,能为复杂情形下的数据提供坚实的基础分析功能      
scipy:支持数值计算,支持矩阵运算,提供高等数学处理:积分、傅立叶变换、微分方程求解      
matplotlib:数据成图模块,解决数据可视化      
statsmodels:注重数据统计建模分析的数据处理模块,与Pandas结合,强大的数据挖掘组合      
genism:自然语言处理模块,包括自然语言主题模型,用于文本的主题挖掘      
sklearn:机器学习      
keras:深度学习      
jieba:中文分词      
NLTK:(natural language toolkit)Python自然语言处理模块,包括一系列的字符处理和语言统计模型。常用于学术研究和教学,应用领域有语言学、认知科学、人工智能、信息检索、机器学习等