天天看点

一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)

一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)

目录:

  • 一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)
        • 一、数据挖掘环境搭建——Anaconda
          • 1.库的下载和管理
          • 2.PyCharm 中使用 Anaconda 的库
          • 3.数据挖掘相关库
            • (1)`import matplotlib`
            • (2)`import numpy`
            • (3)`import pandas`
            • (4)`import talib`
            • (5)`import tables`
            • (6)`import jupyter`
        • 二、支持跨所有编程语言的平台——Jupyter Notebook
          • 1.Jupyter Notebook 简介
          • 2.为什么要使用 Jupyter Notebook
          • 3.Jupyter Notebook 的一些常见问题
        • 三.Jupyter Notebook 快速入门
          • 1.常用导航选项
          • 2.cell 操作
          • 3.常用鼠标操作
          • 4.常用快捷键操作
          • 5.Markdown 模式

一、数据挖掘环境搭建——Anaconda

1.库的下载和管理

数据挖掘会用到 Matplotlib、Numpy、Pandas、Ta-Lib等许多库,我们可以使用 pip 来安装各种库,但是这样并不便于库的管理和下载,推荐使用 Anaconda 软件进行库的下载, Anaconda 下载后带有Python解释器

Anaconda 是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。 其包含了大量的科学包,应且易于管理和下载

鉴于国外网站下载速度较慢,可以通过下方清华大学的软件镜像来进行安装

  • 清华大学 anaconda 软件镜像
一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)

选择合适自己操作系统和位数的版本下载即可,可以找到最新版进行下载

在安装过程中推荐增加环境变量安装,否则后续自己进行环境变量的增加会很麻烦

一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)

安装完后在开始菜单找到快捷方式使用即可

Anaconda 中集成了许多有用的库,另外可以通过 all——库名搜索 来下载其他库

一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)

在 Home 中还有其他已安装的可用的工具,如:Jupyter Notebook 可供使用

一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)

这样,我们想要下载库的时候可以直接在 Anaconda 中下载,而不需要 pip 来下载了

2.PyCharm 中使用 Anaconda 的库

在 PyCharm 中新建项目,选择如下设置:

一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)
一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)

即可完成关联到 Anaconda 的库,可以在 main.py 中尝试导入

3.数据挖掘相关库

在后续的数据挖掘中,我们需要用到的库有:

(1)

import matplotlib

  • 它是一个类似于 MATLAB 的绘图工具包

(2)

import numpy

  • 它是一个可用于科学计算基础包

(3)

import pandas

  • 它是能够处理其他类型数据(如:字符串、时间序列)的包

(4)

import talib

  • 它是行情技术指标库,在股票,期货,外汇,数字货币等领域能够大放异彩

(5)

import tables

  • 它是包管理分层数据和设计效率和容易处理非常大量的数据,是读取数据文件的一个不错的工具,HDF5库

(6)

import jupyter

  • 它是一个数据分析与展示的平台——Jupyter Notebook工具

其中,作者本人在 Anaconda 中找了一下,除了 talib 库,其他库都已经有了(没有的在 Anaconda 中下载即可)

并且 talib 库在 Anaconda 中还找不到…可能可以通过更换下载源来安装,但作者本人没有尝试过,所以可以通过 pip 来进行手动安装

一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)

这个时候就需要用 pip 来手动安装 TA_Lib 了

首先通过下面的网址把 TA_Lib 下载下来

  • TA_Lib包下载

根据字母排序找到 TA-Lib,选择合适的版本

一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)
  • cp 指的是Python版本
  • win32 32位操作系统
  • amd64 64位操作系统

推荐把下载后的文件放到 Anaconda 统一的库里面

  • Anaconda 库的路径 Anaconda\Lib\site-packages

随后要通过 Anaconda Prompt 来进行安装, Anaconda Prompt 是 Anaconda 下载后的附加程序,在开始菜单里可以找到

一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)
  • 作者本人的 Anaconda Prompt 路径如下(仅供参考)

    C:\Users\用户目录\AppData(隐藏文件)\Roaming\Microsoft\Windows\ Start Menu \Programs\Anaconda3 (64-bit)

在 Anaconda Prompt 中输入以下命令,进入 TA-Lib 文件所在的目录:

D:
D:\Anaconda3-2020.11-Windows-x86_64\Lib\site-packages
pip install TA_Lib-0.4.19-cp38-cp38-win_amd64.whl
           
一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)

即可安装成功,尝试能否正常导入 talib

import talib
           

二、支持跨所有编程语言的平台——Jupyter Notebook

1.Jupyter Notebook 简介

Jupyter Notebook 源于2014年的 IPython 项目,并逐渐发展成为支持跨所有编程语言的交互式数据科学计算的工具

  • 所有编程语言交互
  • Jupyter Notebook 是 IPython 的加强网页版
  • 是一款程序员和科学工作者的 编程/文档/笔记/展示 软件
  • .ipynb 为扩展名的文件是用于计算型叙述的JSON文档格式的正式规范
2.为什么要使用 Jupyter Notebook
  • 在 PyCharm 中,使用Python绘图后,Python把图像绘制出来后,程序会阻塞,只有当把图片关闭之后才会继续运行后续的代码(可以用多线程解决),但想要执行后续代码就不能看到图片内容,需要另外保存,这一点并不好,而 Jupyter Notebook 则很好地解决了这一问题
  • 在 PyCharm 中,每次获取图像和数据处理结果都需要重新进行编译(除非自行保存了截图),而 Jupyter Notebook 上每次运行的结果都会保存在上面,因此其具有数据展示方面的优势
3.Jupyter Notebook 的一些常见问题

打开 Jupyter Notebook :

(1)方法一:在下载 Anaconda 后,在开始菜单种会有一个 Jupyter Notebook (Anaconda3…) 的应用,点击即可打开 Jupyter Notebook

一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)
  • 注:打开后运行的小黑窗终端不要关闭,否则 Jupyter Notebook 将无法正常使用

(2)方法二:打开 Anaconda ,在 Home 界面中找到 Jupyter Notebook 点击 Launch 打开即可

一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)
  • 注:在打开 Jupyter Notebook 后运行的小黑窗终端不要关闭,否则会导致 Jupyter Notebook 无法正常使用

修改 Jupyter Notebook 默认打开浏览器方法:

用 Win + R 快捷键打开 cmd 终端,输入如下的指令,查看 jupyter_notebook_config.py 文件的路径

jupyter notebook --generate-config
           
一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)

使用 PyCharm 打开该文件,找到

# c.NotebookApp.browser = ''

字句,这段就是用来配置默认打开方式的,在这句话的正下方增加代码:

  • 这里以默认浏览器更改为谷歌浏览器为例
  • "chrome" 为浏览器名
  • "C:\Program Files (x86)\Google\Chrome\Application\chrome.exe" 为浏览器快捷方式所在路径,需要根据自己电脑的浏览器所在位置进行安装
  • ’chrome’ 同为浏览器名
# c.NotebookApp.browser = ''
import webbrowser

webbrowser.register("chrome",None,webbrowser.GenericBrowser(u"C:\\Program Files (x86)\\Google\\Chrome\\Application\\chrome.exe"))

c.NotebookApp.browser = 'chrome'
           

三.Jupyter Notebook 快速入门

  • 新建 .ipynb 文档,这是 Jupyter Notebook 的文档格式
一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)
一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)

由于 Jupyter Notebook 是从 IPython 发展而来的,因此其基本的代码编辑跟 IPython 是很相似的

1.常用导航选项
选项 含义
File→Download as 另存为其他格式的文件
Kernel→Interrupt 中断代码的执行
Kernel→Restart 重启Python内核(执行速度过慢时重置全部资源)
Kernel→Restart & Clear Output 重启并清除所有输出
Kernel→Restart & Run All 重启并重新运行所有代码
2.cell 操作

cell——一对 In Out 会话被视作一个代码单元,称为 cell

Jupyter Notebook 支持两种模式:

  • 编辑模式 可以操作 cell 内文本或代码,剪切、复制、粘贴和移动等操作
  • 命令模式 可以操作 cell 单元本身进行剪切、复制、粘贴和移动等操作
快捷键 模式切换
Enter 命令模式→编辑模式
Esc 编辑模式→命令模式
3.常用鼠标操作
一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)
4.常用快捷键操作
快捷键 含义
Shift + Enter 编译运行本单元代码,并跳转到下一单元
Ctrl + Enter 编译运行本单元代码,留在本单元
Enter 换行
  • cell 行号前的 * ,表示代码正在运行

命令模式:

快捷键 含义
A 在当前cell上添加cell
B 在当前cell下添加cell
D + D(按两下D) 删除当前cell
Z 撤回上一次操作
Y cell切换到 Code 模式
M cell切换到 Markdown 模式

编辑模式:

快捷键 含义
Ctrl + 鼠标左击 多光标模式
Ctrl + Z 撤回上一步输入
Ctrl + Y 重做
Tab 补全代码
Ctrl + / 添加/取消单行注释
  • 多光标模式:即可以在代码/文本中另一位置自行添加一个光标,当进行编辑时,可以在多个光标的位置同时编辑内容(鼠标单击任意位置可取消多光标模式)
    一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)
    一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)
5.Markdown 模式

进入 Markdown 模式——在 CSDN 上写过博文的小伙伴应该对 Markdown 不陌生了

一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)
一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)

Shift + Enter 运行后,出来的结果如图:

一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)一、Python数据挖掘(环境篇——Anaconda与Jupyter Notebook)
  • 当然,如果对 Markdown 编辑的内容的运行结果不满意,可以双击 Markdown 内容的空白处进行继续编辑

除此之外,更多更复杂的 Markdown 编辑可以参考 CSDN→个人主页→管理博客 左上方的 Markdown编辑器 进行参考