天天看点

python-for-data-时间序列基础

Python-for-data-时间序列、频率和移位

本文中主要介绍的是

pandas

中时间序列基础、日期生成及选择、频率和移位等。

python-for-data-时间序列基础

时间序列基础

pandas

中的基础时间序列种类是时间戳索引的

Series

;在

pandas

的外部则表现为

Python

字符串或者

datatime

对象。

时间序列作为S型数据索引(不连续)

python-for-data-时间序列基础

生成连续的S型数据索引

通过date_range方法实现,4个参数:

  • 开始时间
  • 结束时间
  • 频率,默认是天
  • 指定的长度

时间序列算术上的对齐

python-for-data-时间序列基础

索引、选择、子集

索引

python-for-data-时间序列基础

选择

python-for-data-时间序列基础

重复索引的处理

python-for-data-时间序列基础

日期范围、频率和移位

日期范围

两个主要的函数:

  • date_range

    :生成的是

    DatetimeIndex

    格式的日期序列
  • period_range

    :生成

    PeriodIndex

    的时期日期序列

频率别名和偏置类型

python-for-data-时间序列基础
python-for-data-时间序列基础

频率和日期偏置

pandas

中的频率由

基础频率和倍数频率

组成。

  • 基础频率通常会有字符串别名
  • 基础频率前面放置一个倍数,形成倍数频率
python-for-data-时间序列基础

生成带频率的数据

python-for-data-时间序列基础

锚定偏置量

频率描述点的时间并不是均匀分布的,'M’表示月末,'BM’表示月内最后的工作日,取决于当月天数

移位shift

Shift用法

python-for-data-时间序列基础
python-for-data-时间序列基础

使用偏置进行移位日期

pandas

日期偏置可以使用

datetime

或者

Timestamp

对象完成

python-for-data-时间序列基础

锚定偏置量

python-for-data-时间序列基础

移位和groupby连用

python-for-data-时间序列基础