Python-for-data-时间序列、频率和移位
本文中主要介绍的是
pandas
中时间序列基础、日期生成及选择、频率和移位等。
时间序列基础
pandas
中的基础时间序列种类是时间戳索引的
Series
;在
pandas
的外部则表现为
Python
字符串或者
datatime
对象。
时间序列作为S型数据索引(不连续)
生成连续的S型数据索引
通过date_range方法实现,4个参数:
- 开始时间
- 结束时间
- 频率,默认是天
- 指定的长度
时间序列算术上的对齐
索引、选择、子集
索引
选择
重复索引的处理
日期范围、频率和移位
日期范围
两个主要的函数:
-
:生成的是date_range
格式的日期序列DatetimeIndex
-
:生成period_range
的时期日期序列PeriodIndex
频率别名和偏置类型
频率和日期偏置
pandas
中的频率由
基础频率和倍数频率
组成。
- 基础频率通常会有字符串别名
- 基础频率前面放置一个倍数,形成倍数频率
生成带频率的数据
锚定偏置量
频率描述点的时间并不是均匀分布的,'M’表示月末,'BM’表示月内最后的工作日,取决于当月天数
移位shift
Shift用法
使用偏置进行移位日期
pandas
日期偏置可以使用
datetime
或者
Timestamp
对象完成