Python-for-data-时间序列、频率和移位
本文中主要介绍的是pandas
中时间序列基础、日期生成及选择、频率和移位等。
时间序列基础
pandas
中的基础时间序列种类是时间戳索引的Series
;在pandas
的外部则表现为Python
字符串或者datatime
对象。
时间序列作为S型数据索引(不连续)
生成连续的S型数据索引
通过date_range方法实现,4个参数:
开始时间
结束时间
频率,默认是天
指定的长度
[图片上传失败...(image-dfb02e-1589117557082)]
时间序列算术上的对齐
索引、选择、子集
索引
选择
重复索引的处理
日期范围、频率和移位
日期范围
两个主要的函数:
date_range
:生成的是DatetimeIndex
格式的日期序列period_range
:生成PeriodIndex
的时期日期序列
频率和日期偏置
pandas
中的频率由基础频率和倍数频率
组成。
基础频率通常会有字符串别名
-
基础频率前面放置一个倍数,形成倍数频率
生成带频率的数据
锚定偏置量
频率描述点的时间并不是均匀分布的,'M'表示月末,'BM'表示月内最后的工作日,取决于当月天数
移位shift
Shift用法
使用偏置进行移位日期
pandas
日期偏置可以使用datetime
或者Timestamp
对象完成锚定偏置量
移位和groupby连用