Pandas时间序列

时间序列

将时间按照不同的频率进行分组,形成新的序列

重采样

df.resample(‘时间刻度’, on=’date_column’)

时间刻度包括’AS/Q/M/W/D/T’即“年、季度、月、星期、天、分钟”

可与对时间刻度前乘以常数,以更改时间刻度大小。如3T。

on=’date_column’为可选参数,若不设置,则默认为索引列。

时间数列数据汇总

当使用时间序列进行分组统计时,可以使用ohlc()函数统计各个时间序列内的开始值,结束值,最大值,最小值。

df.resample(‘Q’).ohlc()

移动窗口数据计算

时点的波动较大,某一点的数据就不能很好的表现它本身的特性,于是就有了“移动窗口”的概念。

简单的说,为了提升数据的可靠性,将某个点的取值扩大到包含这个点的一段区间,用区间值来判断。

1
2
3
4
5
6
7
8
9
10
11
12
13
df.rolling(window, min_periods=None, center=Flase, win_type=None, on=None, axis=0, closed=None)

'''
window:时间窗口的大小
min_periods=None:每个窗口最少包含的观测值
center=Flase:把窗口标签设置为居中
win_type=None:窗口类型
on=None:可选参数,使用某列代替索引
axis=0:默认列操作
closed=None:定义区间的开闭
'''

df.rolling(3, on='date_column').mean()

本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!