时间序列 平稳性检验 白噪声 峰度 偏度

时间序列

简而言之,时间序列就是带时间戳的数值序列。股票,期货等金融数据就是典型的时间序列。量化的过程,很多时间都是在分析时间序列,找到稳定赚钱因子。

平稳性定义

所谓时间序列的平稳性,是指时间序列的均值,方差以及协方差都是常数,与时间t无关。这样的序列才可以作为我们基于历史预测未来的基础。
满足以上条件属于严平稳,一般达到弱平稳都是可以接受的。

平稳性是当前时间序列分析的前提条件,因为我们的建模过程基本都是以大数定理和中心极限定理为理论基础(比如ARMA,ARIMA模型等),而大数定理和中心极限定理也是有前提条件的,那就是要求样本同分布(等价于时间序列的平稳性)。如果这个条件不满足,那么我们的很多分析结果是不可靠的。

  1. 白噪声属于平稳序列,因为它的均值为0,方差为常数,协方差为0。但白噪声属于纯随机序列,基于它预测是没有意义的。
  2. 随机游走属于非平稳序列,因为它的均值为常数,但是方差为非常数,与时间t有关。

平稳性检验

对于一个时间序列,我们如何处理呢?
1 检验序列是否平稳性序列
2 如果序列非平稳,通过数学变换为平稳性序列
3 检验序列是否白噪声
4 下一步

平稳性检验常用方法有ADF检验和KPSS检验。

平稳性检验-ADF Test

ADF Test:Augmented Dickey-Fuller Test
首先假设时间序列是不稳定的,根据假设求得的置信度P值如果小于阈值(一般为1%),那么我们认为假设不成立,时间序列是稳定的;反之,假设成立。
Python和R都有相应平稳性检验的模块。
Python需安装statsmodels模块。
R需安装tseries模块。
这里以Python为例:

#python
import numpy as np
from statsmodels.tsa.stattools import adfuller
ss = np.random.randn(10000)
adfuller(ss)

#(-100.04436307924058,
#  0.0, ##(P Value)
#  0, 
#  9999,
#  {'1%': -3.4310041633725734,
#    '10%': -2.566923883481157,
#    '5%': -2.861829101294412},
#  28143.20974307366)

检验结果的第二项为P值,这里为0.0%,远低于阈值1%,因为我们检验的是一个标准正太分布,因此假设肯定是不成立的,我们的序列为稳定性时间序列。

平稳性检验-KPSS Test

KPSS Test:Kwiatkowski-Phillips-Schmidt-Shin Test
首先假设序列是平稳的,根据假设求得的P值如果小于阈值(一般为5%),那么假设不成立;反之,假设成立。仍以Python为例:

#python
import numpy as np
from statsmodels.tsa.stattools import kpss
ss = np.random.randn(10000)
kpss(ss)

# (0.09407968315491025,
#   0.1, ##(P Value)
#   38,
# {'1%': 0.739, '10%': 0.347, '2.5%': 0.574, '5%': 0.463})

检验结果的第二项为P值,这里为10%,远高于阈值5%,因此假设是成立的,我们的序列为稳定性时间序列。

白噪声检验-Ljung-Box Test

首先假设序列为白噪声,根据假设求得的P值如果小于阈值(一般为5%),那么假设不成立;反之,假设成立。仍以Python为例:

#python
import numpy as np
from statsmodels.stats.diagnostic import acorr_ljungbox as ljbox
ss = np.random.randn(10000)
ljbox(ss, lags=1)

#  (array([0.00307541]), 
#  array([0.95577487]))  ##P-Value

检验结果的第二项为P值,这里为95.57%,远高于阈值5%,因此假设是成立的,我们的序列为白噪声序列(实际是随机序列)。

峰度 - Kurtosis

峰度表征统计分布在平均值处峰值高低的度量,反应了峰部的尖度。
峰度按数值包括三类:

  1. 正态分布(Kurtosis = 0)
  2. 厚尾分布(Kurtosis > 0)
  3. 瘦尾分布(Kurtosis < 0)
    金融时间序列一般都是厚尾分布。
    Python峰度计算采用scipy模块,R峰度计算采用moments模块。
    这里需要说明的是:Python峰度计算是以0为中间值,R中峰度计算是以3位中间值(R峰度计算过程中没有减3的操作)。
    以Python为例:
#python
import numpy as np
from scipy.stats import kurtosis
ss = np.random.randn(10000)
kurtosis(ss)

# -0.045421184138716875

偏度 - Skewness

偏度表征统计分布偏斜方向和程度的度量,是统计分布非对称程度的数字特征。
偏度按数值包括三类:

  1. 正态分布(skew = 0)
  2. 左偏分布(skew < 0),峰在左边。
  3. 右偏分布(skew > 0),峰在右边。
    以Python为例:
#python
import numpy as np
from scipy.stats import skew
ss = np.random.randn(10000)
skew(ss)

# -0.0071660377825474705 

非平稳变换

非平稳的序列如何变换成平稳系列呢?
一般有如下几种方法:

  1. 对数变换
  2. 平滑变换(移动平均,指数平均等)
  3. 差分变换(一阶差分,二阶差分,高阶差分等)
  4. 分解变换(多成分分解 = 长期趋势 + 中期趋势 + 随机)

这里就不展开了。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,732评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,496评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,264评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,807评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,806评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,675评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,029评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,683评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,704评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,666评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,773评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,413评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,016评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,204评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,083评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,503评论 2 343

推荐阅读更多精彩内容

  • 众所周知,时间序列的预测是需要假定在时间序列平稳随机过程的基础上,若为非平稳时间序列,容易造成对随机过程的伪回归,...
    enhengz阅读 3,090评论 0 1
  • 自问 子水 万人同眠夜,被厚心难安 独守背阴窗,自问欲为何 相思全无用,哪...
    烟月满州阅读 241评论 0 0
  • 看到这个三角想起之前看过的一篇文章。 耶鲁大学教授罗伯特·斯滕伯格经过多年研究,提出爱的三角形理论,给出了完美爱情...
    葛早早阅读 1,332评论 0 1
  • 愤怒是对自己无能的控诉,是对别人低能的反感。关键在于导致你愤怒的问题并不会因为你大发雷霆而迎刃而解,情绪发泄完问题...
    Ares001阅读 144评论 0 1
  • 如何让孩子对阅读产生并保持兴趣。 1、基本原则:尽量尊重孩子的阅读选择,这不是唯一原则,这是个基础原则。 阅读本...
    海燕dhy阅读 733评论 0 0