大数据时代的“小数据”系列1 cox-stuart趋势检验

为什么要用趋势检验

在客观世界存在各种各样随时间变动的数据,很多时候我们都想要知道数据变化随时间的发展趋势如何,常用的方式是我们使用回归的参数方法拟合出一条直线,然后判断其趋势。这样的方法往往受多方面的因素影响,比如单调的趋势不一定是线性的,也不一定能有一个显函数来表达。其次参数检验的方法受限于数据量,有时候我们得到的数据很少,不适合做回归等参数方法。比如当我们开发的APP上线新功能,我们需要在短时间内判断其是否带来用户的增长,流量的增长,以便做出相应的策略;或者当出现某种疫情的时候,我们迫切希望了解到疫情是否得到控制等...... Cox和Stuart提出的基于符号检验的非参数方法就能有效的解决之一问题

举个例子说明
以下是天津机场从1995年1月到2003年12月的108个月旅客吞吐量数据

数据展示.png
趋势.png

光从数字和趋势图看,我们能否说这个趋势是增长还是减少,还是都不明显呢,似乎是增长,但是又不总是增长。

对此我们可以做如下处理

step1 做出假设


假设.png

step2 取数据对
(X1,X1+c)... (X(n-c),Xn)
这里 当n为偶数 c=n/2 ; 当n为奇数 c= (n+1)/2

step3 计算符号
计算 Dt = Xt -X(t+c)
计算 S+ (Dt为正)和 S-(Dt为负) 的个数
显然,当无趋势时 S+ 或S- 服从p=0.5 的二项分布,如果S+大,则可能存在下降趋势。
所以有该检验的统计量如下:


检验统计量.png

Scala 版本

import breeze.stats.distributions._
import scala.collection.mutable.ListBuffer

 /**
    *  计算二项分布的分布函数
    * @param binomial
    * @param n
    * @return
    */
  def pbinom(binomial: Binomial, n: Int) = {
    var p = 0.0
    if (n >= binomial.n) {
      p = 1
    } else {
      for (i <- 0 to n) {
        p += binomial.probabilityOf(i)
      }
    }
    p
  }
  
/**
    * CoxStuart趋势检验
    * @param timeSeries
    * @param AlternativeHypothesis
    * @return
    */
  def CoxStuart(timeSeries: Seq[Double],
               AlternativeHypothesis: String = hypothesis.GROWTHREND) = {
    
    val length = timeSeries.length

    val ts = if (length % 2 != 0) {
      timeSeries.drop(length / 2 + 1)
    } else timeSeries

    val pre = ts.slice(0, ts.length / 2)
    val pro = ts.slice(ts.length / 2, ts.length)
    val sign = new ListBuffer[Double]()
    for (i <- 0 until length / 2   ) {
      sign.append(pre(i) - pro(i))
    }
    val spositive = sign.count(_ > 0)
    val snagtive = sign.count(_ < 0)

    def min(n: Int, g: Int) = {
      if (n > g) g else n
    }

    val binomial = Binomial((length / 2), 0.5)

    val p = AlternativeHypothesis.toUpperCase match {
      case "REDUCETREND" => pbinom(binomial, snagtive)
      case "NOTREND" => pbinom(binomial, min(snagtive, spositive)) * 2
      case _ => pbinom(binomial, spositive)
    }
    coxstuer((ts.length / 2), spositive, snagtive, p)
  }

    val source: BufferedSource = Source.fromFile("TJAir.csv")
    val data = source.getLines().map(_.toDouble)
    val coxstuer1 = CoxSturt(data.toSeq)
    println("p-value =" + coxstuer1.pvalue)


Scala 算法得出 p-value = 0.004536670169793693


R 语言版本

#数据加载
TJair <- read_csv("TJAir.csv")
#绘制趋势图
plot(TJair$TJair,type = "l")
# cox_stuert 趋势检验
#  假设检验
#h0:无趋势 ,h1:上升趋势
len <- length(TJair$TJair)  

clen <-if(len%%2 == 0){
  len/2
} else{
  (len+1)/2
}

pvcont <- TJair$TJair
D <- pvcont[1:clen] - pvcont[(clen+1):len]
## 符号计算
spositive <- sum(sign(D) == 1)
snegative <- sum(sign(D) == -1)
## 结果检验
pbinom(spositive,clen,0.5)
pbinom(spositive,54,0.5)


[1] 0.00453667

R语言 计算结果 p-value = 0.00453667

参考资料:《非参数统计》第四版 吴喜之 赵博娟

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,098评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,213评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,960评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,519评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,512评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,533评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,914评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,804评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,563评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,644评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,350评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,933评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,908评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,146评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,847评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,361评论 2 342

推荐阅读更多精彩内容