A/B实验设计——样本量选择

本文介绍样本量对实验效果的影响,以及如何正确选择样本量。仅作为实验设计者可跳过最后数学推导过程,直接使用工具运算。

样本量的影响

假设一个这样的实验,按钮颜色对用户点击率的影响:


假设A样式点击率30%,B样式点击率为40%。考虑以下两种情况:

  1. 当每个页面有10次访问时,直观感受上并不能证明B比A的点击率高。实际约65%的可能性差异是随机产生的。
  2. 当每个页面有1000次访问时,差异不像是随机产生了。实际只有约0.0002%可能性差异是随机产生的。

通过上面例子发现,相同的差异程度下,样本数量越多,我们越有把握两者并不相同。这也是符合生活经验的。

样本量选择原则

我们已经知道了样本数越多,证据会越可信,那么样本数该怎么选择呢?

实验角度,样本量越多越好

样本数量变多,实验则有了更多的“证据”,实验的“可靠性”也就越强。

业务角度,样本量越少越好

样本量应该越少越好,因为:

  1. 试错成本大。假设我们拿50%用的户来跑实验,但不幸的是,1周后结果表明实验组的总收入下降了20%。算下来,你的实验在一周内给整个公司带来了10%的损失。这个试错成本未免高了一些...
  2. 其它风险增加。移动端例子,假设B方案崩溃率增长,1%流量我们可以从容处理,50%流量会对业务造成严重影响,甚至事故定责。
  3. 流量有限。流量总数是确定的,同类型的实验不能重叠,实验流量更小,就可以同时运行更多的实验。

样本量如何选择

通过样本量计算工具可以直接得到,有很多的在线工具,例如对转化率可使用Evan's Awesome A/B Tools

参数解释

  1. Baseline conversion rate:填入实验前估测到的转化率,可以通过旧数据统计作为估算。
  2. Minimum Detectable Effect:填入希望观测到的最小效果。填入实验的预期。
  3. Statistical power:1 - 假阴性概率。实验效果真实有效时,能被正确发现的概率。
  4. Significance level:假阳性概率。实验实际没有效果时,被错误发现的概率。

总结

样本量选择一般过程:打开样量计算器,填入α, power, MDE,填入已知参数(转化率、均值、方差等),得到结果。


附录:样本量计算原理

需要读者有一定数理统计知识,跳过不影响实验设计。从单尾假设检验出发进行推导,然后扩展到双尾假设检验。
(简书bug导致\bar{x}显示为x^2,请注意)

单尾假设检验


定义θ = μ2 - μ1,图中对应假设可转换为:
原假设:θ = 0,此时对应红色曲线
备择假设:θ > 0,此时对应绿色曲线

μ1:方案A的期望值,不可改变。
μ2:方案B的期望值,不可改变。
\bar x:方案A的均值,会随机波动。
\bar y:方案B的均值,会随机波动。
\alpha = \mathbb{P}(\frac{ \bar y - \bar x}{SD( \bar y - \bar x))} > C | \mu1 = \mu2 ) ,红色曲线下,红色面积占比。
\beta= \mathbb{P}(\frac{ \bar y - \bar x }{SD( \bar y - \bar x))} <= C | \mu1 > \mu2 )
power = \mathbb{P}(\frac{ \bar y - \bar x }{SD( \bar y - \bar x))} > C | \mu1 > \mu2 ) ,绿色曲线下,绿色面积占比。
MDE:根据期望效果取的值,会参与样本量计算
μ2 - μ1 >= mde时,power大于等于预设值,实验容易显著。
μ2 - μ1 < mde时,power小于预设,实验不容易显著。

\frac{ \bar y - \bar x}{SD( \bar y - \bar x))} > C中,C为预设常量,\bar x\bar y通过实验获取无法控制,唯一可以改变的是SD( \bar y - \bar x)),样本量增大 -> SD( \bar y - \bar x))减少 -> 实验显著概率升高。

计算过程:
{SD( \bar y - \bar x)} = MDE / [ \phi^{-1} (\alpha) + \phi^{-1} (power )] ,

x、y样本量同为n,标准差同为\sigma时,
{SD( \bar y - \bar x)} = \sqrt{2\sigma ^{2}/ n},

易得n = 2\sigma ^{2} [ \phi^{-1} (1- \alpha) + \phi^{-1} (power )]^{2}/MDE^{2}

双尾假设检验

定义θ = μ2 - μ1,双尾情况下对应假设:
原假设:θ = 0;
备择假设:θ ≠ 0 ,等价于 θ > 0 or θ < 0。

双尾假设检验一般是对称的,在此情况下有:

  1. \alpha = \mathbb{P}(\frac{ \bar y - \bar x}{SD( \bar y - \bar x))} > C1 | \mu1 = \mu2 ) + \mathbb{P}(\frac{ \bar y - \bar x}{SD( \bar y - \bar x))} < C2 | \mu1 = \mu2 )
  2. \mathbb{P}(\frac{ \bar y - \bar x}{SD( \bar y - \bar x))} > C1 | \mu1 = \mu2 ) = \mathbb{P}(\frac{ \bar y - \bar x}{SD( \bar y - \bar x))} < C2 | \mu1 = \mu2 )

正态分布的概率密度函数特点为左右对称(钟形曲线),由此可知:
C1 > 0, C2 < 0, |C1| = |C2|

可以理解为一个α水平的双尾假设检验,等于两个α/2水平的单尾假设检验。
将α/2带入单尾计算公式,得到双尾检验需要的样本量为:
n = 2\sigma ^{2} [ \phi^{-1} (1 - \alpha/2) + \phi^{-1} (power )]^{2}/MDE^{2}

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,530评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,403评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,120评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,770评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,758评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,649评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,021评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,675评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,931评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,751评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,410评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,004评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,969评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,042评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,493评论 2 343