强化学习所需的概率基础——期望、均值和方差

首先我也是小白,二懂二懂的,这里只是做个自己的学习记录,以后好随时查看。
很多地方可能不严谨,不过自己明白才是最重要的,所以不要当成学术性文章来看哈,拒绝各种喷子。
当然,非常欢迎指出我的问题,帮助我进步。

仅仅是几个定义

其实期望、均值和方差,就是几个概念而已,不过名字感觉比较高大上,其实弱到爆。

本文按下列顺序来描述这几个概念

  • 期望值
  • 均值
  • 方差

期望值

有书里又叫数学期望 或者简称期望
注意:这里说的期望,是个定值是个定值是个定值

数学上的定义

以概率(或密度)为权重的加权平均值。(完全不好理解)

按我的理解其实就是描述一个随机变量概率分布的中心值。

举个🌰

之前我们说过扔骰子,它的数学期望是3.5,是不是觉得有点懵,我计算一下你再看马上就不懵了:

扔骰子的数学期望值 = 1\times\frac{1}{6} + 2\times\frac{1}{6} + 3\times\frac{1}{6} + 4\times\frac{1}{6} + 5\times\frac{1}{6} + 6\times\frac{1}{6} = 3.5

是不是弱到爆,对,期望就这么简单。

数学表达

机器学习的书中会出现,这里还是记录一下,不然看机器学习的书的时候会很懵。
一般用\mathbb{E}表示期望的公式

后面两个公式用到的表示法

X表示一个随机变量
\mathcal{D} 表示随机变量取值范围
p(x) 是概率密度函数
f(x) 是表示随机变量的某次取值

连续随机变量的期望表达

\mathbb{E}[f(X)]=\int_{\mathcal{D}}p(x) \cdot f(x)dx

这个公式该这样理解:一个连续随机变量将它的概率密度和观测值的乘积,把这个随机变量所有取值都算上做定积分,就能得到这个随机变量的期望值。
(这句话如果看不懂的话,可以看看之前的关于概率密度函数 和 随机变量的相关文章)

离散随机变量的期望表达

\mathbb{E}[f(X)]=\sum_{{x\in\mathcal{D}}}p(x) \cdot f(x)
和连续随机变量的理解方式差不多,只是不是做积分,而是做求和而已。

均值

不严谨的说,期望值其实就是均值
唯一不一样的地方是,均值是根据样本数决定的,无限样本的情况下,均值无限接近于期望。
书中一般用符号:\mu 来表示

不过我不当数学家,我只需要了解概念就差不多了,为的是能看懂强化学习里的内容,所以我认为到这里就够了。

方差

方差真的一开始不好理解,我之前一直没理解到,为什么TM的叫方差
难道这个TM的长的是方的?
最TM恶心的地方是,这个名词在统计学概率学中的定义,是TM不一样的!!!

只有忍了,只看概率学方面的吧。

定义

是一个随机变量与它的期望之间的差的平方的加权平均值。
怎么理解呢,可以这样想,方差其实是一个描述变化幅度的指标。
一组数据方差越大,那么他的离散度越大。

数学表达

长这样:Var(X) = E[(X - \mu)^2]
其中\mu就是期望值(或均值)

举个🌰

还是骰子,我们来计算一下方差:
\begin{aligned} \\ & = \frac{(1-3.5)^2 + (2-3.5)^2 + (3-3.5)^2 + (4-3.5)^2 + (5-3.5)^2 + (6-3.5)^2}{6} \\ & = \frac{(-2.5)^2 + (-1.5)^2 + (-0.5)^2 + 0.5^2 + 1.5^2 \times + 2.5^2}{6} \\ &= \frac{17.5}{6} = \frac{35}{12} \end{aligned}

白话的解释

就是一个随机变量的取值与期望值的“距离”,用两者差的平方表示。
原来TM方差的这个,指的就是这个平方

顺带引出的"标准差"

方差既然是带平方的,那开方后会肿么样?
数学上把开方后的方差又做了一个名词叫:标准差

小结

学习强化学习,期望、均值和方差,我觉得先了解这么多就够了,还是那句话:缺啥补啥

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,937评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,503评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,712评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,668评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,677评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,601评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,975评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,637评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,881评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,621评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,710评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,387评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,971评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,947评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,189评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,805评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,449评论 2 342