补充知识
伯努利试验:
是只有两种可能结果(成功或失败)的单次随机试验,即对于一个随机变量X而言:
伯努利过程:
是一系列独立同分布的伯努利试验,每个的2个结果也被称为“成功”或“失败”。
是一个由有限个或无限个的独立随机变量 所组成的离散时间随机过程,其中 满足如下条件:
- 对每个i, 等于 0 或 1;
- 对每个i, 的概率等于 p;
与伯努利过程相关的随机变量有:
- 只有一次伯努利试验发生服从伯努利分布。
- 前 n 个试验的成功次数服从二项分布。
- 要得到 r 次成功所需要的试验次数服从负二项分布。
- 要得到 1 次成功所需要的试验次数服从几何分布,这是负二项分布的一个特例。
伯努利分布
背景引入:
在实际中的案例结果往往只有两种结果(正、反)。例如:抛硬币、明天下不下雨、买彩票中奖与不中奖、疾病生存还是死亡、合格与不合格等等。这样的事件便是伯努利试验。
定义:
伯努利分布(Bernoulli distribution)又名两点分布
或0-1分布
,是一个离散型概率分布
,是最简单的离散型概率分布。若伯努利随机试验成功,则伯努利随机变量取1。若伯努利试验失败,则伯努利随机变量取值为0。记其成功概率为p,失败概率为q=1-p。
概率密度函数:
期望:
方差:
二项分布
背景引入:
对同一个硬币扔10次,出现3次正面朝上的概率。扔硬币的过程便是一个伯努利过程,正面朝上次数的概率就是二项分布。
定义:
Binomial Distribution是n个独立的伯努利试验
中成功的次数
的离散概率分布,其中每次试验的成功概率为p。实际上,当n = 1
时,二项分布就是伯努利分布
。二项分布是显著性差异的二项试验的基础。——wikipedia
概率质量函数:
如果随机变量X服从参数n和p为的二项分布,我们记。n次试验中正好得到k次成功的概率
由概率质量函数给出:
- 分布形状的变化规律:
二项分布是一个概率分布族
,随着试验次数n和成功概率p的不同而不同,且它与正态分布关系密切
。
[图片上传失败...(image-72b122-1589359103816)]
"成功"概率p越接近0.5(也即"成功"概率与"失败"概率越接近),二项分布将越对称。且近似于均值为np、方差为npq的正态分布。——图中蓝色与绿色对比
对于任意"成功"概率p,无论其距离0.5有多远,随着试验次数n的增加,二项分布与均值为np、方差为npq的正态分布越来越接近。——图中绿色与红色对比
期望:
期望等于每次单独的伯努利试验的期望和
方差:
方差等于每次单独的伯努利试验的方差和
几何分布
在n次伯努利试验中,试验k次才得到第一次成功的概率
,也就是说:前k-1次都失败
,第k次成功的概率。记为。
概率质量函数:
[图片上传失败...(image-93f207-1589359103817)]
期望:
方差:
超几何分布
描述了由有限个物体中抽出n个物件,成功抽出指定种类的物件
的个数(不放回抽取
)。例如在有N个样本,其中K个是不及格,N-K个是及格的,超几何分布描述了在该N个样本中抽出n个,其中k个是不及格的概率。记为。
若n=1,超几何分布还原为伯努利分布。
概率质量函数:
[图片上传失败...(image-dbc806-1589359103817)]
- 表示所有在N个样本中抽出n个的方法数目;
- 表示在K个样本中,抽出k个的方法数目,即组合数,又称为二项式系数。
- 表示剩下来的样本都是及格的,而及格的样本有N-K个。
泊松分布
泊松分布适合于描述单位时间
或单位空间
内随机事件发生的次数
的概率分布。记为。
- 如某一服务设施在一定时间内受到的服务请求的次数,
- 电话交换机接到呼叫的次数、
- 汽车站台的候客人数、
- 机器出现的故障数、
- 自然灾害发生的次数、
- DNA序列的变异数、
- 放射性原子核的衰变数、
- 激光的光子数分布等等。
概率质量函数:
泊松分布的参数是单位时间或单位空间内随机事件的平均发生率。
[图片上传失败...(image-41616c-1589359103817)]
横轴是索引k,发生次数。该函数只定义在k为整数的时候。
期望:
方差:
所以可以得到:
泊松定理
在二项分布的伯努利试验中,如果试验次数n很大
,二项分布的概率p很小
,且乘积λ= np
比较适中,则事件出现的次数的概率可以用泊松分布来逼近。
事实上,二项分布可以看作泊松分布在离散时间上的对应物。