一、概率的基本概念
概率的规则与公式
事件:来自某个样本空间中一个或多个结果的集合。
条件概率:已知事件B为真实或者事件B发生的条件下,事件A发生的概率。
二、随机变量和概率分布
离散的随机变量:可以计数的可能的结果的数字
连续的随机变量:连续的随机变量拥有的结果,处在实数的一个或多个连续区间之中。
三、离散的概率分布概率
质量函数f(x)
累积分布函数F(x)
离散随机变量的期望值E(x)
在决策中使用期望值离散随机变量的方差Var(X)
伯努利分布:一种离散分布,有两种可能的结果。1表示成功,出现的概率为p,其中0<p<1;0表示失败,出现的概率为q=1-p。
期望:E(X)=p。
方差:var(X)=p(1-p)。
二项式分布(Binomial Distribution):,即重复n次的伯努利试验(Bernoulli Experiment),用ξ表示随机试验的结果。记做:ξ~B(n,p)
期望:Eξ=np
方差:Dξ=npq 其中q=1-p
泊松分布:参数λ是单位时间(或单位面积)内随机事件的平均发生率。 泊松分布适合于描述单位时间内随机事件发生的次数。
期望:λ
方差:λ
四、连续概率分布
概率密度函数的性质:
1、f(x)>=0.
2、概率之和为1
3、p(X=x)=0
4、只能在区间上定义连续随机变量的概率。
5、p(a<=X<=b)就是a和b与密度函数之间的面积。
均匀分布:
(1) 如果,则称X服从离散的均匀分布。
(2) 设连续型随机变量X的概率密度函数为则称随机变量X服从[a,b]上的均匀分布,记为X~U(a,b)。
期望: 即数学期望位于区间(a,b)的中间。
方差:
密度函数:
累积分布函数:
正态分布
正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A.棣莫弗在求二项分布的渐近公式中得到。
正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。
若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。
其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
当μ = 0,σ = 1时的正态分布是标准正态分布。
函数NORM.INV
标准正态分布:
期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。
指数分布:即每单位时间内发生某事件的次数。指数分布的区间是[0,∞)。 如果一个随机变量X呈指数分布,则可以写作:X~ E(λ)。
期望值:1/λ
方差:(1/λ)^2
连续分布:对数正态分布、贝塔分布
五、从概率分布中随机抽样
从离散概率分布中抽样:
从常见的概率分布中抽样
Risk Solver Platform分布函
六、数据建模和分布拟合
拟合优度
用Risk Solver Platform进行分布
拟合