4.连续值的概率分布
4.1 渐变色打印问题(密度计算预热)
4.1.1 图表描述油墨的消耗量(累积分布函数)
打印一条渐变的油墨色带,图表描述油墨的总消耗量,横轴为长度,纵轴为消耗量
4.1.2 图表描述油墨的打印浓度(概率密度函数)
总消耗量求导的曲线即油墨浓度曲线,横轴为长度,纵轴为浓度
4.1.3 拉伸打印成品对油墨浓度的影响(变量变换)
在一定区域油墨总量不变时,拉伸会使颜色变浓/淡
4.2 概率为0情况
4.2.1 出现概率恰好为0的情况
二维空间线面积为0——可取连续值时,对于每一个值,相当于概率密度曲线包围面积的一条线,概率为0(无穷小值)
4.2.2 概率为0将带来什么问题
变量可取实数值时,该值的概率将没有意义(始终为0
4.3 概率密度函数
4.3.1 概率密度函数
累积分布函数:
概率密度函数:
对应关系:
4.3.2 均匀分布
4.3.3 概率密度函数的变量变换
由于变量变换如果出现Y=aX+b的情况,实际上纸袋长度(即变量取值范围)已经发生变化,此时应该用:(注意绝对值)
4.4 联合分布、边缘分布、条件分布
4.4.1 联合分布
表达式:
总体积为1,即所有概率和为1:
4.4.2 本小节之后的阅读方式
在将取值范围引入到实数范围后对应关系:
4.4.3 边缘分布
数学表达式:
4.4.4 条件分布
由于概率密度函数要求积分为1,不可以直接用联合分布函数带入值后,,这样无法保证满足概率密度的条件。
数学表达式:
4.4.5 贝叶斯公式
(已知结果,倒退原因的概率)
4.4.6 独立性
若等式
成立,则称x和y独立
4.4.7 任意区域的概率、均匀分布、变量变换
区域概率=体积计算
均匀分布:
变量变换:
1)横向拉伸:
若
则:
2)纵向拉伸
3)同时拉伸
4)翻转
5)斜向缩放
pass
6)线性变换
若
则
4.4.8 实数值与离散值混合存在的情况
pass
4.5 期望值、方差、标准差
4.5.1 期望值
pass
4.5.2 方差、标准差
pass
4.6 正态分布与中心极限定理
4.6.1 标准正态分布(高斯分布)
概率密度函数
性质:
系数的原因:(高斯积分公式)
-1/2的原因:使方差为1
4.6.2 一般正态分布
4.6.3 中心极限定理
pass