概率 -> 预测 -> 有根据的决策
概率
量度某事发生几率的一种数量指标。
P(A) = n(A) / n(S)
S称为概率空间,或者样本空间,表示所有可能的结果。实际发生的事情都是S的子集。
维恩图(文氏图):概率的图形表示。集合论中也有这个概念。可以用它来辅助概率计算。
对立事件:A'。(要么发生A,要么发生A')A, A'互为穷举事件
互斥事件: 两个事件只有一个会发生。(互斥与穷举不一样)。
相交事件: 两个事件有可能同时会发生。P(A∪B) = P(A)+P(B) - P(A∩B)
相关事件: 几个事件发生概率互相有影响。P(A|B) != P(A)
独立事件: 事件发生概率互相没影响。P(A∩B) = P(A) * P(B), P(A|B) = P(A)
条件概率
条件概率
当事件B为已知条件时,事件A发生的概率:
P(A|B) = P(A∩B)/ P(B)
**P(A∩B)= P(B) x P(A|B) **
**P(B∩A)= P(A) x P(B|A) **
概率树
韦恩图不适合表示条件概率,可以用概率树表示。
全概率公式与贝叶斯定理
如上概率树图,如果我们知道了上面的各个概率想求P(A)?
全概率公式: P(A)= P(B) x P(A|B) + P(B’) x P(A|B’)
更近一步,如果我们想从上面的公式求出 P(B|A)?
贝叶斯定理:P(B|A)= P(B∩A)/ P(A) =[ P(A|B)* P(B) ]/ [ P(B) x P(A|B) + P(B’) x P(A|B’)]
贝叶斯使用场景?: 需要求条件概率,并且该条件概率与已知条件概率顺序相反。
如果记不清楚了可以画概率树辅助。
现实中的贝叶斯非常有用,例如过滤电子邮件,垃圾邮件检测,医学实验,等等。