朴素贝叶斯(Naive Bayes)是一种既简单又强大的预测建模算法。
该模型由两种类型的概率组成,可以从你的训练数据中直接计算出来:
每个类别的概率
给定x值的条件下,每个类别的条件概率
经由概率计算,该模型基于贝叶斯定理,对新的数据进行预测。
对于类型为实数的数据,我们通常假设这些数据呈现高斯分布(钟形曲线),以便轻松地估算其概率。
朴素贝叶斯之所以称作朴素,是因为它假设每个输入变量是独立的。 这是一个“强”假设,对于现实世界的数据却是不切实际的。即便如此,该技术对于各类复杂问题仍然非常有效。