源码分析来源:datawhalechina
https://github.com/datawhalechina/machine-learning-toy-code/blob/main/ml-with-sklearn/Bayes/NBayes.ipynb
一、贝叶斯含义:
* 概率理论:https://www.zhihu.com/question/51448623;https://blog.csdn.net/jiangjiang_jian/article/details/81346797;https://blog.csdn.net/jiangjiang_jian/article/details/81346797
所谓的贝叶斯方法源于他生前为解决一个“逆概”问题写的一篇文章,而这篇文章是在 托马斯·贝叶斯(Thomas Bayes) 死后才由他的一位朋友发表出来的。在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”,如“假设袋子里面有N个白球,M个黑球,你伸手进去摸一把,摸出黑球的概率是多大”。而一个自然而然的问题是反过来:“如果我们事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一个(或好几个)球,观察这些取出来的球的颜色之后,那么我们可以就此对袋子里面的黑白球的比例作出什么样的推测”。这个问题,就是所谓的逆概问题。
全概率公式:H发生的可能性——P(H) = P(H|A)P(A) + P(H|B)P(B)
贝叶斯公式: 在H发生的情况下,是A促成的可能性——P(A|H) =
二、朴素贝叶斯含义(分类算法):
* https://zhuanlan.zhihu.com/p/26262151
核心在于:
三、代码备注补充:
* model.predict()和 model.predict_proba()的区别:https://blog.csdn.net/ODIMAYA/article/details/103138388;https://www.cnblogs.com/mrtop/p/10309083.html
-model.predict()得到的预测是预测类别结果,如果是二分类,就是0和1;
-model.predict_proba()此函数得到的结果是一个多维数组,如果是二分类,则是二维数组,第一列为样本预测为0的概率,第二列为样本预测为1的概率。