公式:P(Y|X) = P(X|Y)*P(Y)/P(X)
机器学习视角 :P('属于某类'|'具有某特征')=P('具有某特征'|'具有某类')*P('具有某类')/P('具有某特征')
朴素贝叶斯:
优点:
过程简单速度快
对于多分类问题也同样很有效
在分布独立这个假设成立的条件下,效果奇好;需要的样本量也更少一点
对类别类的输入特征变量,效果非常好
缺点:
有时需要做平滑操作,最常见的是拉普拉斯估测(拉普拉斯平滑-加1)
现实生活中这些predictior很难是完全独立的
由于乘法交换律,朴素贝叶斯方法算出的交换词语顺序的条件概率完全一样,相当于朴素贝叶斯失去了词语之间的顺序信息
这经常用到文本分类,垃圾文件过滤,情感判别