To be a person with heart.

机器学习-贝叶斯

公式:P(Y|X) = P(X|Y)*P(Y)/P(X)

机器学习视角 :P('属于某类'|'具有某特征')=P('具有某特征'|'具有某类')*P('具有某类')/P('具有某特征')

朴素贝叶斯:

    优点:

    过程简单速度快

    对于多分类问题也同样很有效

    在分布独立这个假设成立的条件下,效果奇好;需要的样本量也更少一点

    对类别类的输入特征变量,效果非常好

    缺点:

    有时需要做平滑操作,最常见的是拉普拉斯估测(拉普拉斯平滑-加1)

    现实生活中这些predictior很难是完全独立的

    由于乘法交换律,朴素贝叶斯方法算出的交换词语顺序的条件概率完全一样,相当于朴素贝叶斯失去了词语之间的顺序信息

这经常用到文本分类,垃圾文件过滤,情感判别

评论
热度 ( 1 )

© IComac | Powered by LOFTER