认真是我们
参与这个社会的方式

朴素贝叶斯算法

联合概率和条件概率

联合概率:包含多个条件,且所有条件同时成立的概率

记作:𝑃(𝐴,𝐵)

条件概率:就是事件A在另外一个事件B已经发生条件下的发生概率

记作:𝑃(𝐴|𝐵)

特性:P(A1,A2|B) = P(A1|B)P(A2|B)

注意:此条件概率的成立,是由于A1,A2相互独立的结果

朴素贝叶斯公式

公式右边三个部分

1、𝑃(𝐶):每个文档类别的概率(某文档类别词数/总文档词数)

2、𝑃(𝑊│𝐶):给定类别下特征(被预测文档中出现的词)的概率

  • 计算方法:𝑃(𝐹1│𝐶)=𝑁𝑖/𝑁 (训练文档中去计算)
  • 𝑁𝑖为该𝐹1词在C类别所有文档中出现的次数
  • N为所属类别C下的文档所有词出现的次数和

3、𝑃(𝐹1,𝐹2,…) 预测文档中每个词的概率

拉普拉斯平滑

没有故事 也没有酒

点也没用点也没用