Galois 的个人博客 / 0 / 1 / 创建于 5年前 / 更新于 5年前
朴素贝叶斯模型假设每个数据点的特征都是独立的:
P(x∣y)=P(x1,x2,...∣y)=P(x1∣y)P(x2∣y)...=∏i=1nP(xi∣y)P(x|y)=P(x_1,x_2,...|y)=P(x_1|y)P(x_2|y)...=\prod\limits_{i=1}^nP(x_i|y)P(x∣y)=P(x1,x2,...∣y)=P(x1∣y)P(x2∣y)...=i=1∏nP(xi∣y)
最大化对数似然给出以下解,k∈{0,1},l∈[1,L]k\in\lbrace0,1\rbrace,l\in[1,L]k∈{0,1},l∈[1,L]。
P(y=k)=1m×#{j∣y(j)=k}P(y=k)=\frac{1}{m}\times\# \lbrace j|y^{(j)}=k \rbraceP(y=k)=m1×#{j∣y(j)=k}
P(xi=l∣y=k)={#j∣y(j)=k&xi(j)=l}#{j∣y(j)=k}P(x_i=l|y=k)=\frac{\lbrace\#j|y{(j)}=k \& x_i^{(j)}=l\rbrace}{\#\lbrace j|y^{(j)}=k \rbrace}P(xi=l∣y=k)=#{j∣y(j)=k}{#j∣y(j)=k&xi(j)=l}
备注:朴素贝叶斯广泛用于文本分类和垃圾邮件检测。
本作品采用《CC 协议》,转载必须注明作者和本文链接
不是太懂
我要举报该,理由是:
不是太懂