Galois 的个人博客 / 0 / 1 / 创建于 5年前 / 更新于 5年前
支持向量机的目标是找到使决策界和训练样本之间最大化最小距离的线。
最有间隔分类器h hh 是这样的:
h(x)=sign(wTx−b)h(x)=sign(w^Tx-b)h(x)=sign(wTx−b)
其中(w,b)∈Rn×R (w,b)\in\R^n \times\R(w,b)∈Rn×R 是以下最优化问题的解决方案:
min12∣∣w∣∣2\min\frac{1}{2}||w||^2min21∣∣w∣∣2
使得
y(i)(wTx(i)−b)≥1y^{(i)}(w^Tx^{(i)}-b)\ge1y(i)(wTx(i)−b)≥1
备注:该线定义为wTx−b=0 w^Tx-b=0wTx−b=0
合页损失用于 SVM,定义如下:
SVM
L(z,y)=[1−yz]+=max(0,1−yz)L(z,y)=[1-yz]_+=\max(0,1-yz)L(z,y)=[1−yz]+=max(0,1−yz)
给定特征映射ϕ \phiϕ,我们定义核K KK 为:
K(x,z)=ϕ(x)Tϕ(z)K(x,z)=\phi(x)^T\phi(z)K(x,z)=ϕ(x)Tϕ(z)
在实践中,由K(x,z)=exp(−∣∣x−z∣∣22σ2) K(x,z)=\exp(-\frac{||x-z||^2}{2\sigma^2})K(x,z)=exp(−2σ2∣∣x−z∣∣2) 定义的核K KK 被称为高斯核,并且经常使用这种核。
高斯核
备注:我们说我们使用「核技巧」来计算使用核的成本函数,因为我们实际上不需要知道显式映射ϕ \phiϕ, 通常,这非常复杂。相反,只需要K(x,z) K(x,z)K(x,z) 的值。
我们将拉格朗日L(w,b) \mathcal{L}(w,b)L(w,b) 定义如下:
L(w,b)=f(w)+∑i=1lβihi(w)\mathcal{L}(w,b)=f(w)+\sum\limits_{i=1}^l\beta_ih_i(w)L(w,b)=f(w)+i=1∑lβihi(w)
备注:系数βi \beta_iβi 被称为拉格朗日乘子
本作品采用《CC 协议》,转载必须注明作者和本文链接
有点东西
我要举报该,理由是:
有点东西