「A Convolutional Click Prediction Model」- 论文摘要

1、前言****

对于目前单个广告点击预测,我们能够得到各元素之间成对的相关性,但无法知道元素之间的局部相关性。再者,对于不同时间间隔,顺序点击预测的现有处理方法没有一个好的效果,这对此问题,本文提出一个新颖的模型,卷积点击预测模型(CCPM),其基于卷积神经网络。CCPM可以捕获输入元素的局部特征,无论是在单次点击事件还是在一定时间间隔内顺序点击。

2、Introduction

在推荐系统中曾广泛使用的方法有, matrix factorization (MF),Factorization Machines (FM),然而,MF与FM仅在单个点击广告中捕获低阶组合特征,而忽视了高阶组合特征。为了充分利用历史的顺序点击的信息,提出了基于RNN的预测模型,这个模型主要是把用户所浏览的历史记录作为序列,通过用户在不同的时间间隔内来划分用户的历史点击序列。然而在真实的场景下,用户对商品的兴趣会随时间而改变,RNN模型在此刻的场景下就受到限制。
在复杂的场景中为了挖掘重要的语义特征,DNN是一个很好的选择,CNN中的卷积层,池化层能够很好的发现局部重要的特征。CCPM是第一个采用CNN来提高点击预测的精度的。

3、CCPM

结构图:

「A Convolutional Click Prediction Model」- 论文摘要

在单条广告展示中(single ad impression),包括许多元素:element = (user; query; ad, impression time, site category, device type, etc),用户是否点击一个广告与用户的历史ad impression有关。一系列的ad impression组成sequentia ad impression。基于以上两种情况来预测点击概率。
CCPM由convolutional layers + flexible p-max pooling layers组成。

3.1、Convolution Layer

每个样本有n个特征,对每个特征使用embeding 得到定长为d的向量ei∈Rd,再构造成一个矩阵s∈Rdxn,得到s矩阵之后就可以套用CNN。

「A Convolutional Click Prediction Model」- 论文摘要

3.2、Flexible p-Max Pooling

由于输入的长度是可变的,为了降低这种影响,对应的池化层的参数应该也是灵活可变的,给出定义pi:

「A Convolutional Click Prediction Model」- 论文摘要

其中,l代表卷积层的层数,n表示输入的长度(特征数),pi表示第i个池化层的参数。举个例子,当n=18时,l=3,则对应的p的值分别为p1=16,p2=6,p3=3。
在顺序点击预测中,p的值很重要,它不仅能够选择出最重要的几个局部特征,而且还保存了这些特征的相对顺序。

3.3、Feature Maps

每个样本均可用一个矩阵表示,即feature map,然后对每个feature map进行卷积池化操作,最后结果接上全连接层。

本作品采用《CC 协议》,转载必须注明作者和本文链接
文章!!首发于我的博客Stray_Camel(^U^)ノ~YO
讨论数量: 0
(= ̄ω ̄=)··· 暂无内容!

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!