Applying deep learning to Related Pins
1. 背景
Pinterest的Pins相关性推荐,即基于协同过滤的item2item的推荐系统;传统上,主要根据用户的保存,点击pins到board等行为,基于co-occurrence计算pins之间的相关性。本文主要基于深度学习,计算pins之间的相关性。同时,开发更加符合大数据可升缩计算的相关性推荐系统,和传统的算法相比,基于深度学习的算法较传统算法提升了5%的用户参与度。
2. 算法原理
2.1 传统的co-occurrence算法
基于用户的行为,计算pins之间的相关性;每个board里面的pins的相关性更强,基于每个board计算里面的pins之间的相关性。潜在的缺点:
(1)board的细分,即用户的一个兴趣可能包含多个boards;
(2)board的粒度,即每个board都有自己的主题,board里面的Pins描述的粒度可能不一样,譬如动物和野生动物;
(3)board的主题的漂移,即随着时间的变化,用户的兴趣也会变化,board里面的pins也可能变化。譬如健身,可能会漂移到饮食等等;
2.2 pin2vec算法
思想来源于word2vec,即基于用户关于pins活动的上下文,构建pins向量。
(1)训练数据准备
3. 参考资料
Applying deep learning to Related Pins
https://engineering.pinterest.com/blog/applying-deep-learning-related-pins?utm_campaign=Revue
newsletter&utm_medium=Newsletter&utm_source=revue