| 分类:Coding生活 |
|
标签:学习 |
注:我毕设要做一个垂直搜索引擎中的用户推荐项目,这些是我摘录的一些资料和相关分析。

目标:设计一个推荐系统;该系统用于bijiala垂直搜索引擎中;能够针对用户给出合适的推荐;推荐内容包括用户可能感兴趣的产品,某款产品用户可能感兴趣的价格区间、品牌等元数据,关联的关键字;能够根据用户是否接受推荐进行再学习。
原则:尽量高的准确率;尽量好的效率,良好的扩展性。
基元数据:页面、关键字、元数据。
思路:基于内容和协同过滤的结合方法。
做法:
两个维度的分析:用户自身的纵向对比,用户之间的横向对比
两者之间的权重动态调整(根据用户反馈)
多个维度的推荐:
产品类别推荐(如该类别最热产品)
关键字推荐
元数据推荐(如价格区间、供应商等)
过程:用户建模-->项目匹配-->推荐输出
用户建模:数据收集、模型表示、模型学习、模型更新
方法:基于内容,基于知识,基于协同过滤,基于Web使用挖掘,混合类型
基于内容:
设计目标是什么?建立怎么样的系统?有哪些考评该系统的依据?关键功能点是什么?
最终要推荐什么:产品(电子产品、机票、酒店)、关键字、下一步要做什么?是进行有状态的推荐还是无状态的推荐?
如何将用户与这些东西关联:向量?关键字如何识别并与某类产品关联?
如何进行权重分配?用户之间相似度的权重,用户直接关键字搜索的权重,用户点击的权重,用户采纳建议后如何计算权重并并入现有体系?
长期跟踪的推荐还是短期的推荐?能够从web日志中提取出cookies信息?
定义用户的元操作:关键字搜索、点击链接访问了概要信息
可分析:
1.页面停留时间
2.链接流
3.访问时间
可得出:
1.产品之间的相关性
2.用户感兴趣产品
3.用户感兴趣区域
4.针对用户高频搜索区域进行索引效率优化
5.统计网站更新规律,对变动较快的网站,提供更高的抓取频率
6.页面关联
7.兴趣邻居