推荐系统概述
推荐系统是利用上下文,根据当前用户所处的环境,根据信息的特点来决定给你推荐什么内容和商品。
推荐系统在本质上是一个信息检索的系统。它和搜索最大的区别是,搜索是主动式的,根据关键词和引擎参数、搜索引擎召回、机器学习排序,决定给你看到的是哪些内容。而我们看到的推荐系统,在大多数情况下是没有主动输入的(有时会有一些简单的反馈动作),是被动出现的。
推荐系统的特征体系
荐系统的特征体系由 3 个部分组成:用户特征、内容特征、上下文特征。
用户特征:包括但不限于用户姓名、性别、年龄、注册时间、收货地址、常用区域,购买历史、浏览历史、搜索行为甚至鼠标停留点击的动作等用户特征
内容特征:包括但不限于以及商品、内容的标题分词、内容的 TF-IDF、内容来源、内容渠道、内容生产者等等
那么上下文特征, 是代表用户当前时空状态、最近一段时间的行为抽象的特征。比如说用户当前的 GPS 坐标。
协同过滤推荐(Collaborative Filtering Recommendation)
协同过滤是基于这样的假设:
为A用户找到他真正感兴趣的内容的好方法是,根据以往的A、B、C、D…用户产生的数据分析,找到与A用户有相似兴趣的其他用户B、D…,然后将B、D…感兴趣的内容推荐给A用户。
所以总计一下就是以下几步:
- 搜集用户偏好
- 寻找相近用户
- 推荐物品
协同过滤推荐三种类型
- 基于用户(user-based)的协同过滤
就是上边假设的内容
- 基于项目(item-based)的协同过滤
比如你在网上买了一本机器学习相关的书,网站马上会推荐一堆机器学习,大数据相关的书给你,这里就明显用到了基于项目的协同过滤思想。
- 基于模型(model based)的协同过滤