售前咨询
技术支持
渠道合作

物品推荐-Pandas-Python数据分析(22)

数据

数据中有3个字段分别使用逗号(,)隔开,如下:

获得有多少个唯一的商品

使用源数据(01_user_goods_score.data), 通过MRJob计算出唯一的商品。

MRJob代码(pandas_01_goods.py)

执行

注意: 上面输出的结果其中后面的 1 是没有用的

获得有多少个唯一的用户

方法和计算出唯一的商品是类似的, 同样也是使用(01_user_goods_score.data)中的数据通过MRJob分析得出

MRJob代码(pandas_01_user.py)

执行

计算用户推荐商品

思路:

  1. 将商品(pandas_01_goods.data)转化成 key value 对(其中value是矩阵的下角标),如下:
  1. 将用户(pandas_01_user.data)转化成 key value 对(其中value是矩阵的下角标),如下:
  1. 这边通过读取(02_user_goods_score_record.data)中的数据, 并且计算出商品的购买矩阵。

这边使用了 Python 的数据分析框架 scipy

在生成矩阵的时候使用的是 goods_dict 中的值来代替的, 到了最后在替换回来

  1. 通过读取(01_user_goods_score.data)中的数据, 并且计算出用户商品评分矩阵(用户只购买评分过的商品)。

在生成矩阵的时候使用的是 user_dict 中的值来代替的, 到了最后在替换回来

  1. <商品购买矩阵> X <用户商品评分矩阵> = <每个用户每个商品评分矩阵>
  2. 将 <每个用户每个商品评分矩阵> 结合 Pandas、goods_dict、user_dict 得出最终结果

计算物品推荐代码(pandas_02_final.py)

执行与结果

从最后的结果可以很容易的看出用户相关商品的得分是多少, 从而可以得到需要推荐的商品(剔除用户购买评分过的商品)。

 

 

文章转载来自:trustauth.cn

上一篇:

下一篇:

相关新闻

 

领取优惠
免费预约

申请试用SSL证书

提交成功!

咨询客服