0
点赞
收藏
分享

微信扫一扫

协同过滤


协同过滤常常被用于分辨某为特定顾客可能感兴趣的东西,这些结论来自于对其他相似顾客对哪儿些产品感兴趣的分析。协同过滤以其出色的速度和健壮性,在全球互联网领域炙手可热。
算法简介
电子商务推荐系统的一种主要算法。
协同过滤推荐(Collaborative Filtering recommendation)是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。

与传统文本过滤相比,协同过滤有下列优点:
(1)能够过滤难以进行机器自动基于内容分析的信息。如艺术品、音乐;
(2)能够基于一些复杂的,难以表达的概念(信息质量、品位)进行过滤;
(3)推荐的新颖性。

缺点是:
(1)用户对商品的评价非常稀疏,这样基于用户的评价所得到的用户间的相似性可能不准确(即稀疏性问题);
(2)随着用户和商品的增多,系统的性能会越来越低;
(3)如果从来没有用户对某一商品加以评价,则这个商品就不可能被推荐(即最初评价问题)。
因此,现在的电子商务推荐系统都采用了几种技术相结合的推荐技术。
协同过滤主要基于两个方面:
item-basedCF
基于item(物品)的协同过滤,通过用户对不同item的评分来评测item之间的相似性,基于item之间的相似性做出推荐;
user-basedCF
基于user的协同过滤,通过不同用户对item的评分来评测用户之间的相似性,基于用户之间的相似性做出推荐;
UserCF是某个群体内的物品热门程度
ItemCF是反应本人的兴趣爱好,更加个性化
-协同过滤:基于用户行为,本质上是graph model。考虑的是用户的共同行为。
-内容推荐:根据文本相关性。考虑词的共现状况。
备注:
—数据减噪—
数据在收集的过程中会存在系统误差和随机误差,在文件传输存储时还会有截断误差。
这些误差会影响模型的精度。
你说的减噪应该是降噪。就是将数据分为干净信号和随机噪声波动两部分内容,然后去除噪音。
协同过滤:你跟小明是好基友,兴趣相似,小明喜欢看爱情片,还是动作的,所以你也有可能喜欢看爱情片,也是动作的。
基于内容:你跟小明都喜欢看爱情片,都是动作的,但是小明比较喜欢欧美的,你比较喜欢亚洲的。
混合推荐结果就是:电影东京有点热
–推荐系统的安全问题:–
现在推荐系统在电子商务领域的应用比较多,这里涉及到经济利益的问题,一些不法分子,会通过操纵推荐系统,比如捏造商品的评分信息,让系统只推荐自己所买的商品,这是问题之一。推荐系统一般都会记录了用户很多的行为记录,这对用户来说,是一种隐私,如何保护好用户的隐私,这是问题之二。


举报

相关推荐

0 条评论