协同过滤常常被用于分辨某为特定顾客可能感兴趣的东西,这些结论来自于对其他相似顾客对哪儿些产品感兴趣的分析。协同过滤以其出色的速度和健壮性,在全球互联网领域炙手可热。 
 算法简介 
 电子商务推荐系统的一种主要算法。 
 协同过滤推荐(Collaborative Filtering recommendation)是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。
与传统文本过滤相比,协同过滤有下列优点: 
 (1)能够过滤难以进行机器自动基于内容分析的信息。如艺术品、音乐; 
 (2)能够基于一些复杂的,难以表达的概念(信息质量、品位)进行过滤; 
 (3)推荐的新颖性。
缺点是: 
 (1)用户对商品的评价非常稀疏,这样基于用户的评价所得到的用户间的相似性可能不准确(即稀疏性问题); 
 (2)随着用户和商品的增多,系统的性能会越来越低; 
 (3)如果从来没有用户对某一商品加以评价,则这个商品就不可能被推荐(即最初评价问题)。 
 因此,现在的电子商务推荐系统都采用了几种技术相结合的推荐技术。 
 协同过滤主要基于两个方面: 
 item-basedCF 
 基于item(物品)的协同过滤,通过用户对不同item的评分来评测item之间的相似性,基于item之间的相似性做出推荐; 
 user-basedCF 
 基于user的协同过滤,通过不同用户对item的评分来评测用户之间的相似性,基于用户之间的相似性做出推荐; 
 UserCF是某个群体内的物品热门程度 
 ItemCF是反应本人的兴趣爱好,更加个性化 
 -协同过滤:基于用户行为,本质上是graph model。考虑的是用户的共同行为。 
 -内容推荐:根据文本相关性。考虑词的共现状况。 
 备注: 
 —数据减噪— 
 数据在收集的过程中会存在系统误差和随机误差,在文件传输存储时还会有截断误差。 
 这些误差会影响模型的精度。 
 你说的减噪应该是降噪。就是将数据分为干净信号和随机噪声波动两部分内容,然后去除噪音。 
 协同过滤:你跟小明是好基友,兴趣相似,小明喜欢看爱情片,还是动作的,所以你也有可能喜欢看爱情片,也是动作的。 
 基于内容:你跟小明都喜欢看爱情片,都是动作的,但是小明比较喜欢欧美的,你比较喜欢亚洲的。 
 混合推荐结果就是:电影东京有点热 
 –推荐系统的安全问题:– 
 现在推荐系统在电子商务领域的应用比较多,这里涉及到经济利益的问题,一些不法分子,会通过操纵推荐系统,比如捏造商品的评分信息,让系统只推荐自己所买的商品,这是问题之一。推荐系统一般都会记录了用户很多的行为记录,这对用户来说,是一种隐私,如何保护好用户的隐私,这是问题之二。  










