1.从mysql等数据库中获取需要有推荐的内容,再根据特定的条件获取推荐集;
2.向量化内容标签,提取内容标签,可以从内容标题、简介等信息中用jieba分词或Word2Vec分词提取,或以人工打标签;
3.以倒排索引获取有相关系的数据进行计算,加快内容之间相似度的计算速度;
4.计算内容之间的相似度,可以使用余弦相似度或欧几里得距离等公式获取相似度;
5.调整推荐顺序,得到和推荐内容相似度后可以根据内容其他维度进行加权,如:内容的热度、内容的订购量等;
6.把计算好的结果以key-value形式存入缓存;
7.展示数据调整,根据内容从缓存中获取计算好的推荐值,过滤下线内容,推荐数量不足以冷启动数据补齐,合并人工干预规则;