0
点赞
收藏
分享

微信扫一扫

Elasticsearch 综合排序 Function Score Query 优化算分


文章目录

  • ​​1. 算分与排序​​
  • ​​2. Function Score Query​​
  • ​​3. 按受欢迎度提升权重​​
  • ​​4. 使用 Modifier 平滑曲线​​
  • ​​5. 引入 Factor​​
  • ​​6. Boost Mode 和 Max Boost#​​
  • ​​7. 一致性随机函数​​

1. 算分与排序

  • ES 默认会以文档的相关度算分进行排序
  • 可以通过制定一个或者多个字段进行排序
  • 使用相关性算分(score)排序,不能满足某些特定条件

无法针对相关度,对排序实现更多的控制

2. Function Score Query

Function Score Query
可以在查询结束后,对每一个匹配的文档进行一系列的重新算分,根据新生成的分数进行排序
提供了几种默认的计算分值的函数

  • ​Weight​​:为每一个文档设置一个简单而不被规范化的权重
  • ​Field Value Factor​​:使用该数值来修改_score,例如将 “热度” 和 “点赞数” 作为算分的参考因素
  • ​Random Score​​:为每一个用户使用一个不同的,随机算分结果

3. 按受欢迎度提升权重

望能够将点赞多的 blog,放在搜索列表相对靠前的位置。同事搜索的评分,还是要作为排序的主要依据
新的算分 = 老的算分 * 投票数

  • 投票数为 0

投票数很大时

DELETE blogs
PUT /blogs/_doc/1
{
"title": "About popularity",
"content": "In this post we will talk about...",
"votes": 0
}

PUT /blogs/_doc/2
{
"title": "About popularity",
"content": "In this post we will talk about...",
"votes": 100
}

PUT /blogs/_doc/3
{
"title": "About popularity",
"content": "In this post we will talk about...",
"votes": 1000000
}


POST /blogs/_search
{
"query": {
"function_score": {
"query": {
"multi_match": {
"query": "popularity",
"fields": [ "title", "content" ]
}
},
"field_value_factor": {
"field": "votes"
}
}
}
}

4. 使用 Modifier 平滑曲线

新的算分 = 老的算分 * log(1 + 投票数)
Elasticsearch 综合排序 Function Score Query 优化算分_elasticsearch

POST /blogs/_search
{
"query": {
"function_score": {
"query": {
"multi_match": {
"query": "popularity",
"fields": [ "title", "content" ]
}
},
"field_value_factor": {
"field": "votes",
"modifier": "log1p"
}
}
}
}

5. 引入 Factor

新的算分 = 老的算分 * log(1 + factor * 投票数)

Elasticsearch 综合排序 Function Score Query 优化算分_随机函数_02

POST /blogs/_search
{
"query": {
"function_score": {
"query": {
"multi_match": {
"query": "popularity",
"fields": [ "title", "content" ]
}
},
"field_value_factor": {
"field": "votes",
"modifier": "log1p" ,
"factor": 0.1
}
}
}
}

6. Boost Mode 和 Max Boost#

Boost Mode

  • Multiply:算分和函数值的乘积
  • Sum:算分和函数值的和
  • Min/Max:算分与函数去 最小 / 最大值
  • Replace:使用函数取代算分

Max Boost 可以将算分控制在一个最大值

POST /blogs/_search
{
"query": {
"function_score": {
"query": {
"multi_match": {
"query": "popularity",
"fields": [ "title", "content" ]
}
},
"field_value_factor": {
"field": "votes",
"modifier": "log1p" ,
"factor": 0.1
},
"boost_mode": "sum",
"max_boost": 3
}
}
}

7. 一致性随机函数

  • 使用场景:网址的广告需要提高展示率
  • 具体需求:让每个用户看到不同的随机排名,但是也希望同一个用户访问时,结果的相对顺序,保持一致(Consistently Random)

POST /blogs/_search
{
"query": {
"function_score": {
"random_score": {
"seed": 911119
}
}
}
}

举报

相关推荐

0 条评论