0

点赞

收藏

分享

Elasticsearch 提升集群读性能

你的益达233 2022-05-30 阅读 71

标签: elasticsearch 数据性能优化正则表达 OpenStack 云计算

文章目录

1. 尽量 Denormalize 数据
2. 数据建模
3. 避免查询时脚本
4. 常见的查询性能问题 - 使用 Query Context
5. 聚合文档消耗内存
6. 通配符开始的正则表达
7. 优化分片
8. 读性能优化

1. 尽量 Denormalize 数据

Elasticsearch ！= 关系型数据库
尽可能Denormalize 数据，从而获取最佳的性能
使用Nested 类型的数据。查询速度会慢几倍
使用Parent / Child 关系。查询速度会慢几百倍

2. 数据建模

尽量将数据先行计算，然后保存到 Elasticsearch 中。尽量避免查询时的 Script 计算
尽量使用Filter Context，利用缓存机制，减少不必要的算分
结合profile，explain API 分析慢查询的问题，持续优化数据模型
严禁使用 * 开头通配符Terms 查询

3. 避免查询时脚本

可以在 Index 文档时，使用 Ingest Pipeline，计算并写入某个字段

Elasticsearch 提升集群读性能_数据

4. 常见的查询性能问题 - 使用 Query Context

Elasticsearch 提升集群读性能_elasticsearch_02

5. 聚合文档消耗内存

聚合查询会消耗内存，特别是针对很大的数据集进行聚合运算
如果可以控制聚合的数量，就能减少内存的开销
当需要使用不同的Query Scope，可以使用Filter Bucket

Elasticsearch 提升集群读性能_性能优化_03

6. 通配符开始的正则表达

通配符开头的正则，性能非常糟糕，需避免使用

Elasticsearch 提升集群读性能_正则表达_04

7. 优化分片

避免 Over Sharing
一个查询需要访问每一个分片，分片过多，会导致不必要的查询开销
结合应用场景，控制单个分片的尺寸
Search： 20GB
Logging：40GB
Force-merge Read-only 索引
使用基于时间序列的索引，将只读的索引进行force merge，减少segment 数

8. 读性能优化

影响查询性能的一些因素

数据模型和索引配置是否优化
数据规模是否过大，通过 Filter 减少不必要的数据计算
查询语句是否优化

0 条评论

你的益达233

关注