生生不息,“折腾”不止;Java晋升指北,让天下没有难学的技术
相关文档
《ClickHouse官方社区》
《ClickHouse中文社区》
《ClickHouse官方评测分析》
时代背景
1.1 OLAP
1.2 常见架构
1.2.1 ROLAP
Relational OLAP,关系型OLAP,直接使用关系模型构件;典型的:Group By
- 海量数据时,性能大打折扣
1.2.2 MOLAP
Multidimensional OLAP,多维型OLAP
- 解决了ROLAP性能问题
- 核心思想:借助预先聚合结果,使用空间换取时间的形式最终提升查询性能
1.2.3. HOLAP
Hybrid OLAP,混合架构的OLAP,HOLAP = ROLAP + MOLAP
1.3. 黑马(CK)
在数据仓库的基础上,对数据进行分层,通过层层递进形成数据集市,从而减少最终查询的数据体量;对数据进行预先处理,以空间换时间,提升查询性能;等等方式,都无法满足现代BI系统的核心思潮;
- 实时应答
- 简单易用
实时应答、简单易用,已经是现代互联网系统的必备因素,互联网的用户都是没有耐心的,他们不愿意多等1s,从某种角度看,以Hadoop生态为代表的这类非传统关系型数据库技术所实现的BI系统,可以称为现代BI系统,为数据分析开启了新纪元,大马力发动机相较以往,确实使数据分析显得游刃有余;但是,在海量数据下要实现多维度分析的实时应答,仍旧困难重重,而且更为致命的是Hadoop自身生态比较繁重;那么,这种情况就不得看看主角黑马(CK)了;
"What’s the meaning of the name, why we call it ClickHouse ?"
在一些列官方公布的基准测试对比中, ClickHouse都遥遥领先;
1.3.1 特点
- ROLAP
- 在线实时查询
- 完成的DBMS(数据库管理系统)
- 列式存储
- 不需要任何数据预处理
- 支持批量更新
- 拥有非常完善的SQL支持、函数
- 支持高可用
- 不依赖Hadoop复杂生态
- 开箱即用
ClickHouse 作为一款高性能OLAP数据库,但也不是万能的,它有以下几点不足:
- 不支持事务
- 不擅长根据主键,按行粒度进行查询
- 不擅长按行删除数据