大数据集群搭建:安装部署MySQL、SQL Server、Zookeeper、Hadoop、Spark、Flink、Kafka、Kettle、Airflow、Flume集群
文章分类 | 链接 |
大数据集群服务器环境搭建 | 大数据集群环境搭建:Hadoop、Spark、Flink分布式集群环境 |
MySQL5.7 | MySQL 5.7.32 CentOS7离线安装教程 |
MySQL8 | MySQL 8.0.19 CentOS7离线安装教程 |
MySQL5.7 | mysql5.7数据库主从同步、双机热备、读写分离高可用集群的实现 |
SQL Server 2019 | SQL Server 2019 Linux安装教程 |
SQL Server 2019 | SQL Server 2019 Windows安装教程 |
ZooKeeper | CentOS7服务器安装ZooKeeper3.6.2集群 |
Hadoop3 | Hadoop3高可用(HA)分布式集群搭建 |
Hadoop3 | Hadoop3 重新格式化namenode |
Spark3 | Spark3 Standalone模式分布式集群搭建 |
Spark3 | Spark3 Standalone模式高可用分布式集群搭建(HA模式) |
Spark3 | Spark3 on Yarn分布式集群安装部署(YARN模式 |
Hadoop3、Spark3 | Hadoop3和Spark3配置日志聚合,客户端电脑实现YARN页面跳转查看Hadoop和Spark历史任务日志 |
Hadoop3、Spark3 | 通过给Hadoop、Spark集群的CentOS 7服务器安装Google浏览器,解决客户端环境YARN页面无法查看Hadoop、Spark日志的问题 |
Python3、Scala、Spark、pySpark | jupyter notebook集成Python3、Scala、Spark、pySpark内核 |
pyspark | CentOS7上安装Jupyter notebook使用pyspark连接spark集群 |
Flink | Flink local模式、Standalone模式、Standalone 高可用(HA)模式的安装部署 |
Flink | Flink on Yarn高可用集群的安装部署 |
Hive | Hive-3.1.2安装部署 |
Kafka | CentOS7搭建Kafka2.7分布式集群 |
kafka | kafka-eagle-2.0.3安装部署 |
kafka | CentOS7安装kafka-manager |
Airflow | 基于Python3虚拟环境安装Apache Airflow |
Kettle | Kettle分布式集群安装部署 |
Flume | Flume原理和Flume配置文件参数详解 |
Flume | ansible自动化部署flume集群消费kafka数据到HDFS |
Zeppelin | 安装zeppelin-0.9.0 |