GFS分布式文件系统概述以及集群部署-CFANZ编程社区

一、文件系统简介

1.1文件系统的组成

接口：文件系统接口
功能模块（管理、存储的工具）：对对象管理里的软件集合
对象及属性：（使用此文件系统的消费者）

1.2文件系统的作用

从系统角度来看，文件系统时对文件存储设备的空间进行组织和分配，负责文件存储并对存入的文件进行保护和检索的系统
主要负责为用户建立文件、存入、读出、修改、转储文件，控制文件的存取

1.3文件系统的挂载使用

除跟文件系统以外的文件系统创建后要使用需要先挂载至挂载点后才可以被访问
挂载点即分区设备文件关联的某个目录文件
类比NFS（外部的文件系统），使用挂载的方式才可以让本地系统来使用外部的文件系统的功能
例如：配置永久挂载时，我们会写入挂载点与挂载目录，还有文件系统的名称（xfs），文件类型格式等。我们在远程跨服务器使用GFS分布式文件系统，挂载时也需要指定其文件格式（GlusterFS）

二、GFS分布式文件系统

2.1 GFS简介

1）GFS是一个可扩展、开源的分布式文件系统（可以很好的体现出弹性伸缩的特点），用于大型的、分布式的、对大量数据进行访问的应用，在传统的解决方案中，GFS 能够灵活的结合物理的，虚拟的和云资源去体现高可用和企业级的性能存储

2）GFS由三个组件组成：

①存储服务器（Brick Server）

② 客户端（不在本地）（且，有客户端，也会有服务端，这点类似于 NFS，但是更为复杂）

③ 存储网关（NFS/Samaba）

无元数据服务器：
元数据是核心，描述对象的信息，影响其属性；
例如NFS，存放数据本身，是一个典型的元数据服务器可能存在单点故障，故要求服务器性能较高，服务器一旦出现故障就会导致数据丢失；
反过来看，所以无元数据服务不会有单点故障。
那么数据存放在哪里呢？会借用分布式的原则，分散存储，不会有一个统一的数据服务器

2.2 GFS的特点

扩展性和高性能：可扩展性，扩展节点，通过多节点提高性能。GlusterFS采用弹性哈希算法在存储池中可以智能地定位任意数据分片（将数据分片存储在不同节点上），不需要查看索引或者向元数据服务器查询。
高可用性：不存在单点故障，有备份机制，类似Raid的容灾机制，当数据出现不一致时，自我修复功能能够把数据恢复到正确的状态，数据的修复是以增量的方式在后台执行，几乎不会产生性能负载
全局同意命名空间：类比 API 的性质/概念，系统里根据他命名所定义的隔离区域，是一个独立空间；统一的名称空间，与客户端交互，把请求存放至后端的块数据服务器
弹性卷管理：方便扩容及对后端存储集群的管理与维护，较为复杂。逻辑存储池可以在线进行增加和移除，不会导致业务中断。逻辑卷可以根据需求在线增长和缩减，并可以在多个节点中实现负载均衡
基于标准协议：Gluster 存储服务支持 NFS、CIFS、HTTP、FTP、SMB 及 Gluster原生协议，完全与 POSIX 标准（可移植操作系统接口）兼容。现有应用程序不需要做任何修改就可以对Gluster 中的数据进行访问，也可以使用专用 API 进行访问。

2.3 GFS专业术语

Brick 存储服务器：实际存储用户数据的服务器
Volume：本地文件系统的"分区”
FUSE：用户空间的文件系统(类比EXT4)，“这是一个伪文件系统”;以本地文件系统为例，用户想要读写一个文件，会借助于EXT4文件系统，然后把数据写在磁盘上；而如果是远端的GFS，客户端的请求则应该交给FUSE(为文件系统)，就可以实现跨界点存储在GFS上
VFS(虚拟端口) ：内核态的虚拟文件系统，用户是先提交请求交给VFS然后VFS交给FUSE，再交给GFS客户端，最后由客户端交给远端的存储
Glusterd(服务)：是允许在存储节点的进程（客户端运行的是gluster client）GFS使用过程中整个GFS之间的交换由Gluster client 和glusterd完成

2.4 GFS 工作流程

① 客户端或应用程序通过 GlusterFS 的挂载点访问数据；

② linux系统内核**通过 VFS API 虚拟接口收到请求并处理；

③ VFS 将数据递交给 FUSE 内核文件系统，这是一个伪文件系统，这个伪文件系统主要用来转存，它提供一个虚拟接口，映射出来/dev/fuse这样一个虚拟路径，而 FUSE 文件系统则是将数据通过 /dev/fuse 设备文件递交给了 GlusterFS client 端。可以将 FUSE 文件系统理解为一个代理

④ GlusterFS client 会实时监听/dev/fuse下的数据，一旦数据更新，会把数据拿过来，client 根据配置文件的配置对数据进行处理

⑤ 经过 GlusterFS client 处理后，通过网络将数据传递至远端的 GlusterFS Server，server会先转存到本地的vfs虚拟文件系统中**，然后再通过vfs转存到EXT3上。EXT3指的是各个block块中的EXT3文件系统中。

GFS分布式文件系统概述以及集群部署_数据

GFS-server 端功能模块的划分：

① 卷的类型（使用分布式、复制、条带)

② 存储管理(卷的创建、启用、关闭)

③ I/O调用(存储后，读取数据，如何读取)

④ 与GFS-client 端对接

GFS-client 端

① 用户通过用户态模式下，存储数据(写入数据)

② 写入的数据，使用GFS挂载的形式完成（网络挂载samba/NFS)

③数据的写入会由GFS-client转存到GFS-server端(对应的卷中)

网络通讯

① Infinlband ——— IB

② RDMA——— 面向连接传输协议—— 数据完整性(丢包率低)

③ TCP/IP

④ RDMA———》以后的服务中可以做为跨节点共享内存资源的协议

三、Gluster构成

模块化堆栈式架构

模块化、堆栈式的架构
通过对模块的组合，实现复杂的功能

1、API：应用程序编程接口

2、模块化：每个模块可以提供不同的功能

3、堆栈式：同时启用多个模块，多个功能可以组合，实现复杂的功能

I/O cache：I/O缓存
read ahead：内核文件预读
distribute/stripe：分布式、条带化
Gige：千兆网/千兆接口
TCP/IP：网络协议
InfiniBand：网络协议，与TCP/IP相比，TCP/IP具有转发丢失数据包的特性，基于此通信协议可能导致通信变慢，而IB使用基于信任的、流控制的机制来保证连接完整性
RDMA：负责数据传输，有一种数据传输协议，功能：为了解决传输过程中客户端与服务器端数据处理的延迟

GFS分布式文件系统概述以及集群部署_数据_02