目录
MongoDB介绍
与关系型数据库比较
MongoDB安装
MongoDB架构
MongoDB存储引擎
MongoDB介绍
MongoDB简介
MongoDB 是免费开源的跨平台 NoSQL 数据库,命名源于英文单词 humongous,意思是「巨大无比」,可见开发组对 MongoDB 的 定位。与关系型数据库不同,MongoDB 的数据以类似于 JSON 格式的二进制文档存储:
{
name: "McConaughey",
age: 18,
hobbies: ["travel", "swimming"]
}
文档型的数据存储方式有几个重要好处:文档的数据类型可以对应到语言的数据类型,如数组类型(Array)和对象类型(Object); 文档可以嵌套,有时关系型数据库涉及几个表的操作,在 MongoDB 中一次就能完成,可以减少昂贵的连接花销;文档不对数据结构加以限制,不同的数据结构可以存储在同一张表。
MongoDB的适用场景
网站数据:Mongo 非常适合实时的插入,更新与查询,并具备网站 实时数据存储所需的复制及高度伸缩性。
缓存:由于性能很高,Mongo 也适合作为信息基础设施的缓存层。 在系统重启之后,由Mongo搭建的持久化缓存层可以避免下层的数 据源过载。
大尺寸、低价值的数据:使用传统的关系型数据库存储一些大尺寸 低价值数据时会比较浪费,在此之前,很多时候程序员往往会选择 传统的文件进行存储。
高伸缩性的场景:Mongo 非常适合由数十或数百台服务器组成的数 据库,Mongo 的路线图中已经包含对MapReduce 引擎的内置支持 以及集群高可用的解决方案。
用于对象及JSON 数据的存储:Mongo 的BSON 数据格式非常适合 文档化格式的存储及查询。
- MongoDB的行业具体应用
游戏场景,使用 MongoDB 存储游戏用户信息,用户的装备、积分 等直接以内嵌文档的形式存储,方便查询、更新。
物流场景,使用 MongoDB 存储订单信息,订单状态在运送过程中 会不断更新,以 MongoDB 内嵌数组的形式来存储,一次查询就能 将订单所有的变更读取出来。
社交场景,使用 MongoDB 存储存储用户信息,以及用户发表的朋 友圈信息,通过地理位置索引实现附近的人、地点等功能。
物联网场景,使用 MongoDB 存储所有接入的智能设备信息,以及 设备汇报的日志信息,并对这些信息进行多维度的分析。 直播,使用 MongoDB 存储用户信息、礼物信息等。
- 如何抉择是否使用MongoDB
有一个yes就可以选择MongoDB,两个以上yes,选MongoDB绝对不后悔
实时效果反馈
1.MongoDB采用什么形式存储数据?
A 二维表格
B key-value
C 文档
D 以上都是
与关系型数据库比较
MongoDB与RDMS(关系型数据库)比较,如下图所示
什么是BSON
BSON是一种类似于JSON的二进制形式的存储格式,简称Binary JSON,它和JSON一样,支持内嵌的文档对象和数组对象,但是 BSON有JSON没有的一些数据类型,如Date和BinData类型。 BSON有三个特点:轻量性、可遍历性、高效性。
下表列出了MongoDB中Document可以出现的数据类型:
实时效果反馈
1.MongoDB的特点不包括哪个?
A 读取速度快
B 支持地理坐标索引
C 以BSON文档为单位进行存储
D 支持事务
MongoDB安装
独立安装
进入/etc/yum.repos.d目录,创建文件mongodb-org-5.0.repo
[root@192 yum.repos.d]# pwd
/etc/yum.repos.d
[root@192 yum.repos.d]#
在文件内输入yum源地址
[mongodb-org]
name=MongoDB Repository
baseurl=http://mirrors.aliyun.com/mongodb/yum/redhat/7Server/mongodb-org/5.0/x86_64/
gpgcheck=0
enabled=1
安装之前先更新
yum update
开始安装
yum -y install mongodb-org
安装完成后,查看mongo的安装位置
whereis mongod
修改配置文件
vim /etc/mongod.conf
bindIp: 172.0.0.1 改为 bindIp: 0.0.0.0
启动
systemctl start mongod.service
停止
systemctl stop mongod.service
重启
systemctl restart mongod.service
查看
systemctl status mongod.service
设置开机自启动
systemctl enable mongod.service
mongo shell 的启动
./bin/mongo
指定主机和端口的方式启动
./bin/mongo --host=主机IP --port=端口
docker安装
访问hub.docker.com,搜索mongo镜像
查看可用的镜像
获取你想要拉取的镜像
docker pull mongo:xxx
查看已下载的镜像
docker images
创建挂载目录
mkdir -p /mnt/mongodb/data --创建保存数据目录
创建并运行 mongo 容器
docker run -itd --privileged=true --name mongo5
-p 27017:27017 -v /mnt/mongodb/data:/data/dbmongo:5.0.9-focal
使用GUI工具连接MongoDB
使用NosqlBooster For MongoDB客户端工具连接MongoDB数据库
实时效果反馈
1.MongoDB默认端口是?
A 6379
B 27017
C 8761
D 15672
MongoDB架构
MongoDB逻辑结构
MongoDB 与 MySQL 中的架构相差不多,底层都使用了可插拔的 存储引擎以满足用户的不同需要。用户可以根据程序的数据特征选择不同的存储引擎,在最新版本的 MongoDB 中使用了 WiredTiger 作为默认的存储引擎,WiredTiger 提供了不同粒度的并发控制和压缩机制,能够为不同种类的应用提供了最好的性能和存储率。 在存储引擎上层的就是 MongoDB 的数据模型和查询语言了,由于 MongoDB 对数据的存储与 RDBMS有较大的差异,所以它创建了一 套不同的数据模型和查询语言。
MongoDB数据模型
与SQL数据库不同,在SQL数据库中,在插入数据之前必须确定和 声明表的架构,默认情况下,MongoDB的集合不要求其文档具有相 同的架构。
结构灵活
单个集合中的文档不需要具有相同的字段集合,并且集合中的文档 之间的字段数据类型可能不同;
可灵活更改集合中文档的结构,如添加新字段、删除现有字段或将 字段值更改为新类型,将文档更新为新结构。
文档结构
内嵌
内嵌的方式指的是把相关联的数据保存在同一个文档结构之中。 MongoDB的文档结构允许一个字段或者一个数组内的值作为一个嵌套的文档。
引用
引用方式通过存储数据引用信息来实现两个不同文档之间的关联,应 用程序可以通过解析这些数据引用来访问相关数据。
如何选择数据模型
选择内嵌:
数据对象之间有包含关系 ,一般是数据对象之间有一对多或者一对一 的关系 。
需要经常一起读取的数据。
有 map-reduce/aggregation 需求的数据放在一起,这些操作都只 能操作单个 collection。
选择引用:
当内嵌数据会导致很多数据的重复,并且读性能的优势又不足于覆 盖数据重复的弊端 。 需要表达比较复杂的多对多关系的时候 。 大型层次结果数据集 嵌套不要太深。
实时效果反馈
1.MongoDB集合中一个集合下所有文档的结构必须一致?
A 必须一致
B 必须不一致
C 可以不一致
MongoDB存储引擎
存储引擎负责管理数据如何在磁盘和内存中存储,MongoDB支持多 种存储引擎,不同的存储引擎都有其在特定工作环境下的特点,选 择适合的存储引擎能够有效提高应用程序的性能。
WiredTiger存储引擎 (默认)
WiredTiger适合大多数工作场景,从MongoDB 3.2开始默认的存储引擎是WiredTiger,3.2版本之前的默认存储引擎是MMAPv1, MongoDB 4.x版本不再支持MMAPv1存储引擎。
支持document级别并发操作
WiredTiger对写入操作使用document级并发控制。因此,多个客 户端可以同时修改集合的不同文档。对于大多数读写操作, WiredTiger使用乐观并发控制。WiredTiger仅在全局、数据库和集 合级别使用意向锁。当存储引擎检测到两个操作之间的冲突时,其 中一个操作将引发写入冲突,MongoDB会对用户透明地重试该操作。
Snapshots and Checkpoints(快照和检查点)
WiredTiger使用多版本并发控制(MVCC)。在操作开始时, WiredTiger会向操作提供数据的point-in-time快照,快照显示了数 据在内存中的一致性视图。
从3.6版开始,MongoDB将WiredTiger配置为每隔60秒创建检查点 (即将快照数据写入磁盘)。在早期版本中,MongoDB将检查点设 置为在WiredTiger中每隔60秒或写入2 GB日志数据时(以先发生的 为准)对用户数据进行检查。
Journal(日志)
WiredTiger将日志与检查点结合使用,以确保数据的持久性。 WiredTiger日志将保留检查点之间的所有数据修改。如果 MongoDB在两个检查点之间退出,它将使用日志重播自上一个检查 点以来修改的所有数据
Compression(压缩)
使用WiredTiger存储引擎,MongoDB会对所有集合和索引进行压 缩,压缩以牺牲额外的CPU为代价,最大限度地减少了磁盘的使 用。默认情况下,WiredTiger对所有集合使用block compression,并对索引使用prefix compression。
内存使用
对于WiredTiger,MongoDB利用WiredTiger内部缓存和文件系统 缓存。从MongoDB 3.4开始,默认WiredTiger内部缓存大小为以下 两者中的较大值: 15 50% of (RAM - 1 GB) 256 MB
实时效果反馈
1.MongoDB4.4使用的存储引擎是?
A MyISAM
B InnoDB
C WiredTiger
D MMAPv1
2.一台主机的内存是1.25GB时,wiredTiger存储引擎的内部缓存大小是?
A 0.5GB
B 256MB
C 1GB
D 以上都不对
In-memory存储引擎
从MongoDB 企业版3.2.6版开始,In-Memory存储引擎是64位版本 中广泛使用(general availability GA)的一部分。除某些元数据和 诊断数据外,In-Memory存储引擎不维护任何磁盘上的数据,包括 配置数据,索引,用户凭据等。
In-Memory存储引擎设置
配置--storageEngine选项值为inMemory;如果使用配置文件,则 配置storage.engine
配置--dbpath,如果使用配置文件则配置storage.dbPath。尽管In-Memory存储引擎不会将数据写入文件系统,但它会在--dbpath中 维护小型元数据文件和诊断数据以及用于构建大型索引的临时文件。
mongod --storageEngine inMemory --dbpath
<path>
storage:
engine: inMemory
dbPath: <path>
并发(concurrency)
In-Memory存储引擎对于写入操作使用了document级并发控制。 多个客户端可以同时修改集合的不同文档。
内存使用
默认情况下,In-Memory存储引擎使用50%的物理RAM减去1 GB。 如果写操作的数据超过了指定的内存大小,则MongoDB返回错误:
"WT_CACHE_FULL: operation would overflow cache"
要指定新大小,可使用YAML格式配置文件的
storage:
engine: inMemory
dbPath: <path>
inMemory:
engineConfig:
inMemorySizeGB: <newSize>
事务
从MongoDB 4.2开始,复制集和分片集群上支持事务,其中:主成员节点使用WiredTiger存储引擎,同时,辅助成员使用WiredTiger 存储引擎或In-Memory存储引擎。 在MongoDB 4.0中,只有使用WiredTiger存储引擎的复制集才支持 事务。
实时效果反馈
1.In-memory存储引擎不持久化的数据有?
A 应用数据
B 索引
C 用户凭据
D 以上都是