进入正题之前,首先来看下分布式数据库出现的场景都有哪些:
- 单表数据量爆炸,千万级、亿级等,各种数据操作效率很低 。 关系型数据库在大于一定数据量的情况下检索性能会急剧下降。在面对互联网海量数据情况时,所有数据都存于一张表,显然会轻易超过数据库表可承受的数据量阀值。这个单表可承受的数据量阀值,需根据数据库和并发量的差异,通过实际测试获得;
- 单机数据库的瓶颈问题,处理不了高强度io。现代企业程序的瓶颈问题是数据库的瓶颈问题,所以数据库只做存储用,不再使用触发器,事物;
- 不同业务对应不同业务数据库,即使某个数据库挂了,不影响其他数据库对应的服务使用,服务高可用;
- 为了方便扩展,动态增加数据库节点,保证扩展性好;
- 数据备份,数据最重要的嘛。
环境要求
- PHP7.1+,使用ThinkPHP6.0框架的话,运行环境要求PHP7.1+;
- 至少两个服务,当然不是真的买两台服务器,推荐使用vagrant+virtualBox搭建本地虚拟服务
项目中数据库配置文件修改,支持读写分离
// 数据库连接配置信息
'connections' => [
'mysql' => [
// 数据库类型
'type' => Env::get('database.type', 'mysql'),
// 服务器地址
'hostname' => ['192.168.33.10', '188.180.0.228'],
// 数据库名
'database' => "tp",
// 用户名
'username' => "root",
// 密码
'password' => '123456',
// 端口
'hostport' => Env::get('database.hostport', '3306'),
// 数据库连接参数
'params' => [],
// 数据库编码默认采用utf8
'charset' => Env::get('database.charset', 'utf8'),
// 数据库表前缀
'prefix' => Env::get('database.prefix', ''),
// 数据库部署方式:0 集中式(单一服务器),1 分布式(主从服务器)
'deploy' => 1,
// 数据库读写是否分离 主从式有效
'rw_separate' => true,
// 开启自动主库读取
'read_master' => false,
// 读写分离后 主服务器数量
'master_num' => 1,
// 指定从服务器序号
'slave_no' => '',
// 是否严格检查字段是否存在
'fields_strict' => true,
// 是否需要断线重连
'break_reconnect' => false,
// 监听SQL
'trigger_sql' => true,
// 开启字段缓存
'fields_cache' => false,
// 字段缓存路径
'schema_cache_path' => app()->getRuntimePath() . 'schema' . DIRECTORY_SEPARATOR,
],
],
配置修改需要注意以下几点
- 启用分布式数据库后,hostname参数是关键,hostname的个数决定了分布式数据库的数量,默认情况下第一个地址就是主服务器。
- 如果主从服务器的下列连接参数一致,只需要设置一个即可,对于不同的参数,可以分别设置。切记要么相同,要么每个都设置。
连接参数 |
---|
username |
password |
hostport |
database |
dsn |
charset |
- 读写分离
- 默认的情况下读写不分离,也就是每台服务器都可以进行读写操作,对于主从式数据库而言,需要设置读写分离,修改这个参数就好了。
'rw_separate' => true,
更详细的配置可参考官方文档。
主从同步
主从数据库的数据同步工作不在框架实现,需要数据库考虑自身的同步或者复制机制。
半自动复制插件脚本安装
- 登录MySQL执行脚本:
- 主库:
install plugin rpl_semi_sync_master soname 'semisync_master.so';
- 从库:
INSTALL PLUGIN rpl_semi_sync_slave SONAME 'semisync_slave.so';
主从数据库的my.cnf文件配置:
主库:
rpl_semi_sync_master_enabled=1
rpl_semi_sync_master_timeout=1000 #此单位是毫秒
log-bin=mysql-bin #打开日志(主机需要打开)
server-id=1 #服务器id
log-bin-index=mysql-bin.index
sync_binlog=1
#给从机同步的库,可以多个
binlog-do-db=tp #从库的数据库名称
binlog-ignore-db=mysql
binlog-ignore-db=performance_schema
binlog-ignore-db=information_schema
expire_logs_days=1
从库:
rpl_semi_sync_slave_enabled=1
server-id=2 #服务器id
#要从主机同步的库
replicate-do-db=tp #主库的数据库名
主库授权同步从库的账户
GRANT REPLICATION SLAVE ON *.* TO 'root'@'188.180.0.228' IDENTIFIED BY 'XXXXXX'; #主数据库授权同步账户
FLUSH PRIVILEGES; #刷新权限
SHOW MASTER STATUS; #查看主服务状态
配置从库连接主库服务器的参数
CHANGE MASTER TO MASTER_HOST='192.168.33.10',MASTER_USER='root', MASTER_PASSWORD='XXXXXX',MASTER_LOG_FILE='mysql-bin.000008',MASTER_LOG_POS=1528;
start slave; #开启SLAVE同步
show slave status \G; #查看下slave状态
[图片上传失败...(image-8e2326-1576826636354)]
stop slave; #停止SLAVE同步
GRANT REPLICATION SLAVE ON *.* TO 'root'@'188.180.0.228' IDENTIFIED BY 'XXXXXX';# 撤销已经赋予给MySQL同步账户的权限
实际操作
1.先插入5条数据
public function add()
{
$data = [];
for ($i = 0; $i < 5; $i++) {
array_push($data, ['name' => 'name_' . ($i+1)]);
}
$res = Db::table('user')->insertAll($data);
echo '插入成功条数:' . $res;
}
浏览器访问:
如上图所示,插入数据连接的是主数据库。
主从数据库插入数据如下:
- 执行查询和更新操作
public function list()
{
$res = Db::table('user')->where('id','=',1)->find();
$row = Db::table('user')->where('id','=',$res['id'])->update(['name' => 'name_9527']);
echo $row;
}
如上图所示:查询连接的是从库,而更新操作连接的主库。
数据同步结果:
以上就是数据库读写分离、主从同步的框架内文件配置、数据库服务器文件配置和代码示例。