当前位置:首页 » 《随便一记》 » 正文

聊聊我最近的分库分表骚操作_七里翔的博客

20 人参与  2022年02月27日 15:07  分类 : 《随便一记》  评论

点击全文阅读


聊聊我最近的分库分表骚操作

  • 前言
  • 背景
  • 分库分表方案
    • 切分策略
    • 不分库,只分表
  • 技术选型
  • 问题及解决方案
    • 分布式ID实现
      • 不重复的ID该怎么实现?
    • 表下标维护
      • 插入前查询maxId
      • 插入后查询maxId
      • 预留ID
      • 预留ID + 不依赖redis
    • 多数据源、sharding-jdbc、主从怎么结合到一块?
      • 怎么解决多数据源和shardingsphere数据源冲突的问题?
      • 怎么解决分表+主从数据库不适合用shardingsphere的问题?
  • 影响
    • 部分SQL性能问题
  • 上线前准备
    • 数据迁移
    • 服务切换
      • 预留一部分主键ID
      • 最后的方案
  • 其它
    • 存储过程
    • 多数据源组件
  • 后续思考
    • 假如要分库


前言

国庆前这段时间一直都在搞分库分表相关的东西,中间遇到了比较多的问题,不过最后还是都艰难地解决掉了。这段时间感觉挺累但又挺有意思的,需要思考的点很多,所以决定写篇博客总结一下。毕竟因为最近在刷算法题,没更新过什么博客了,趁国庆时间比较多,赶紧卷一卷。
水一篇博客

背景

先说一下背景吧。我们项目之前是完全没做分库分表的,现在有几张核心的表,数据量已经非常大了,数据量最大的一张表已经有接近250亿的数据了……我刚开始看到这张表的数据量是比较惊讶的,而且还跟DBA大佬了解了一下,现在线上这张表的操作耗时非常短,暂时没有性能问题。一般来说,千万级的数据量应该已经比较影响性能了,现在这个表已经差不多250亿数据了,还不出问题?
?

我分析了一下这张表的结构,然后看了一下相关的SQL,我认为这张表暂时还没有性能问题有以下两点:

  1. 数据结构简单。这是一张文件表,里面的字段不多,只有主键id、文件名、key、hash、url、大小等字段,占用的空间也不大
  2. SQL不复杂。我分析了一下与这张表有关系的所有SQL,发现这张表几乎没有update操作(有是有,但是只有一个SQL,而且那个方法还被废弃了,我们现在的业务基本上不会对这张表的数据进行修改),只有insert和select操作,而且select操作大部分都是通过主键id作为条件查询,少量是通过hash字段来进行查询,所以需要维护的索引也不多,只有主键索引和这个hash字段的普通索引。所以这张表的相关SQL是比较简单的。

虽然现在没有性能问题,但是嘛……现在这张表每个月的增长速度是亿级别的,再不做分库分表,迟早要出问题。所以我决定先对它出手了!另外几张表的数据量也很大,但是与之相关的操作太复杂了,所以我觉得我得先找个简单的表实践实践,积累一点经验后再对其它几张表下手。
在这里插入图片描述

分库分表方案

分库分表主要有垂直切分和水平水平,这次针对的问题是单表容量达到瓶颈的问题,因此采用水平切分

以下把这张表叫做 t_file 表吧。

切分策略

水平切分策略主要有hash切分和范围切分,优缺点如下表。

切分策略实现优点缺点
hash切分hash取模mod数据分片相对比较均匀,不容易出现热点和并发访问的瓶颈1.后期分片集群扩容需要迁移旧的数据。
2.容易面临跨分片查询的复杂问题
范围切分按照时间区间或ID区间来切分1.单表大小可控
2.便于水平扩展
3.对范围查找友好
热点可能容易成为性能瓶颈

最终经过考虑,决定采用范围切分策略,主要原因是 t_file 的主键原来是整型的自增主键,不适合用hash切分。目前数据量非常大,并且还涉及到另外几张表,有些表存储了一个列表,列表里存的就是整型ID,那些表也非常大,改的话影响范围太大,所以不可能把整型修改成其它类型。

不分库,只分表

这张表我们有没有必要分库呢?我和我的mentor讨论了一下,觉得是暂时只做分表即可。只要原因有以下几个:

  1. 我们有主从,做了读写分离(也不算完全读写分离,个别对延时方面要求高的SQL读的是主库),并且跟DBA大佬讨论过,数据库压力并没有那么大。而且我们如果在主从上又做分库,那每个实例启动后都需要连接并且管理大量的数据源,需要消耗大量资源,不是很值得
  2. 这张表,是存在一个独立的库中的,那个库只有这一张表!由于这张表数据里较大,之前我们就把这张表分出来放到一个独立的库中了,它跟其它表并不是在同一个数据库。所以它压力更小了
  3. 由于是水平切分,我们后期要是再想做分库的话,不用再次迁移数据,或者说迁移数据的复杂度很低,并且路由规则也不需要改太多。以后我们想做分库再做就是了,现在不用一步到位

所以最终决定不分库,只分表。

技术选型

目前比较主流的分库分表中间件有mycat、sharding-jdbc、tidb,最终决定使用sharding-jdbc,原因有下:

  1. 现在只打算分表,而不分库,Mycat和tidb并没有太大优势
  2. mycat是proxy层解决方案,需要部署、维护,并且本身是单点的,高可用性差,如果想要集群还需要再引入别的中间件
  3. tidb资源利用率低、维护成本也很高

综合业务及中间件优缺点考虑,sharding-jdbc较为合适。
就用sharding-jdbc

问题及解决方案

写的过程碰到了几个问题,搞了点骚操作。
满脑子骚操作

分布式ID实现

不重复的ID该怎么实现?

分库分表后,需要保证数据插入后ID的唯一性,实现不重复的ID一般有以下几种方案:

  1. 使用雪花算法生成ID。雪花算法会生成64 bit的ID,转成字符串后长度是19位(有个表需要存储文件表数据ID),长度比较长。如果我们使用了雪花算法,那另一个表每一行的数据都会膨胀很多,这就不是很划算了……
  2. 实现发号器。可通过redis的incrby实现全局单调ID生成器,从而保证唯一性。但是这个方案会使插入数据操作强依赖于中间件,必须考虑到持久化、高可用等问题,实现一个靠谱的发号器需要考虑到的地方太多,不容易落地。
  3. 使用UUID。我们要用整型ID,UUID没法满足。
  4. 使用数据库的自增ID。该表的数据比较特殊,只会新增,不会删除,并且极少有修改操作,因此可以考虑继续使用数据库的自增ID。而要保证每个表的ID都不重复,那就要先确定好每个表的ID范围没有交集,再在建表时设置好表的起始自增序列号,业务方需要确保在插入数据时判断该表的最大ID必须小于下一个表的起始自增序列号。例如我们打算每个表存储100行数据,那么 t_file_0 表的ID范围为 0 ~ 99(当然,我们没有ID为0的数据,最小的是1),t_file_1 表的ID范围为 100 ~ 199 ,t_file_2 表的ID范围为 200 ~ 299……

方案四实现全局唯一ID比较简单,类型符合我们要求,性能也没有损耗,因此决定采用方案四。但是问题接踵而至。

使用方案四,就会有三个问题:

  1. 建表前需要确认好每个表的ID范围,建表时设置好起始自增序列号
  2. 在插入ID时维护好当前要插入的数据对应的表下标,根据上面的例子,当 t_file 里的数据最大ID为99时,后面的数据不能再插入到该表中,而是要插入到 t_file_1 中,这意味着我们需要维护一个当前数据对应的表下标,即“我需要知道现在的数据需要插入到哪个表”
  3. 使用自己的策略就意味着不能使用sharding-jdbc的ID生成策略了

第一个问题只需运维或者后端开发建表前注意一下即可,而第二个问题则需要在代码中解决,而第三个问题,只需要我们把表下标传进mapper,交给mybatis帮我们拼装到SQL里面即可。

所以现在主要是要解决第二个问题。
愁

表下标维护

那么要怎么维护这个表下标呢?我当时是思考了一个下午,一步步优化,得到一个自认为不错的方案(太佩服我自己了吧),而且实现也不复杂。这个方案就是每个表预留一部分ID,然后每个实例各自维护一个表下标,不存储在redis中。

下面来看看整个优化的过程。
我真是个天才

插入前查询maxId

最直接的写法就是每次批量插入数据前,先查询表的最大ID,再加上当前的数据量,预测插入数据后的ID是否还在范围内,若超过了该范围,就把下标+1,更新到redis中,然后把数据插入到下一个表中。
插入前查询maxId

单线程下这种做法当然没有问题,但是多线程问题就大了,何况这个业务并发量还那么高。

假设 t_file_0 的ID范围是0 ~ 9999,现在该表最大的ID是9995,此时2个线程同时插入数据,这2个线程都插入4行数据……2个线程获取到的tableIndex都是0,并且查了一下maxId加上自己的数据量,最后得到9999,在范围内,然后同时插入数据……那么 t_file_0 这个表就会出现ID超过了9999的情况,而 t_file_1 的ID范围是 10000~19999,ID重复了!

所以很明显,这个方案不靠谱。

插入后查询maxId

既然插入后的ID可能会超出范围,那我们能不能在插入后再检查一下maxId呢?如果maxId超出范围,就回滚事务,再更新tableIndex,把数据插入到下一张表中。
插入后查询maxId
这种做法比较靠谱,插入后再检查ID,再决定是否提交事务,就不会出现最大ID超过该表范围这种情况了。但是却要手动控制事务。

预留ID

那能不能再优化一下呢?我不想控制事务回滚然后再提交一次……

所以我想到了预留最后一部分ID的做法,我可以让每张表都预留一部分ID,这部分ID可以插入一部分数据,但是插入之后,以后的数据就插入到下一张表。只要我们预留的ID范围足够大,那在高并发场景下就不会出现ID超范围的情况。

比如 t_file_0 的预留ID范围是 9000~9999,当插入一批数据后得到的最大ID是9100,达到了预留ID范围,那就更新表下标,以后的数据插入到 t_file_1 中。即使多个线程同时插入一大批数据,只要我们预留的范围足够大,就不会出现最大ID超过这张表范围的情况。这样就不用手动控制事务了。
而我们需要查询的时候,ID为 0 ~ 9999(包括预留的那部分ID,9000 ~ 9999) 还是路由到 t_file_0 进行查询,所以插入和查询都是不会有问题的。

预留ID
但是这样又依赖与中间件了,这样的话,redis一出问题,那可能就会影响到当前业务的新增操作了。

预留ID + 不依赖redis

上面的方案,都是在redis维护了一个表下标。这样的话,redis一出问题,那可能就会影响到当前业务的新增操作了,但是实际上表下标是不需要在redis中再维护一份的,我只需要在每个实例中维护自己的一个下标就行了!

这样的话,会有这个问题:当其中一个实例插入数据后,发现自己的下标要+1了,其它的实例无法感知到。

但是这个问题并不会使ID重复,因为只要我预留的ID足够大,保证其它实例再插入数据的时候,不会超过当前表的最大ID,就不会出现问题!并且我们插入数据是分批插入的,每批最多100个数据。比如要插入1000个数据,我会分成10批数据,每批数据插入完成后都会检查一下maxId并更新表。所以理论上,只要满足这个条件,就绝对不会有重复ID的问题发生(当然我是测过的,你完全可以相信七里翔):

预留ID数 > 实例数 * 每个实例的最大线程数 * 100

预留ID + 不依赖redis

多数据源、sharding-jdbc、主从怎么结合到一块?

使用sharding-jdbc的shardingsphere,我又遇到了以下两个问题:

  1. 在项目中使用了我们自己写的一个多数据源的组件,与shardingsphere数据源冲突
  2. 我们的分表+主从数据库架构不适合用shardingsphere

针对这两个问题,我决定优化多数据源组件,整合shardingsphere。

怎么解决多数据源和shardingsphere数据源冲突的问题?

我们的项目中要到了一个自己开发多数据源组件,把这个多数据源组件的DataSource注到mybatis中,可以通过注解动态切换数据源。但是现在用shardingsphere,会跟这个组件起冲突。

看了一天源码后,我最后决定把shardingsphere集成到我们的多数据源组件中。我先在shardingsphere基础上写个自动配置类,封装多个shardingsphere的datasource,然后交给多数据源去管理。也就是,数据源组件只需要负责帮我切换数据源到shardingsphere,剩下的分片、路由相关的操作还是交给shardingsphere本身去完成。完美解决二者冲突的问题!

怎么解决分表+主从数据库不适合用shardingsphere的问题?

我们的数据库是主从,现在使用shardingsphere来管理 t_file 表的路由,想要切换到从库数据源,只有两个办法:

  1. 使用Hint分片策略,强制切换数据源。这种办法不靠谱,每次使用前都需要路由到指定的具体库和表,将产生大量重复的业务代码
  2. 配置shardingsphere的读写分离。这种方法也不靠谱,我们不一定所有的读都走从库,再加上我们有个别sql查询是不走shardingsphere的,这意味着这部分查询语句没法使用shardingsphere的读写分离。

这两种方法都没法满足我们的业务需求,最终我决定再优化多数据源组件,使用多数据源管理多个shardingsphere DataSource。
通过配置多个shardingsphere数据源,把主数据库和从数据库配置到不同的shardingsphere数据源中,再注入到多数据源组件中,通过注解切换到不同的shardingsphere数据源,即可实现主从库数据源的切换,同时还能使用shardingsphere的功能,主从数据源共用同一套表路由算法,并且方便以后其它表使用shardingsphere来进行表路由。
dynamic-datasource和shardingsphere结合

影响

部分SQL性能问题

虽然这个表涉及的SQL不多,并且不复杂,但是还是有个别SQL可能会出现问题。
比如刚才说到的,通过hash查询某一行数据。有2个SQL,分别是这样:需要通过hash匹配查询第一行数据;需要通过hash匹配查询最后一行数据。
这2个SQL肯定不能走shardingsphere来查询的了,因为我的分片键只有id,这种查询条件不是分片键的SQL,会在所有的表中执行一次,最后在汇合处理,这样的效率肯定是非常低的。
还好这2个SQL也不复杂,我最后自己优化了一下。不通过shardingsphere去做路由,而是我自己传入表下标。比如需要通过hash匹配查询第一行数据,我传下标0进去执行SQL,数据为空,下标+1再查下一个表。直到查询到一行数据或者下标超出了当前插入数据的表下标(tableIndex)为止。

上线前准备

数据迁移

上线前需要运维协助建表并迁移数据,分表后每张表数据量为20亿,预留10万个ID。
数据迁移

服务切换

服务更新与服务回滚是比较重要的环节,这个得要提前规划好。考虑好怎么样才能将服务切换时的影响降到最低。我刚开始的方案是,预留一部分主键ID,具体方案如下。

预留一部分主键ID

采取预留一部分主键ID的方案让新旧服务能同时运行而不会产生主键冲突。

假如现在线上有250亿数据,按照每张表20亿数据分表,则可以分为13张表,下标为 0 ~ 12 ,t_file_12 的主键范围是 240亿~260亿-1,全量同步后开启增量同步,把后续新增的数据也同步过去。

假设增量的数据有1亿,那么增量同步差不多完成后,t_file_12 中的最大主键大概是251亿,还有9亿的ID可用。

这个时候新服务上线,新服务新增的数据插入到 t_file_13 中,而 t_file_13 的起始自增序列号为260亿,所以新旧服务一起运行时,一定时间内并不会出现主键冲突的情况。因此新服务上线后可以开启双向同步,观察新服务上线后的情况,确认完全没有问题后再关闭旧服务、双向同步。

整个过程的步骤为:

  1. 在新库中新建课件文件表
  2. 全量同步
  3. 增量同步追加数据
  4. 开启双向同步
  5. 上线新服务
  6. 新服务无异常,关掉旧服务和双向同步

预留一部分主键ID

当我说完这个方案后,我自信满满,此时我的表情是这样的👇。
自信满满
但是,DBA大佬的表情先是这样的👇。
?
然后,变成了这样👇。
!
我内心慌了起来。

DBA大佬说:小伙子,这个上线方案不行。假如一个表原本的当前的自增序列号是10,而你插入了一行数据,这行数据里面包含了ID(即不是使用自增ID)的话,是会更新自增序列号的,比如你插入了一个ID为15的数据,那这个时候表的自增序列号就会变成16,而不是原来的10了。

我……
是我太菜

最后的方案

还是DBA大佬经验丰富,和他讨论过后,我豁然开朗。最终的上线步骤是这样的。

  1. 运维开启全量同步,把旧库数据同步到新库中
  2. 上线新服务(版本1),双写,先旧后新,数据全部从旧库读取。新库中的ID需和旧库中保持一致
  3. 下线旧服务,新旧服务同时运行的过程中旧服务产生的增量数据由运维处理,补到新库中
  4. 上线新服务(版本2),双写,先旧后新,数据全部从新库中读取
  5. 上线新服务(版本3),双写,先新后旧,数据全部从新库中读取。旧库的ID需和新库保持一致
  6. 新服务在线上运行一段时间没出现问题后,再更新代码上线新服务(版本4),去除双写机制,只需在新库中读写数据,旧库废弃

其它

存储过程

新建表的时候的存储过程如下:

create procedure create_tables()
begin
set @str = "(
  `c_id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `c_create_time` datetime NOT NULL,
  `c_modify_time` datetime NOT NULL,
  PRIMARY KEY (`c_id`),
  KEY `idx_c_hash` (`c_hash`) USING BTREE,
  KEY `idx_name` (`c_name`)
) ENGINE=InnoDB AUTO_INCREMENT=";
set @j = 0;
while @j < 100 do
set @auto_increment = @j * 2000000000;
set @table = concat('t_file_',@j);
set @end = " DEFAULT CHARSET=utf8";
set @sql_t = concat("CREATE TABLE ",@table, @str, @auto_increment, @end);
prepare sql_t from @sql_t;
execute sql_t;
set @j = @j + 1;
end while;
end;
call create_tables();
drop procedure create_tables;

多数据源组件

我感觉这个多数据源组件有点意思。所以我在国庆这两天自己也写了个多数据源组件,并且集成了shardingsphere。感兴趣的可以点我头像,里面有我github主页链接,里面一个名为 dynamic-datasource-spring-boot-starter 的仓库就是这个项目了。

后续思考

假如要分库

现在是只做分表的情况,我可以把表下标传进去给mybatis拼到SQL里面。但是如果做了分库后要怎么办呢?

这个我也考虑到了,假如要做分库的话,那数据库的路由就需要交给sharingsphere去完成了,我能想到的是:用shardingsphere的hint强制路由策略,然后自己实现自定义注解,并且实现相应的路由策略,按理说是可以满足分库的需求的。

不过嘛,没实践过怎么会知道有没有其它问题呢?等有空了我再实现试试。
点赞啊


点击全文阅读


本文链接:http://zhangshiyu.com/post/35494.html

数据  插入  下标  
<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

关于我们 | 我要投稿 | 免责申明

Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1