前言
数据库大批量插入操作常见于导入上传等场景,如果不对其进行一定优化,会出现上传时间过长导致超时等问题,所以这次阿海基于Mybatis和大家分享一下插入数据时常见的几种方案。
方案1:循环逐条插入(不推荐)
初学者第一想到的就是写一个for循环,然后每次插入一条,但该方案会频繁使我们的Mybatis创建statment,接入db执行insert语句,效率较低(实际执行语句如图1),数据量大时也会对咱们db的性能造成一定影响,所以阿海老师是不建议童鞋们使用该种方案的。
图1 方案1效率低,不建议采用
方案2:使用foreach批量插入(数据量不大时可以使用)
既然一条一条插入效率较低,那可以采用批量插入的方式,该方案相对方案1主要有2点改动:
1.首先将我们要插入的数据封装为一个List集合,并对我们Dao层接口作一定改造,使其可以接收一个List集合;
2.其次我们对Mybatis mapper文件中的SQL进行改造,主要使用Mybatis的
这种方案相对于第一种方案,插入性能有了大幅提升,原理就是Mybatis将insert语句
转换为
这样就让多条insert into插入语句变成了一条插入语句,可以带来性能上的提升,但也存在着两个问题:
(1)当插入的数据较多时,相当于拼接的sql语句会特别的长,甚至超过sql语句的长度,一旦超出,就会抛出异常导致无法插入;
(2)当插入的数据较多时,也比较耗时。
方案3.使用foreach配合分片批量插入(数据量较大时推荐使用)
既然不能封装成一条SQL,那我们考虑有没有其他的方式,当然有,可以采用分片的方式。
主要原理就是将list集合按"指定长度"进行切分,返回新的List<List
这里分片的目的有两个:
1、批量插入,拼接的SQL语句过长,sql语句会有限制;
2、分片后采用stream多线程并行插入可以提高效率。
此外,不管是mysql还是oracle数据库,都可以使用分片进行插入。
总结
总的来说,当实际业务场景数据量不是很大时,大家使用方案2就可以了,但插入数据量较大时,阿海还是推荐大家使用方案3,可以大大提升插入效率。 在面试时,同学们可以着重讲讲方案3,相信面试官会对你刮目相看。