百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

互联网微服务:使用Flyway版本化管理数据库脚本

moboyou 2025-03-27 11:33 37 浏览

本文将着重介绍当前互联网公司基于Springboot开发的微服务使用Flyway管理脚本。

1. 目的

为解决研发流程中项目脚本管理,实现CI/CD自动化部署升级脚本,特引入数据库版本管理工具Flyway,使我们的数据库能够做到增量升级。

2. Flyway

2.1. 说明

Flyway是一个简单开源数据库版本控制器(约定大于配置),主要提供migrate、clean、info、validate、baseline、repair等命令。它支持SQL(PL/SQL、T-SQL)方式和Java方式,支持命令行客户端等,还提供一系列的插件支持(Maven、Gradle、SBT、ANT等)。

2.2. 版本

采用最新版本:5.2.4。

2.3. 特性

l 普通SQL:纯SQL脚本(包括占位符替换)没有专有的XML格式,没有锁定;

l 无限制:使用Java 代码来进行一些高级数据操作;

l 零依赖:只需运行在Java6(及以上)和数据库所需的JDBC驱动;

l 约定优于配置:迁移时,自动查找系统文件和类路径中的SQL文件或Java类;

l 高可靠性:在集群环境下进行数据库升级是安全可靠的;

l 云支持:完全支持 Microsoft SQL Azure, Google Cloud SQL& App Engine、Heroku Postgres 和 Amazon RDS;

l 自动迁移:使用Fly提供的API,让应用启动和迁移同时工作;

l 快速失败:损坏的数据库或失败的迁移可以防止应用程序启动;

l 数据库清理:在一个数据库中删除所有的表、视图、触发器,而不是删除数据库本身。

2.4. 支持的数据库

数据库

版本

说明

Oracle

10g及以上


SQL Server

2008及以上


MySQL

5.1及以上


PostgreSQL

9.0及以上


SQLite

3.7.2及以上


还有其余的10几种数据库,这里不再详述。

2.5. 工作原理

最简单的场景是当你用Flyway迁移到一个空数据库时。



Flyway将会试图查找数据库中的元数据表(metadata table)。由于数据库是空的,Flyway 将不会查找,而是创建一个新元数据表。

现在数据库中将有一张名为SCHEMA_VERSION的表:

此表将用于跟踪数据库的状态。

之后,使用Flyway进行迁移时将扫描系统文件或者应用的类路径中特定的文件,它们可以由SQL或Java编写。

然后Flyway将基于他们的版本号进行排序并依次执行:

随着每次执行,对应地更新元数据表schema_version:

元数据表的创建和初始化,我们现在可以讨论迁移到一个新的版本。

Flyway进行迁移时会重新扫描系统文件或者应用的类路径中特定的文件,并且与元数据表进行校验,如果它们的版本号低于或等于当前标记的版本,它们将被忽略。

而高于标记的文件将等待迁移:状态为可用(available),但是未执行。、

Flyway会将它们按照版本号进行排序并依次执行。

元数据表相应的更新:

3. 使用方式

3.1. Springboot集成

3.1.1. 配置

Maven依赖和插件

org.flywaydb

flyway-core

5.2.4

 

      org.flywaydb

      flyway-maven-plugin

      5.2.4

   

application.yml配置

最新版本的springboot是把flyway集成进去了。Flyway的配置可以在spring中找到;低版本的,可直接以flyway开头设置配置参数。大家视各自项目情况而定。

spring:

  datasource:

    driver-class-name: org.postgresql.Driver

    url: jdbc:postgresql://localhost:5432/sgs_test

    username: postgres

    password: pass@123



  flyway:

    ## 是否启用flyway,提交到develop和master分支时,需要设置为false

    enabled: true

    ## 编码格式,默认UTF-8

    encoding: UTF-8

    ## 迁移sql脚本文件存放路径,默认db/migration

    locations: classpath:db/migration

    ## 迁移sql脚本文件名称的前缀,默认V

    sql-migration-prefix: V

    ## 迁移sql脚本文件名称的分隔符,默认2个下划线__

    sql-migration-separator: __

    ## 迁移sql脚本文件名称的后缀

    sql-migration-suffixes: .sql

    ## 迁移时是否进行校验,默认true

    validate-on-migrate: true

    #设定需要flywary迁移的schema,大小写敏感,默认为连接默认的schema

    schemas: public

    #元数据表,记录脚本升级信息

    table: schema_version

    #设置为true,当迁移发现数据库非空且存在没有元数据的表时,自动执行基准迁移,SCHEMA_VERSION(默认表名,

    #自定义表名可参考参数table的值)

    baseline-on-migrate: true

    #是否允许无序的迁移,默认false,对于开发环境, 可能是多人协作开发,

    #很可能先apply了自己本地的最新SQL代码,然后发现其他同事早先时候提交的SQL代码还没有apply,

    #所以开发环境应该设置true,这样flyway将能加载漏掉的老版本SQL文件,生产环境可以设置为false

    out-of-order: true

    #执行基线时用来标记已有Schema的版本,默认值为1

    baseline-version: 1.0.0

    baseline-description: "初始化"


3.1.2. 脚本

存放位置可根据实际情况设置,一般默认在Springboot项目的resources目录下创建,匹配application.yml中参数locations,脚本命名规范也如下图所示(详细见章节3.1.2)。

3.1.3. 案例说明

相关配置见章节3.1。这里我演示下本地的迁移示例:

上图中,项目组可以根据实际情况对脚本归类。虽然创建了一个文件夹,对某一类脚本进行归类,但flyway仍然会全目录(db/migration)扫描,按照文件名顺序执行。

3.1.4. 规范

脚本命名:在增加前缀V的前提下,后面紧跟版本号,格式如:1.0.0(版本迭代时书写新的版本号,不能小于基线版本),其后再紧跟脚本书写的时间,格式为.yyyyMMddHHmmss。如下图:

编辑规范:如果要给某个表作修改或做其它操作,原脚本已使用Flyway已迁移后;那么,就不要在原来的脚本内容上做修改,请提交新的脚本进行你要的操作;也不要修改脚本文件名中的版本,这样操作的话无法做到脚本的版本管理,同时该脚本也会执行出错。

3.1.5. 注意事项

与Springboot集成这种方式,需要每个环境在打包之前,将application.yml文件中的参数替换成对应的环境值,如:数据库链接、数据库用户名、密码等。

3.2. 命令行

需要下载flyway-commandline命令行工具,按照环境下载不同的安装包。

下载地址:
https://flywaydb.org/documentation/commandline/#download-and-installation。


3.2.1. 配置

编辑/conf/flyway.conf文件:

3.2.2. 执行命令

第一次执行flyway migrate可能会报以下错误。

数据要先指定基线版本,先执行flyway baseline,这时候在对应的数据库里头创建一张版本更新表:schema_version,然后再执行flyway migrate,特别注意执行flyway baseline后脚本最低版本要从2开始。另外注意:由于flyway创建schema_version表时候,多了””,所以查询数据库要加””,例如:select t.* from "schema_version" t;

flyway info输出操作记录信息。

4. CI工具jenkins集成

4.1. 使用maven单独创建项目

使用maven单独创建一个项目来管理脚本(相关配置,参考章节3.1),然后在jenkins pipeline中加入对应环境的脚本执行任务。

4.2. 集成到现有微服务项目中

4.2.1. 使用一个配置文件

需要运维人员在每次从不同环境打包之前,将application.yml文件中的数据库相关配置及flyway要升级的目标数据库的基线版本信息。目前,演示环境和生产环境的打包时,是只打一次包,然后才决定往那个环境部署;而flyway集成到项目中后,它会在编译打包时就会执行脚本到目标数据库中。因此,需要运维人员在jenkins上增加配置命令,将application.yml文件在决定往不同环境编译打包之前替换。

优点:运维在启动微服务时,不需要在启动命令行中设置相关的系统参数变量;

缺点:需要运维针对不同的环境提前准备好相应配置的application.yml。

4.2.2. 使用多个配置文件

Springboot使用profiles可以动态切换不同的配置文件,故开发人员提前在项目中创建5个配置文件,具体如下:

application.yml:此文件主要用来配置动态切换,即设置spring.profiles.active=dev;//开发配置dev,测试test,演示demo,生产prod;

application-dev.yml:开发环境参数配置文件;

application-test.yml:测试环境参数配置文件;

application-demo.yml:演示环境参数配置文件;

application-prod.yml:生产环境参数配置文件。

上面说到,其余的相关参数配置,就可以前往其它4个配置文件,不同环境,只是参数值不一样而已,一次配好,无须在各个环境启动时命令行设置大量的系统参数。

同样,需要运维人员在每次从不同环境打包之前,需要确定部署目标,然后修改application.yml文件中spring.profiles.active值。

优点:运维人员不需要关心不同环境配置文件,只需在启动时,命令设置active参数值即可;

缺点:需要开发需要提前在项目中准备好不同环境的配置文件,并设置好参数值(如需变动,运维根据实际情况而定)。

4.3. 命令行方式

该方式,需要在不同环境下载flyway-commandline命令行工具,且需要将脚本文件单独存放(不在项目中),同时需要在每个环境单独设置数据库链接、用户名和密码等参数,比较繁琐。

4.4. 使用现有的编译打包模式(使用该方式)

该方式与上面几种方式不同,不会更改现有的jenkins流程。

主干的develop和master分支默认设置flyway.enabled=false(开发人员自己的环境可设置为true),运维人员在docker中命令行启动项目时设置命令行参数flyway.enabled=true即可

优点:对当前CI/CD流程不做处理,简化了运维人员的工作;

缺点:需要设置命令行参数(不同版本的springboot,可能参数不一样,大体分为:spring.flyway.enabled和flyawy.enabled)。


5. 升级问题

1) 某微服务的数据库schema下已经存在之前的表结构和数据,该怎么办?

答:我们采用的是flyway的baseline模式,新的脚本版本大于基线即可。因为flyway迁移脚本的原则是根据基线版本号比较db/migration目录下的脚本文件版本号进行升级迁移。

2) 如果当前开发环境的基线是1.2.0,测试环境是1.1.9,而demo环境的又是1.1.8,使用flyway该怎么升级呢?

答:需要手动将测试和demo环境的表结构或数据的版本与开发环境一致后,方可采用flyway升级。

6. 参考资料

官网:https://flywaydb.org/getstarted/how;

命令行:https://flywaydb.org/getstarted/firststeps/commandline;

命令行工具安装包:https://flywaydb.org/documentation/commandline/#download-and-installation;

Jenkins集成:http://blog.chinaunix.net/uid-29335043-id-5751362.html;

相关推荐

Python网络爬虫之分析网页

一、分析并提取网页内容的有三种方式o正则表达式(速度最快,但适应变化略差)oBeautifulsoup库(速度是正则表达式的约几分之一)oselenium或pyppeteer的中的浏览器对象的查找元素...

Python进阶-day9:正则表达式

目标学习Python的re模块基础用法。掌握正则表达式的匹配(match,search,findall)、替换(sub)和分割(split)操作。练习:编写代码从一段文本中提取所有邮箱地址。学习内...

Python模块datetime、calendar、logging、argparse、re用法

datetime模块:提供日期和时间相关的功能。importdatetime#获取当前日期和时间current_time=datetime.datetime.now()#格式化日期...

一文讲清怎么利用Python实现Linux系统日志检索分析管理系统

摘要:在现代IT运营与开发中,日志分析早已成为不可或缺的核心环节。无论是排查系统故障、进行安全审计,还是优化服务性能,日志文件始终是最真实、最权威的信息来源。Linux系统作为主流的服务器操作系统,其...

Python基础编程——标准库之shelve模块

在实际开发中,要将数据进行持久化,通常的做法是,将数据保存到文件或者数据库中。Python有多种方法将数据保存到文件中,本节将会介绍使用Python的标准库shelve来将数据保存到文件中。shelv...

使用 Python 开发一个 Python 解释器

原文地址:https://python.plainenglish.io/introduction-to-creating-interpreter-using-python-c2a9a6820aa0原文...

强烈推荐!Python 这个宝藏库 re 正则匹配

Python的re模块(RegularExpression正则表达式)提供各种正则表达式的匹配操作。在文本解析、复杂字符串分析和信息提取时是一个非常有用的工具,下面总结了re模块的常用方...

python入门到脱坑正则表达式—re.match()函数

re.match()是Python正则表达式模块re中的一个重要方法,用于从字符串的起始位置匹配一个模式。下面我将详细介绍它的用法和特点。基本语法re.match(pattern,stri...

Python中使用re模块实现正则表达式的替换字符串操作

#编程语言#我是"学海无涯自学不惜!",关注我,一同学习简单易懂的Python编程。0基础学python(83)Python中,导入re模块后还可以进行字符串的替换操作,就是sub()...

深入理解re模块:Python中的正则表达式神器解析

在Python中,"re"是一个强大的模块,用于处理正则表达式(regularexpressions)。正则表达式是一种强大的文本模式匹配工具,用于在字符串中查找、替换或提取特定模式...

python入门到脱坑正则表达式—re.search()函数

re.search()是Python正则表达式模块re中的核心函数之一,用于在字符串中搜索匹配指定模式的第一个位置。与re.match()不同,它不限制匹配必须从字符串开头开始。基本语法...

python入门到脱坑正则表达式—re.sub()函数

re.sub()是Python正则表达式模块re中用于字符串替换的核心函数,它可以在字符串中搜索匹配正则表达式的部分,并将其替换为指定的内容。基本语法re.sub(pattern,repl...

python之re模块

re模块一.re模块的介绍1.什么是正则表达式"定义:正则表达式是一种对字符和特殊字符操作的一种逻辑公式,从特定的字符中,用正则表达字符来过滤的逻辑。(也是一种文本模式;)2、正则表达式可以...

Python中re模块详解

在《用最简单的方式教会你使用Python正则》一文中,我们介绍了正则表达式该如何书写,还通过简单的示例介绍了Python中如何通过re模块使用正则功能。今天本文将通过以下内容详细介绍r...

微信积分商城货到付款系统|裂变营销+物流闭环

微信积分商城货到付款系统核心卖点速览零成本运营:免授权+完全开源PHP源码,9MB轻量部署,Mysql数据库高效支撑。灵活支付组合:独创“积分+货到付款+运费”混合支付,用户兑换无忧,商家资金零风险...