百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

MySQL技术内幕2:从架构五视图角度来看MySQL结构

moboyou 2025-07-21 17:22 22 浏览

0.简介

本文通过对MySQL的逻辑架构、开发架构、运行架构、物理架构以及数据架构的分析来建立一个对应MySQL架构整体的认识。

1.逻辑架构

逻辑架构考虑功能需求,主要从行为和职责来划分。MySQL的逻辑架构采用经典的三层模型:

1.连接层:处理客户端连接,负责认证和权限验证。

2.SQL处理层:包括查询解析、优化、执行等核心功能。

3.存储引擎层:负责数据存储和检索,支持插件式架构。

这种分层设计实现了关注点分离,使得各层可以独立优化和扩展。例如,可以更换存储引擎而不影响SQL处理层的功能(这得益于其底层的插件式管理,依赖于高度的抽象)。从上图看其结构较为简单,但其每层其实存在很多的小模块,更为具体些的可以见下图:

2.开发架构

此处关注软件模块的组织形式和开发的质量属性,此处主要关注主要的模块和代码文件的组织形式,作为后续源码分析的基础。

目录

说明

include

公共头文件,包含像客户端头文件,sql层头文件和psi相关头文件等。

sql

MySQL的核心目录,包含SQL的解析,优化,执行等。

storage

存储引擎的实现代码,像innoDB,MyISAM源码等。

plugin

插件系统的实现源码,像认证插件,审计日志插件等。

client

客户端工具,像mysql命令行工具,mysqladmin等。

components

MySQL组件目录,其比插件具有更好的灵活性,其内置插件包含像日志,密码校验等。

extra

存放依赖库,如curl,protobuf等

libbinlogevents

用于解析Binlog的lib服务

libbinlogstandalone

提供一个独立于 MySQL 服务器的二进制日志解析工具,使得开发者可以在不依赖 MySQL 服务器的情况下解析和处理 Binlog 文件。

libchangestreams

用于处理变更数据捕获(CDC,Change Data Capture)。它允许你捕获数据库中的变更(如插入、更新、删除操作),并将这些变更以流的形式输出,供其他系统使用。

libmysql

MySQL客户端库,用于和MySQL交互。

sql-common

SQL层的公共工具函数。

mysys

包含系统相关的工具函数,像文件操作、内存分配等。

scripts

包含MySQL初始化,安装和测试脚本。

tests

包含MySQL测试代码和测试用例。

unittest

包含MySQL单元测试用例。

router

包含 MySQL Router 的源码,用于实现数据库的路由和负载均衡。

vio

包含虚拟 I/O 系统的实现,用于抽象网络和文件 I/O 操作。

strings

包含字符串处理函数的实现。

可以从目录拆分看到MySQL的模块化和插件化设计,以及通过多种测试手段保证可测试性进而保证质量。

3.运行架构

运行架构主要关注运行期的属性(性能,可伸缩性,持续可用性,安全性等),MySQL和PG不同,采用的是多线程模型而非多进程模型,所以此处主要关注程序的线程模型(以InnoDB为例),分析各部分的作用。

可以看到,主要线程分为五类:

1)主线程(Main Thread): 负责 MySQL 服务器的初始化和关闭。负责调度其他各线程,用于定时刷脏页(新版本使用Page Cleaner ),回收undo log,。

2)连接线程(Connection Threads):处理客户端连接和请求,每个客户端连接对应一个独立的线程。

3)后台线程(Background Threads):执行后台任务,如刷新脏页、写入日志等。包括 InnoDB 的 I/O 线程、Purge 线程等。

InnoDB I/O 线程:包括读写线程,分别用于从磁盘读取数据页和脏页写入磁盘。

Purge 线程:当事务提交后就不再需要一些undo页,该线程就是用于回收这些不需要的页面。

Page Cleaner 线程:用于刷脏页调度。

4)复制线程(Replication Threads):负责主从复制的数据同步。

内存中主要对象则包括缓冲池,其内有数据页(undo page),索引页(index page),插入缓冲(insert buffer page),自适应哈希索引(adaptive hash index),数据字典(data dictionary);另外还有重做日志缓存(redo log buffer),额外内存池(innodb addational mem pool)。

4.物理架构

物理架构关注如何安装部署,和分析原理关系不大,不再描述。

5.数据架构

数据架构主要考虑数据需求,关注持久化数据的存储方案,存储格式(还是以innodb引擎库表存储为例)。此处主要关注逻辑存储和物理存储,了解储存部分的层级关系,详细的存储方式,目录结构会在存储章节介绍。

和其他数据库逻辑结构层级一致,如下:

其表文件物理实际存储结构如下(当然其磁盘上还有日志文件,其对应结构后面文章会详细描述):

(1) 表空间(Tablespace)

表空间是存储表和索引数据的物理文件。

InnoDB 存储引擎使用表空间来管理数据。

表空间可以分为:

系统表空间: 存储系统元数据和共享表数据。

独立表空间: 每个表有独立的表空间文件(.ibd 文件),MySQL 8默认开启。

(2) 数据文件

MySQL 的数据文件包括:

.frm 文件: 存储表结构定义(MySQL 8.0 后不再使用)。

.ibd 文件: InnoDB 表的独立表空间文件。

.MYD.MYI 文件: MyISAM 表的数据文件和索引文件。

(3) 日志文件

MySQL 使用多种日志文件来确保数据的一致性和持久性:

Redo Log(重做日志): 记录事务的修改操作,用于崩溃恢复。

Undo Log(回滚日志): 记录事务的旧值,用于回滚和 MVCC。

Binlog(二进制日志): 记录所有数据更改操作,用于复制和恢复。

Error Log(错误日志): 记录 MySQL 服务器的错误信息。

(5) 数据字典

MySQL 8.0 引入了数据字典,用于存储数据库对象的元数据。

数据字典存储在 InnoDB 表中,取代了之前的 .frm 文件。



相关推荐

Excel技巧:SHEETSNA函数一键提取所有工作表名称批量生产目录

首先介绍一下此函数:SHEETSNAME函数用于获取工作表的名称,有三个可选参数。语法:=SHEETSNAME([参照区域],[结果方向],[工作表范围])(参照区域,可选。给出参照,只返回参照单元格...

Excel HOUR函数:“小时”提取器_excel+hour函数提取器怎么用

一、函数概述HOUR函数是Excel中用于提取时间值小时部分的日期时间函数,返回0(12:00AM)到23(11:00PM)之间的整数。该函数在时间数据分析、考勤统计、日程安排等场景中应用广泛。语...

Filter+Search信息管理不再难|多条件|模糊查找|Excel函数应用

原创版权所有介绍一个信息管理系统,要求可以实现:多条件、模糊查找,手动输入的内容能去空格。先看效果,如下图动画演示这样的一个效果要怎样实现呢?本文所用函数有Filter和Search。先用filter...

FILTER函数介绍及经典用法12:FILTER+切片器的应用

EXCEL函数技巧:FILTER经典用法12。FILTER+切片器制作筛选按钮。FILTER的函数的经典用法12是用FILTER的函数和切片器制作一个筛选按钮。像左边的原始数据,右边想要制作一...

office办公应用网站推荐_office办公软件大全

以下是针对Office办公应用(Word/Excel/PPT等)的免费学习网站推荐,涵盖官方教程、综合平台及垂直领域资源,适合不同学习需求:一、官方权威资源1.微软Office官方培训...

WPS/Excel职场办公最常用的60个函数大全(含卡片),效率翻倍!

办公最常用的60个函数大全:从入门到精通,效率翻倍!在职场中,WPS/Excel几乎是每个人都离不开的工具,而函数则是其灵魂。掌握常用的函数,不仅能大幅提升工作效率,还能让你在数据处理、报表分析、自动...

收藏|查找神器Xlookup全集|一篇就够|Excel函数|图解教程

原创版权所有全程图解,方便阅读,内容比较多,请先收藏!Xlookup是Vlookup的升级函数,解决了Vlookup的所有缺点,可以完全取代Vlookup,学完本文后你将可以应对所有的查找难题,内容...

批量查询快递总耗时?用Excel这个公式,自动计算揽收到签收天数

批量查询快递总耗时?用Excel这个公式,自动计算揽收到签收天数在电商运营、物流对账等工作中,经常需要统计快递“揽收到签收”的耗时——比如判断某快递公司是否符合“3天内送达”的服务承...

Excel函数公式教程(490个实例详解)

Excel函数公式教程(490个实例详解)管理层的财务人员为什么那么厉害?就是因为他们精通excel技能!财务人员在日常工作中,经常会用到Excel财务函数公式,比如财务报表分析、工资核算、库存管理等...

Excel(WPS表格)Tocol函数应用技巧案例解读,建议收藏备用!

工作中,经常需要从多个单元格区域中提取唯一值,如体育赛事报名信息中提取唯一的参赛者信息等,此时如果复制粘贴然后去重,效率就会很低。如果能合理利用Tocol函数,将会极大地提高工作效率。一、功能及语法结...

Excel中的SCAN函数公式,把计算过程理清,你就会了

Excel新版本里面,除了出现非常好用的xlookup,Filter公式之外,还更新一批自定义函数,可以像写代码一样写公式其中SCAN函数公式,也非常强大,它是一个循环函数,今天来了解这个函数公式的计...

Excel(WPS表格)中多列去重就用Tocol+Unique组合函数,简单高效

在数据的分析和处理中,“去重”一直是绕不开的话题,如果单列去重,可以使用Unique函数完成,如果多列去重,如下图:从数据信息中可以看到,每位参赛者参加了多项运动,如果想知道去重后的参赛者有多少人,该...

Excel(WPS表格)函数Groupby,聚合统计,快速提高效率!

在前期的内容中,我们讲了很多的统计函数,如Sum系列、Average系列、Count系列、Rank系列等等……但如果用一个函数实现类似数据透视表的功能,就必须用Groupby函数,按指定字段进行聚合汇...

Excel新版本,IFS函数公式,太强大了!

我们举一个工作实例,现在需要计算业务员的奖励数据,右边是公司的奖励标准:在新版本的函数公式出来之前,我们需要使用IF函数公式来解决1、IF函数公式IF函数公式由三个参数组成,IF(判断条件,对的时候返...

Excel不用函数公式数据透视表,1秒完成多列项目汇总统计

如何将这里的多组数据进行汇总统计?每组数据当中一列是不同菜品,另一列就是该菜品的销售数量。如何进行汇总统计得到所有的菜品销售数量的求和、技术、平均、最大、最小值等数据?不用函数公式和数据透视表,一秒就...