MySQL是怎样运行的:(8)MySQL的数据目录
Session 8 MySQL的数据目录
像InnoDB
、MyISAM
这样的存储引擎都是把表存储在磁盘上的,而操作系统用来管理磁盘的那个东东又被称为文件系统
,所以用专业一点的话来表述就是:像 InnoDB 、 MyISAM 这样的存储引擎都是把表存储在文件系统上的。当我们想读取数据的时候,这些存储引擎会从文件系统中把数据读出来返回给我们,当我们想写入数据的时候,这些存储引擎会把这些数据又写回文件系统。
安装目录
包含控制客户端程序和服务器程序的命令(bin目录下),而数据目录
是用来存储MySQL
在运行过程中产生的数据,一定要区分开。
1 | mysql> SHOW VARIABLES LIKE 'datadir'; |
每个数据库都对应数据目录下的一个子目录。每当我们新建一个数据库时,MySQL
会帮我们做这两件事儿:
- 在
数据目录
下创建一个和数据库名同名的子目录(或者说是文件夹)。 - 在该与数据库名同名的子目录下创建一个名为
db.opt
的文件,这个文件中包含了该数据库的各种属性,比方说该数据库的字符集和比较规则是什么。
我们的数据其实都是以记录的形式插入到表中的,每个表的信息其实可以分为两种:
- 表结构的定义
- 表中的数据
InnoDB
和MyISAM
这两种存储引擎都在数据目录
下对应的数据库子目录下创建了一个专门用于描述表结构的文件,文件名是这样:
1 | 表名.frm |
表空间
为了更好地管理页,设计InnoDB
的大佬们提出了一个表空间
或者文件空间
(英文名:table space
或者file space
)的概念。注意,InnoDB
中索引即数据,数据即索引。
表空间是一个抽象的概念,它可以对应文件系统上一个或多个真实文件(不同表空间对应的文件数量可能不同)。每一个表空间
可以被划分为很多很多很多个页
,我们的表数据就存放在某个表空间
下的某些页里。表空间分为几种类型:
系统表空间
这个所谓的系统表空间
可以对应文件系统上一个或多个实际的文件,默认情况下,InnoDB
会在数据目录
下创建一个名为ibdata1
的文件。这个文件就是对应的系统表空间
在文件系统上的表示,大小12M。这个文件是所谓的自扩展文件
,也就是当不够用的时候它会自己增加文件大小。
在一个MySQL服务器中,系统表空间只有一份。从MySQL5.5.7到MySQL5.6.6之间的各个版本中,我们表中的数据都会被默认存储到这个 系统表空间
。
独立表空间
在MySQL5.6.6以及之后的版本中,InnoDB
并不会默认的把各个表的数据存储到系统表空间中,而是为每一个表建立一个独立表空间,也就是说我们创建了多少个表,就有多少个独立表空间。使用独立表空间
来存储表数据的话,会在该表所属数据库对应的子目录下创建一个表示该独立表空间
的文件,文件名和表名相同,只不过添加了一个.ibd
的扩展名而已,所以完整的文件名称长这样:
1 | 表名.ibd |
我们也可以自己指定使用系统表空间
还是独立表空间
来存储数据,这个功能由启动参数innodb_file_per_table
控制,比如说我们想刻意将表数据都存储到系统表空间
时,可以在启动MySQL
服务器的时候这样配置:
1 | [server] |
innodb_file_per_table
参数只对新建的表起作用,对于已经分配了表空间的表并不起作用。可以使用下面的语法:
1 | ALTER TABLE 表名 TABLESPACE [=] innodb_file_per_table; #已经存在系统表空间中的表转移到独立表空间 |
MyISAM是如何存储表数据的
在MyISAM
中的索引全部都是二级索引
,该存储引擎的数据和索引是分开存放的。所以在文件系统中也是使用不同的文件来存储数据文件和索引文件。而且和InnoDB
不同的是,MyISAM
并没有什么所谓的表空间
一说,表数据都存放到对应的数据库子目录下。假如test
表使用MyISAM
存储引擎的话,那么在它所在数据库对应的xiaohaizi
目录下会为test
表创建这三个文件:
1 | test.frm |
其中test.MYD
代表表的数据文件,也就是我们插入的用户记录;test.MYI
代表表的索引文件,我们为该表创建的索引都会放到这个文件中。
视图
我们知道MySQL
中的视图其实是虚拟的表,也就是某个查询语句的一个别名而已,所以在存储视图
的时候是不需要存储真实的数据的,只需要把它的结构存储起来就行了。和表
一样,描述视图结构的文件也会被存储到所属数据库对应的子目录下面,只会存储一个视图名.frm
的文件。
MySQL系统数据库
我们前面提到了MySQL的几个系统数据库,这几个数据库包含了MySQL服务器运行过程中所需的一些信息以及一些运行状态信息,我们现在稍微了解一下。
mysql
这个数据库贼核心,它存储了MySQL的用户账户和权限信息,一些存储过程、事件的定义信息,一些运行过程中产生的日志信息,一些帮助信息以及时区信息等。
information_schema
这个数据库保存着MySQL服务器维护的所有其他数据库的信息,比如有哪些表、哪些视图、哪些触发器、哪些列、哪些索引等等。这些信息并不是真实的用户数据,而是一些描述性信息,有时候也称之为元数据。
performance_schema
这个数据库里主要保存MySQL服务器运行过程中的一些状态信息,算是对MySQL服务器的一个性能监控。包括统计最近执行了哪些语句,在执行过程的每个阶段都花费了多长时间,内存的使用情况等等信息。
sys
这个数据库主要是通过视图的形式把
information_schema
和performance_schema
结合起来,让程序员可以更方便的了解MySQL服务器的一些性能信息。