最近被问到一个问题,InnoDB 表,只修改一个字段的名字,定义不修改,是否有快速方案。
这个需求的意义来源于,在表设计初期可以预留一些字段,但在预留字段投入使用时,最好能够赋予一个有意义的名字以方便使用。
复现
以下实验基于 5.1.48 版本。
创建一个简单表
| CREATE TABLE t
(c1
int(11) DEFAULT NULL,c2
int(11) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=gbk; |
---|
插入 10w 条数据。将字段 c2 改名为 c3.
| mysql> alter table t change c2 c3 int(11) default null;
Query OK, 100000 rows affected (4.29 sec)
Records: 100000 Duplicates: 0 Warnings: 0 |
---|
可以看到,虽然只是简单修改了字段名,在实验机器上耗时达到 4.2s,显然重做了所有数据。由于这个表没有索引,数据量也比较小,如果对于更大数据的表,则需要更长的操作时间。
分析
我们知道,在
Innodb_file_per_table 参数下,每个 InnoDB 表有两个文件 t.frm 和 t.ibd. 实际上,表字段信息只保存于 t.frm。这个文件保存了表的定义信息,只有 8k。 仅修改字段名,实际上不需要重作数据,如果能够只对 t.frm 做修改,则可以加快上面这个 alter 语句的执行速度。
源码相关
可以想象 MySQL 框架中应该是调用了 InnoDB 引擎的某个函数,用于判断是否需要重做数据。
我们追踪一下 alter table 语句的执行流程,在 mysql_alter_table(sql_table.cc)函数中,我们看到这个局部变量 need_copy_table,它有三个可能的取值。
ALTER_TABLE_METADATA_ONLY= 0,
ALTER_TABLE_DATA_CHANGED= 1,
ALTER_TABLE_INDEX_CHANGED= 2
显然这个取值的判断结果,决定了后面的执行流程。
mysql_alter_table 中调用了 compare_tables 用于判断 alter 前后的表做了多大的改动,后者在这个语句中修改了 need_copy_table 的值。
| /_ Check if changes are compatible with current handler without a copy _/
if (table->file->check_if_incompatible_data(create_info, changes))
{
*need_copy_table= ALTER_TABLE_DATA_CHANGED;
DBUG_RETURN(0);
} |
---|
这个 check_if_incompatitble_table 的函数实现在 handler/ha_innodb.cc 中。这个函数的返回值可能是 COMPATIBLE_DATA_NO 表示表改动前后不兼容(需要重做数据)或 COMPATIBLE_DATA_YES 兼容(不需要重做)。
该函数有如下片段
| if (check_column_being_renamed(table, NULL)) {
return COMPATIBLE_DATA_NO;
} |
---|
其实现逻辑是,如果有任何一个字段名被修改,则返回 COMPATIBLE_DATA_NO。
简单修改
有了上述分析,要做到快速修改表字段名,只需要把调用 check_column_being_renamed 的这三行注释掉即可。重新编译发布后,执行结果如下。
| mysql> alter table t change c2 c3 int(11) default null;
Query OK, 0 rows affected (0.01 sec)
Records: 0 Duplicates: 0 Warnings: 0 |
---|
可以看到,这回执行基本不需要时间. 对比修改前后的 t.ibd 的 MD5,没有修改,而 t.frm 中只是将 c2 的字段名改为 c3,其他不变。
问题!!
这里的问题是,这个修改,是否会有副作用?虽然我们知道修改字段名应该是对数据时没有影响的,但 MySQL 就是这么实现了。
更深入的调查带来了“坏消息“。 在 MySQL 5.1.45 版本中,就没有这个字段名的判断,也就是说在 5.1.45 中仅修改字段名是只修改 frm 文件的。
在新版本中特别加入的判断,是否有什么原因?这是撰写本文的意图。若有与此相关的 bug 或者文章说明,请回复或站内私信我。
延伸
实际上,关于这个问题,还可以继续深入,这里抛砖引玉。
- 如果上述修改有副作用,副作用是什么,是否可以通过简单修改 ibd 文件,仍达到快速修改的目的?