本期分享专家:田杰,专注在关系型数据库和NoSQL数据库技术领域,曾先后就职于路透社和渣打银行,目前在阿里云从事数据库技术支持工作,号称“数据库问题的终结者”。
Percona Toolkit 包含多种用于 MySQL 数据库管理的工具。
下面介绍常用的 pt-online-schema-change 和 pt-archiver 搭配 RDS MySQL 的使用方法。
注:
pt-online-schema-change 和 pt-archiver 工具均须指定 --no-version-check 选项方能搭配 RDS MySQL 实例使用。本文样例使用 Percona Toolkit 2.2.17 版本测试。本文样例仅做为样例使用,不承担任何因此示范导致的问题责任。具体操作手册请参考 Percona Toolkit 的相关文档。pt-online-schema-change 提供在线修改表结构等功能,搭配 RDS for MySQL 5.5 使用可以避免在修改表结构的过程中阻塞应用对表数据的访问。
由于 RDS MySQL 5.6 支持 online-ddl 功能,可以直接在业务低峰期进行操作,也可以结合 pt-online-schema-change 使用。
注:
无论 RDS MySQL 5.5 还是 5.6 版本,也无论是否使用 pt-online-schema-change,在修改表结构过程中都有可能遇到等待表元数据锁的情况(waiting for table metadata lock)。如果出现这种情况,请参考 RDS MySQL 表上 Metadata lock 的产生和处理表及数据维护操作请在业务低峰期进行。样例用表:
CREATE TABLE `x` ( `id` int(11) NOT NULL AUTO_INCREMENT, `password` varchar(10) DEFAULT NULL, `recommend_level` double(5,0) DEFAULT NULL, `name` varchar(30) DEFAULT '101' COMMENT 'change', PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=2 DEFAULT CHARSET=utf8mb4;pt-archiver 是 Percona 官方提供的归档工具,用于归档大型表中的记录到另一个表或文件。
样例用表:
CREATE TABLE `my_tab` ( `id` bigint(11) NOT NULL AUTO_INCREMENT, `areaID` varchar(50) DEFAULT NULL, `area` varchar(60) DEFAULT NULL COMMENT '中文注释测试', `father` varchar(12) DEFAULT NULL, PRIMARY KEY (`id`), KEY `idx_area` (`area`) ) ENGINE=InnoDB AUTO_INCREMENT=3162 DEFAULT CHARSET=utf8 ROW_FORMAT=COMPACT KEY_BLOCK_SIZE=8;归档后,源表数据减少 150 行。
归档操作系统文件中,包含 150 行数据。
可以将数据归档到同实例不同库下的表中,也可以将数据归档到不同实例下的表中。
归档操作前,目标表要存在。
目标表中增加了 1008 行数据。
源表中减少了 1008 行数据,剩余 2000 行数据。
目标表中增加了 1500 行数据。
源表中减少了 1500 行数据,剩余 500 行数据。
当需要归档的数据量很大,比如第一次做归档的时候,可以考虑通过尝试 bulk insert 的方式来加速归档过程。
pt-archiver --source h=rds01.mysql.rds.aliyuncs.com,P=3306,u=jacky,p=xxx,D=rd_test,t=large_tab_04 --charset=utf8 --dest h=rds02.mysql.rds.aliyuncs.com,P=3306,u=jacky,p=xxx,D=jacky,t=large_tab_04 --where "1=1" --limit 5000 --commit-each --bulk-insert --no-version-check --statistics # --bulk-insert -- 批量插入数据,会自动启用 --bulk-delete --commit-each,每次插入行数通过--limit 选项指定# --statistics -- 显示 pt-archiver 本次操作的统计信息。
相关资源:python入门教程(PDF版)