MySQL千万级数据表的优化实战记录

更新时间：2021年08月03日 15:26:40 作者：Five在努力

千万级大表如何优化,这是一个很有技术含量的问题,通常我们的直觉思维都会跳转到拆分或者数据分区,这篇文章主要给大家介绍了关于MySQL千万级数据表优化的相关资料,需要的朋友可以参考下

前言

这里先说明一下，网上很多人说阿里规定500w数据就要分库分表。实际上，这个500w并不是定义死的，而是与MySQL的配置以及机器的硬件有关。MySQL为了提升性能，会将表的索引装载到内存中。但是当表的数据到达一定的量的时候，会导致内存无法存储这些索引，无法存储索引，就只能进行磁盘IO，从而导致性能下降。

实战调优

我这里有张表，数据有1000w，目前只有一个主键索引

CREATE TABLE `user` (
  `id` int(10) NOT NULL AUTO_INCREMENT,
  `uname` varchar(20) DEFAULT NULL COMMENT '账号',
  `pwd` varchar(20) DEFAULT NULL COMMENT '密码',
  `addr` varchar(80) DEFAULT NULL COMMENT '地址',
  `tel` varchar(20) DEFAULT NULL COMMENT '电话',
  `regtime` char(30) DEFAULT NULL COMMENT '注册时间',
  `age` int(11) DEFAULT NULL COMMENT '年龄',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=10000003 DEFAULT CHARSET=utf8;

查询所有大概16s。可谓是相当慢了。通常我们一个后台系统，比如这个是一个电商平台，这个是用户表。后台管理系统，一般会查询这些用户信息，做一些操作，比如后台直接新增用户啊，或者删除用户啊这些操作。

所以这里就诞生了两个需求，一个是查询count，一个是分页查询

我们分别来测试一下count用的时间和分页查询所用的时间

select * from user limit 1, 10   //几乎不用时
select * from user limit 1000000, 10  //0.35s
select * from user limit 5000000, 10  //1.7s
select * from user limit 9000000, 10  //2.8s
select count(1) from user  //1.7s

从上面查询所用时间可以看出来，如果是分页查询的话，查询的数据越往后用时是越长的，查询count也需要1.7s。这显然是不符合我们的要求的。所以，这里我们就需要优化。首先我们这里进行索引优化试试
首先看一下这是只有主键索引的执行计划：

alter table `user` add INDEX `sindex` (`uname`,`pwd`,`addr`,`tel`,`regtime`,`age`)

看上面的执行计划，虽然type是从all->index,走了sindex索引，但是实际上查询速度并没有发生改变。

其实，创建联合索引，是为了有条件查询的时候速度更快，而不是全表查询

select * from user where uname='6.445329111484186' //3.5s(无联合索引)
select * from user where uname='6.445329111484186' //0.003s(有联合索引)

所以这就是有联合索引和无索引的差距

这里基本上可以证明，加了索引和不加索引，进行全表查询的时候，效率就是会很慢

既然索引这个结果已经不好使了，那就只能找其他方案了。根据我之前mysql面试里面讲的，count我们可以单独存储到一个表里面

CREATE TABLE `attribute` (
  `id` int(11) NOT NULL,
  `formname` varchar(50) COLLATE utf8_bin NOT NULL COMMENT '表名',
  `formcount` int(11) NOT NULL COMMENT '表总数据',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin;

这里说一下，这种表一般不会查所有，只会查询一条，所以建表的时候，可以建成hash

select formcount from attribute where formname='user' //几乎不用时

count就进行优化完了。如果上面有选择条件的话，就可以建立索引，通过走索引筛选的形式来查询，这样就可以不用读这个count了。

那么，count是没问题了，分页查询优化要如何优化呢？这里可以使用子查询来优化

select * from user where
id>=(select id from user limit 9000000,1) limit 10 //1.7s

其实子查询这种写法，判断id，其实就是通过覆盖索引来查询。效率会大大增加。不过我这里测试是1.7s，以前在公司优化这方面的时候，比这个查询时间要低，大家也可以自己生成数据自己测试

但是如果说数据量太大了，我还是建议走es或者进行一些默认选择，count可以单独列出来

至此，一个千万级的数据分页查询的优化就完成了。

总结

到此这篇关于MySQL千万级数据表优化的文章就介绍到这了,更多相关MySQL千万级数据表优化内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

sql distinct多个字段的使用
这篇文章主要介绍了sql distinct多个字段的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2023-08-08
MySQL的InnoDB存储引擎的数据页结构详解
这篇文章主要为大家详细介绍了MySQL的InnoDB存储引擎的数据页结构，，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下，希望能够给你带来帮助
2022-03-03
mysql5.7 新增的json字段类型用法实例分析
这篇文章主要介绍了mysql5.7 新增的json字段类型用法,结合实例形式分析了mysql5.7 新增的json字段类型具体功能、使用方法及操作注意事项,需要的朋友可以参考下
2020-02-02
简单聊一聊SQL中的union和union all
在写SQL的时候,偶尔会用到两个表的数据结合在一起返回的,就需要用到UNION 和 UNION ALL,这篇文章主要给大家介绍了关于SQL中union和union all的相关资料,需要的朋友可以参考下
2023-02-02
Navicat无法连接MySQL报错1251的解决方案
这篇文章主要为大家详细介绍了Navicat无法连接MySQL报错1251的解决方案,文中解决方法介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
2023-12-12
MySQL数据库中遇到no database selected问题解决办法
这篇文章主要给大家介绍了关于MySQL数据库中遇到no database selected问题的解决办法,这是MySQL数据库的错误提示,意思是没有选择数据库,在使用MySQL命令行操作时需要先选择要操作的数据库,否则就会出现这个错误,需要的朋友可以参考下
2024-03-03
mysql中general_log日志知识点介绍
这篇文章主要介绍了mysql中general_log日志知识点的介绍以及其他相关内容，以后兴趣的朋友们学习下。
2019-08-08
mysql 5.7.13 安装配置方法图文教程(win10 64位)
这篇文章主要为大家分享了win10 64位下mysql 5.7.13 安装配置方法图文教程，感兴趣的朋友可以参考一下
2017-02-02
安装mysql noinstall zip版
没用过mysql，这几天折腾django ，发现连接mssql好像还是有些小bug，为了防止日后项目有些莫名的db故障，故选择django推荐之一的mysql
2011-12-12
MySQL5.7安装过程并重置root密码的方法（shell 脚本）
由于 MySQL 5.7 版本的 root 密码是首次启动时随机生成的，并且还要求必须修改后才能使用。下面小编给大家分享使用shell 脚本完成安装和设置新的 root 密码的方法，一起看看吧
2016-12-12

MySQL千万级数据表的优化实战记录

前言

实战调优

总结

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具