MySQL关于Count的经典用法比较

前言

大家好,MySQL关于Count你知道多少

统计数据的需求在我们日常开发中是非常容易遇到了,MySQL也支持多种的计算的函数,

接下来我们来看一看他们之间有什么区别,以及他们是否存在一些坑。

count(*)、count(1)、count(id)的区别

count的含义:count() 是一个聚合函数,对于返回的结果集,一行行地判断,如果 count 函数的参数不是 NULL,累计值就加 1,否则不加。最后返回累计值。

count(字段)比较特殊,则表示返回满足条件的数据行里面,参数“字段”不为 NULL 的总个数

分析性能差别原则

  1. server 层要什么就给什么;
  2. InnoDB 只给必要的值;
  3. 现在的优化器只优化了 count(*) 的语义为“取行数”,其他“显而易见”的优化并没有做

例子:

count(主键 id) 来说,InnoDB 引擎会遍历整张表,把每一行的 id 值都取出来,返回给 server 层。server 层拿到 id 后,判断是不可能为空的,就按行累加。

count(1) 来说,InnoDB 引擎遍历整张表,但不取值。server 层对于返回的每一行,放一个数字“1”进去,判断是不可能为空的,按行累加。

count(字段),server要字段,就返回字段,如果字段为空,就不做统计,字段的值过大,都会造成效率低下。

效率排序

count(字段)<count(主键 id)<count(1)≈count(*)

为什么count(*)最快?

优化器做了工作,找到最小的数来遍历。

InnoDB 是索引组织表,主键索引树的叶子节点是数据,而普通索引树的叶子节点是主键值。所以,普通索引树比主键索引树小很多。对于 count(*) 这样的操作,遍历哪个索引树得到的结果逻辑上都是一样的。因此,MySQL 优化器会找到最小的那棵树来遍历。在保证逻辑正确的前提下,尽量减少扫描的数据量,是数据库系统设计的通用法则之一。

关于NULL的几个坑

// 数据中存在null值数据
select count(*) from audit_log a;
结果:1

select count(id) from audit_log a;
结果:0
复制代码

我们看到count的结果不一致,记录数应该是1,count(id)却等于0

这是因为count(字段)是不统计,字段值为null的值

所以在字段为非空字段的情况下,需要使用count(*)来解决这个问题。

count(*)小结

  1. MyISAM 表虽然 count(*) 很快,但是不支持事务;
  2. show table status 命令虽然返回很快,但是不准确;
  3. InnoDB 表直接 count(*) 会遍历全表,虽然结果准确,但会导致性能问题。

本文转自:
blog.csdn.net/qq_41451303/article/...

本作品采用《CC 协议》,转载必须注明作者和本文链接
最美的不是下雨天,而是和你一起躲过的屋檐!
讨论数量: 4

喜欢 count(1),因为 1 最好敲出来

1年前 评论
fatrbaby 1年前

count() 是一个聚合函数,对于返回的结果集,一行行地判断,如果 count 函数的参数不是 NULL,累计值就加 1,否则不加。最后返回累计值。 count(*)、count(主键 id) 和 count(1) 都表示返回满足条件的结果集的总行数;而 count(字段),则表示返回满足条件的数据行里面,参数“字段”不为 NULL 的总个数。

count() 的实现方式 你首先要明确的是,在不同的 MySQL 引擎中,count() 有不同的实现方式。 MyISAM 引擎把一个表的总行数存在了磁盘上,因此执行 count() 的时候会直接返回这个数,效率很高; InnoDB 引擎就麻烦了,它执行 count() 的时候,需要把数据一行一行地从引擎里面读出来,然后累积计数。

对于 count(1) 来说 InnoDB 引擎遍历整张表,但不取值。server 层对于返回的每一行,放一个数字“1”进去,判断是不可能为空的,按行累加。 单看这两个用法的差别的话,你能对比出来,count(1) 执行得要比 count(主键 id) 快。因为从引擎返回 id 会涉及到解析数据行,以及拷贝字段值的操作。

对于 count(主键 id) 来说 InnoDB 引擎会遍历整张表,把每一行的 id 值都取出来,返回给 server 层。server 层拿到 id 后,判断是不可能为空的,就按行累加。

对于 count(字段) 来说 1.如果这个“字段”是定义为 not null 的话,一行行地从记录里面读出这个字段,判断不能为 null,按行累加; 2.如果这个“字段”定义允许为 null,那么执行的时候,判断到有可能是 null,还要把值取出来再判断一下,不是 null 才累加。 也就是前面的第一条原则,server 层要什么字段,InnoDB 就返回什么字段

按照效率排序的话,count(字段)<count(主键 id)<count(1)≈count(),所以我建议你,尽量使用 count()。

1年前 评论

不管那么多,count(*)用了好多年了,8000万数据也几毫秒出结果。更大的数据都分库分表了,不过这种性能优化的问题值得鼓励。对于我们单位来说,大力出奇迹,性能不行,还不如加硬件,128G内存服务器起步

1年前 评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!