MySQL如何使用GROUPBY_MySQL分组查询与聚合函数应用教程

作者 2025年8月30日 12

GROUP BY用于按列分组数据并执行聚合计算，如SUM、count、AVG等；HAVING用于过滤分组后的结果，而WHERE在分组前过滤原始数据，执行顺序为先WHERE、再GROUP BY、最后HAVING。

GROUP BY

子句是进行数据聚合和分析的核心，它允许你根据一个或多个列的值将数据行分组，然后对每个组执行像求和、计数、平均值这样的聚合操作。简单来说，当你需要从海量数据中提炼出某个类别或维度下的汇总信息时，

GROUP BY

就是你的得力工具，它能帮助你快速理解数据的整体趋势和特征。

使用

GROUP BY

实际上是数据库查询中一个非常强大的模式，它让我们从“看单个数据”转变为“看数据群体特征”。最基本的用法是这样的：你选择一些列作为分组的依据，然后选择一个或多个聚合函数来计算每个组的汇总值。

比如，我有一个

orders

表，里面有

customer_id

,

order_date

,

amount

。如果我想知道每个客户的总消费额，我不会去遍历每一条订单然后手动加起来，那太低效了。我会这样写：

select     customer_id,     SUM(amount) AS total_spent FROM     orders GROUP BY     customer_id;

这里，

customer_id

就是我们的分组依据。数据库会找到所有

customer_id

相同的行，把它们归到同一个“桶”里，然后对每个桶里的

amount

值进行

SUM

操作。结果就是每个客户一行，显示他们的ID和总消费。

有时，你可能需要更细致的分组，比如想看每个客户在不同月份的消费情况。这时，

GROUP BY

后面就可以跟多个列：

SELECT     customer_id,     DATE_FORMAT(order_date, '%Y-%m') AS order_month,     SUM(amount) AS monthly_spent FROM     orders GROUP BY     customer_id,     order_month ORDER BY     customer_id, order_month;

这里要注意一点，

SELECT

语句中除了聚合函数的结果，通常只能出现

GROUP BY

子句中包含的列。这是SQL的一个基本原则，因为如果你选了一个没有分组的列，数据库就不知道在每个组里应该显示哪个值了。比如说，一个客户有多笔订单，每笔订单的

order_id

都不同，如果你

SELECT customer_id, order_id, SUM(amount) FROM orders GROUP BY customer_id;

，那么对于一个客户的多个

order_id

，数据库就不知道该选哪个

order_id

来代表这个分组了，这通常会导致错误或者非预期的结果（在某些数据库版本或配置下可能会返回任意一个值，但这不是我们想要的）。

还有，筛选分组后的数据，我们用

HAVING

而不是

WHERE

。

WHERE

是在分组发生之前过滤原始行，而

HAVING

是在分组和聚合之后，对聚合结果进行过滤。比如，我想找出总消费超过1000元的客户：

SELECT     customer_id,     SUM(amount) AS total_spent FROM     orders GROUP BY     customer_id HAVING     total_spent > 1000;

如果我想先过滤掉某个日期前的订单，再进行分组和聚合，那么

WHERE

和

HAVING

可以一起用：

SELECT     customer_id,     SUM(amount) AS total_spent FROM     orders WHERE     order_date >= '2023-01-01' -- 先过滤2023年之前的订单 GROUP BY     customer_id HAVING     total_spent > 500; -- 再过滤总消费低于500的客户

这展示了它们各自的作用范围和执行顺序。

MySQL GROUP BY 语句中常用的聚合函数有哪些？

在使用

GROUP BY

进行数据分组时，聚合函数是不可或缺的，它们负责对每个组内的数据进行计算，然后返回一个单一的结果。理解这些函数的功能和应用场景，能让我们更灵活地从数据中提取价值。我通常会用到以下几种：

COUNT()

: 这是最常用的，用于计算组中的行数。
- ```
COUNT(*)
```
  ：计算组内所有行的数量，包括含有NULL值的行。
- ```
COUNT(column_name)
```
  ：计算指定列非NULL值的行数。如果你想知道某个字段有多少个非空值，这个就很有用。
- ```
COUNT(DISTINCT column_name)
```
  ：计算指定列中不重复的非NULL值的数量。比如，我想知道某个部门有多少个不同的职位。
```
-- 计算每个部门的员工总数 SELECT department_id, COUNT(*) AS total_employees FROM employees GROUP BY department_id;  -- 计算每个部门有多少个不同的职位 SELECT department_id, COUNT(DISTINCT job_id) AS distinct_jobs FROM employees GROUP BY department_id;
```
SUM()

: 计算指定列（通常是数值类型）的总和。
- 这个函数在财务、销售数据分析中尤其重要，比如计算总销售额、总库存价值等。
```
-- 计算每个产品的总销售额 SELECT product_id, SUM(quantity * price) AS total_sales FROM order_items GROUP BY product_id;
```

AVG()

: 计算指定列（数值类型）的平均值。

分析平均消费、平均薪资、平均分数等场景。

-- 计算每个部门的平均薪资 SELECT department_id, AVG(salary) AS average_salary FROM employees GROUP BY department_id;

MAX()

和

MIN()

: 分别计算指定列的最大值和最小值。

这两个函数不仅限于数值类型，也可以用于日期、字符串类型，比如找出最早/最晚的订单日期，或者按字母顺序排在最前/最后的商品名称。

-- 找出每个客户的最高消费订单金额和最低消费订单金额 SELECT customer_id, MAX(amount) AS max_order_amount, MIN(amount) AS min_order_amount FROM orders GROUP BY customer_id;  -- 找出每个部门最早入职的员工日期 SELECT department_id, MIN(hire_date) AS earliest_hire_date FROM employees GROUP BY department_id;

除了这些，还有像

GROUP_CONCAT()

（将组内字符串连接起来）、

VAR_POP()

,

STDDEV_POP()

（计算方差和标准差）等，它们在特定场景下也非常有用。关键是根据你的分析目标，选择最合适的聚合函数。有时候，一个复杂的业务问题，可能需要组合多个聚合函数才能得到答案。

理解GROUP BY与HAVING子句的执行顺序和区别

很多初学者在使用

GROUP BY

时，经常会混淆

WHERE

和

Hello! 欢迎来到悠悠畅享网！

MySQL如何使用GROUPBY_MySQL分组查询与聚合函数应用教程

MySQL GROUP BY 语句中常用的聚合函数有哪些？

理解GROUP BY与HAVING子句的执行顺序和区别

评论（已关闭）