boxmoe_header_banner_img

Hello! 欢迎来到悠悠畅享网!

文章导读

MySQL如何使用GROUPBY_MySQL分组查询与聚合函数应用教程


avatar
作者 2025年8月30日 12

GROUP BY用于按列分组数据并执行聚合计算,如SUM、count、AVG等;HAVING用于过滤分组后的结果,而WHERE在分组前过滤原始数据,执行顺序为先WHERE、再GROUP BY、最后HAVING。

MySQL如何使用GROUPBY_MySQL分组查询与聚合函数应用教程

mysql中,

GROUP BY

子句是进行数据聚合和分析的核心,它允许你根据一个或多个列的值将数据行分组,然后对每个组执行像求和、计数、平均值这样的聚合操作。简单来说,当你需要从海量数据中提炼出某个类别或维度下的汇总信息时,

GROUP BY

就是你的得力工具,它能帮助你快速理解数据的整体趋势和特征。

使用

GROUP BY

实际上是数据库查询中一个非常强大的模式,它让我们从“看单个数据”转变为“看数据群体特征”。最基本的用法是这样的:你选择一些列作为分组的依据,然后选择一个或多个聚合函数来计算每个组的汇总值。

比如,我有一个

orders

表,里面有

customer_id

,

order_date

,

amount

。如果我想知道每个客户的总消费额,我不会去遍历每一条订单然后手动加起来,那太低效了。我会这样写:

select     customer_id,     SUM(amount) AS total_spent FROM     orders GROUP BY     customer_id;

这里,

customer_id

就是我们的分组依据。数据库会找到所有

customer_id

相同的行,把它们归到同一个“桶”里,然后对每个桶里的

amount

值进行

SUM

操作。结果就是每个客户一行,显示他们的ID和总消费。

有时,你可能需要更细致的分组,比如想看每个客户在不同月份的消费情况。这时,

GROUP BY

后面就可以跟多个列:

SELECT     customer_id,     DATE_FORMAT(order_date, '%Y-%m') AS order_month,     SUM(amount) AS monthly_spent FROM     orders GROUP BY     customer_id,     order_month ORDER BY     customer_id, order_month;

这里要注意一点,

SELECT

语句中除了聚合函数的结果,通常只能出现

GROUP BY

子句中包含的列。这是SQL的一个基本原则,因为如果你选了一个没有分组的列,数据库就不知道在每个组里应该显示哪个值了。比如说,一个客户有多笔订单,每笔订单的

order_id

都不同,如果你

SELECT customer_id, order_id, SUM(amount) FROM orders GROUP BY customer_id;

,那么对于一个客户的多个

order_id

,数据库就不知道该选哪个

order_id

来代表这个分组了,这通常会导致错误或者非预期的结果(在某些数据库版本或配置下可能会返回任意一个值,但这不是我们想要的)。

还有,筛选分组后的数据,我们用

HAVING

而不是

WHERE

WHERE

是在分组发生之前过滤原始行,而

HAVING

是在分组和聚合之后,对聚合结果进行过滤。比如,我想找出总消费超过1000元的客户:

SELECT     customer_id,     SUM(amount) AS total_spent FROM     orders GROUP BY     customer_id HAVING     total_spent > 1000;

如果我想先过滤掉某个日期前的订单,再进行分组和聚合,那么

WHERE

HAVING

可以一起用:

SELECT     customer_id,     SUM(amount) AS total_spent FROM     orders WHERE     order_date >= '2023-01-01' -- 先过滤2023年之前的订单 GROUP BY     customer_id HAVING     total_spent > 500; -- 再过滤总消费低于500的客户

这展示了它们各自的作用范围和执行顺序。

MySQL GROUP BY 语句中常用的聚合函数有哪些?

在使用

GROUP BY

进行数据分组时,聚合函数是不可或缺的,它们负责对每个组内的数据进行计算,然后返回一个单一的结果。理解这些函数的功能和应用场景,能让我们更灵活地从数据中提取价值。我通常会用到以下几种:

  • COUNT()

    : 这是最常用的,用于计算组中的行数。

    • COUNT(*)

      :计算组内所有行的数量,包括含有NULL值的行。

    • COUNT(column_name)

      :计算指定列非NULL值的行数。如果你想知道某个字段有多少个非空值,这个就很有用。

    • COUNT(DISTINCT column_name)

      :计算指定列中不重复的非NULL值的数量。比如,我想知道某个部门有多少个不同的职位。

    -- 计算每个部门的员工总数 SELECT department_id, COUNT(*) AS total_employees FROM employees GROUP BY department_id;  -- 计算每个部门有多少个不同的职位 SELECT department_id, COUNT(DISTINCT job_id) AS distinct_jobs FROM employees GROUP BY department_id;
  • SUM()

    : 计算指定列(通常是数值类型)的总和。

    • 这个函数在财务、销售数据分析中尤其重要,比如计算总销售额、总库存价值等。
    -- 计算每个产品的总销售额 SELECT product_id, SUM(quantity * price) AS total_sales FROM order_items GROUP BY product_id;
  • AVG()

    : 计算指定列(数值类型)的平均值。

    • 分析平均消费、平均薪资、平均分数等场景。
    -- 计算每个部门的平均薪资 SELECT department_id, AVG(salary) AS average_salary FROM employees GROUP BY department_id;
  • MAX()

    MIN()

    : 分别计算指定列的最大值和最小值。

    • 这两个函数不仅限于数值类型,也可以用于日期、字符串类型,比如找出最早/最晚的订单日期,或者按字母顺序排在最前/最后的商品名称。
    -- 找出每个客户的最高消费订单金额和最低消费订单金额 SELECT customer_id, MAX(amount) AS max_order_amount, MIN(amount) AS min_order_amount FROM orders GROUP BY customer_id;  -- 找出每个部门最早入职的员工日期 SELECT department_id, MIN(hire_date) AS earliest_hire_date FROM employees GROUP BY department_id;

除了这些,还有像

GROUP_CONCAT()

(将组内字符串连接起来)、

VAR_POP()

,

STDDEV_POP()

(计算方差和标准差)等,它们在特定场景下也非常有用。关键是根据你的分析目标,选择最合适的聚合函数。有时候,一个复杂的业务问题,可能需要组合多个聚合函数才能得到答案。

理解GROUP BY与HAVING子句的执行顺序和区别

很多初学者在使用

GROUP BY

时,经常会混淆

WHERE



评论(已关闭)

评论已关闭

text=ZqhQzanResources