数据库的数据分组GROUP BY

1、数据分组入门

数据分组用来将数据分为多个逻辑组，从而可以对每个组进行聚合运算。SQL语句中使用

GROUP BY子句进行分组，使用方式为“GROUP BY 分组字段”。分组语句必须和聚合函数一

起使用，GROUP BY子句负责将数据分成逻辑组，而聚合函数则对每一个组进行统计计算。

虽然GROUP BY子句常常和聚合函数一起使用，不过GROUP BY子句并不是不能离开聚合函数而单独使用。

SELECT FAge FROM T_Employee

GROUP BY FAge //查看公司员工有哪些年龄段

需要注意的是GROUP BY子句的位置，GROUP BY子句必须放到SELECT语句的之后，如果SELECT语句有WHERE子句，则GROUP BY子句必须放到WHERE语句的之后

SELECT FAge FROM T_Employee

WHERE FSubCompany = 'Beijing'

GROUP BY FAge

需要分组的所有列都必须位于GROUP BY子句的列名列表中，也就是没有出现在GROUP BY子句中的列（聚合函数除外）是不能放到SELECT语句后的列名列表中的。

SELECT FAge,FSalary FROM T_Employee

GROUP BY FAge //错误的，因为不存在能够统一代表本组工资水平的FSalary字段

SELECT FAge,AVG(FSalary) FROM T_Employee

GROUP BY FAge //可以对FSalary使用聚合函数

GROUP BY子句中可以指定多个列，只需要将多个列的列名用逗号隔开即可。指定多个分组规则以后，数据库系统将按照定义的分组顺序来对数据进行逐层分组，首先按照第一个分组列进行分组，然后在每个小组内按照第二个分组列进行再次分组……逐层分组，从而实现“组中组”的效果，而查询的结果集是以最末一级分组来进行输出的。

SELECT FSubCompany,FDepartment FROM T_Employee

GROUP BY FSubCompany,FDepartment

2、数据分组与聚合函数

SELECT FAge,COUNT(*) AS CountOfThisAge FROM T_Employee

GROUP BY FAge //查看每个年龄段的员工的人数

SELECT FSubCompany,FAge,COUNT(*) AS CountOfThisSubCompAge FROM

T_Employee

GROUP BY FSubCompany,FAge //统计每个分公司的年龄段的人数

上面的执行结果是按照数据库系统默认的年龄进行排序的，为了更容易的按照每个分公司进行查看，我们可以指定按照FSubCompany字段进行排序，带ORDER BY的SQL语句如下：

SELECT FSubCompany,FAge,COUNT(*) AS CountOfThisSubCompAge FROM

T_Employee

GROUP BY FSubCompany,FAge

ORDER BY FSubCompany

“COUNT(*)”对每一个分组统计总数，这样就可以统计出每个公司每个年龄段的员工的人数了。

SUM、AVG、MIN、MAX也可以在分组中使

SELECT FSubCompany,SUM(FSalary) AS FSalarySUM FROM T_Employee

GROUP BY FSubCompany //统计每个公司中的工资的总值

SELECT FDepartment,SUM(FSalary) AS FSalarySUM FROM T_Employee

GROUP BY FDepartment //统计每个垂直部门中的工资的平均值

SELECT FDepartment,MIN(FAge) AS FAgeMIN,MAX(FAge) AS FAgeMAX FROM T_Employee

GROUP BY FDepartment //统计每个垂直部门中员工年龄的最大值和最小值

3、HAVING 语句

有的时候需要对部分分组进行过滤，比如只检索人数多余1个的年龄段

SELECT FAge,COUNT(*) AS CountOfThisAge FROM T_Employee

GROUP BY FAge

WHERE COUNT(*)>1

以上SQL语句数据库系统会提示语法错误，这是因为聚合函数不能在WHERE语句中使用，必须使用HAVING子句来代替

SELECT FAge,COUNT(*) AS CountOfThisAge FROM T_Employee

GROUP BY FAge

HAVING COUNT(*)>1

HAVING语句中也可以像WHERE语句一样使用复杂的过滤条件

SELECT FAge,COUNT(*) AS CountOfThisAge FROM T_Employee

GROUP BY FAge

HAVING COUNT(*) =1 OR COUNT(*) =3 //检索人数为1个或者3个的年龄段，

也可以使用IN操作符来实现上面的功能，SQL语句如下：

SELECT FAge,COUNT(*) AS CountOfThisAge FROM T_Employee

GROUP BY FAge

HAVING COUNT(*) IN (1,3)

HAVING语句能够使用的语法和WHERE几乎是一样的，不过使用WHERE的时候GROUP BY子句要位于WHERE子句之后，而使用HAVING子句的时候GROUP BY子句要位于HAVING子句之前，比如下面的SQL是错误的：

SELECT FAge,COUNT(*) AS CountOfThisAge FROM T_Employee

HAVING COUNT(*) IN (1,3)

GROUP BY FAge

需要特别注意，在HAVING语句中不能包含未分组的列名，比如下面的SQL语句是错误的：

SELECT FAge,COUNT(*) AS CountOfThisAge FROM T_Employee

GROUP BY FAge

HAVING FName IS NOT NULL

执行的时候数据库系统会提示类似如下的错误信息：

HAVING 子句中的列'T_Employee.FName' 无效，因为该列没有包含在聚合函数或GROUP BY 子句中。

需要用WHERE语句来代替HAVING，修改后的SQL语句如下：

SELECT FAge,COUNT(*) AS CountOfThisAge FROM T_Employee

WHERE FName IS NOT NULL

GROUP BY FAge

以上摘自《程序员的SQL 金典》

数据库的数据分组GROUP BY