1. 聚合函数
1.1 group by:按照某一列对行进行分组、合并
group by 列1,列2,列3
group by跟在from,where后
注:展示结果时,一行只能由一条记录,否则会报错,因此我们需要对其他列使用聚合函数进行处理。
1.2 聚合函数
avg(列):求均值,操作对象为数值型;
sum(列):求和,操作对象为数值型;
count(列):求行数,操作对象可以是所有类型;
max(列):求最大值,操作对象可以是所有类型;
min(列):求最小值,操作对象可以是所有类型。
以上5个函数均会直接无视空值。
select 依据列,sum(原列名) as 新列名 from 表名 group by 依据列
greatest vs max
greatest:以行为单位横向比,返回多个字段中最大值;空值纳入计算,若有控制会返回空值。
max:以列为单位纵向比,返回多行中最大值;空值被无视不纳入计算。
count
只计数有值的记录,若需包含空值,则需要采用下面两种方法:
count(nvl(列,0)) 或 count(*)
若要记录出现过的值的数量(即去除重复值,对列去重后再count):
count(distinct 列)
distinct:去重
select distinct 列1,列2,列3 #返回剩下的唯一值,对3列均有作用,即去重去掉的是3列均相同的行
1.3 group by的条件从句
分组前对行的附加条件:用where,先where后group by;
分组后对行的附加条件:用having,先group后having。having操作的列是经过group by之后的列。
当聚合函数作为条件时,只能跟在having后,不能跟在where后。
聚合函数可以不与group by搭配,而直接对数据进行加工,但这样必须跟在select后,且次时select后就只能跟聚合函数无法跟其它列了。
2. 分析函数
avg(列) over (partition by 依据列) #这样就不用group by了
sum(列) over (partition by 依据列)
count(列) over (partition by 依据列)
max(列) over (partition by 依据列)
min(列) over (partition by 依据列)
2.1 聚合函数 vs 分析函数
select 依据列,sum(原列名) as 新列名 from 表名 group by 依据列 #聚合函数
select 依据列,sum(原列名) over (partition by 依据列) as 新列名 from 表名 #分析函数
上述两行命令均是依据“依据列”对“表名”中“原列名”求和,并将和命名为“新列名”,展示“依据列”和“新列名”。
①但聚合函数的结果会使原来的行减少,即进行了合并;而分析函数行数不变并没有执行合并操作,即对原来的每条记录都多了一列“新列名”,只不过同一个“依据列”的“新列名”值相等均为“原列名”之和。
②使用聚合函数时,select后只能跟“依据列”或“经聚合函数处理的列”,而使用分析函数时,可以跟任意列。
③作为条件时:聚合函数只能跟在having后,不能跟在where后,而分析函数无法用于where后且无having,必须创建字表作为新的列使用。
2.2 排序函数:对列排序并赋予相应序号
row_number() over (partition by 分组依据列 order by 排序依据列)
rank() over (partition by 分组依据列 order by 排序依据列)
order by后可以加desc进行倒序排序。
row_number与rank不同之处在于:当存在并列情况时,前者会随机排序,给相同排序的确认不同序号,而后者会给并列者相同的煦好,后续的则不受影响。如并列第一时,前者为1、2、3,后者为1、1、3。
3. 子查询
子查询时先执行一次select创建一张新表,然后对新表再执行第二次select。
3.1 应用情境:
①子查询跟在from后。
②某些操作无法直接跟在where后,如分析函数(如:sum(列) over (partition by 依据列) 新列名),因此要创建子查询,这样新建的列就可在from后使用了。注:子查询里select的列才可用到外查询中。
③也可作为某个值或列应用于where后。
3.2 in、 exists
exists:将<使子查询中where条件句运算成立的“行”>应用到外查询中。
以下两个命令是等价的:
select b.书名,b.数量
from 卖书2 b
where b.书名 in (select a.书名
from 卖书1 a
where a.类型='小说')
select b.书名,b.数量
from 卖书2 b
where exists (select 1
from 卖书1 a
where a.类型='小说'
and a.书名=b.书名)
不同之处:
①遇到空值:使用in和exists时,均会忽略空值;使用not in时,当in前的列有空值时会忽略空值,当in后的列有空值时则不返回值;使用not exists会输出查询列的空值。
②在有针对同一个表的多个条件句时,exists可集中在一个子查询中,in无法针对多个子查询。