主键冲突
- 主键冲突:更新操作(不常用)
insert into 表名[(字段列表:包含主键)] values(值列表)
on duplicate key
update 字段 = 新值;
- 主键冲突:替换(常用)
replace into 表名[(字段列表:包含主键)] values(值列表);
蠕虫复制
蠕虫复制:从已有的数据中去获取数据,然后将数据又进行新增操作,数据成倍的增加。
- 复制表结构(从已有表创建新表)
create table 表名 like 数据库.表名;
- 复制数据:蠕虫复制:先查出数据,然后将查出的数据新增一遍
insert into 表名[(字段列表)] select 字段列表/* from 数据表名;
蠕虫复制的意义:
1.从已有表拷贝数据到新表中
2.可以迅速的让表中的数据膨胀到一定的数量级:测试表的压力以及效率
数据更新(限制记录)
高级更新语法
update 表名 set 字段 = 值 [where 条件] [limit 更新数量];
删除数据
delete from 表名 [where 条件] [limit 数量];
如果表中存在主键自增长,那么当删除之后,自增长不会还原。
如果想要自增长还原思路:
删除表后重建表
-- 清空表,重置自增长
truncate 表名;
查询数据
完整语法:
select [select 选项] 字段列表[字段别名]/* from 数据源 [where 条件子句] [group by 子句] [having 子句] [order by 子句] [limit 子句];
1. select 选项:select对查出来的结果的处理方式
- all:默认的,保留所有的结果
- distinct:去重,查出来的结果,将重复给去除
2. 字段别名
语法:字段名 [as] 别名;
最终以别名显示查询数据结果
3. 数据源
数据的来源,关系型数据库的来源都是数据表,本质上只要保证数据类似二维表,最终都可以作为数据源。
数据源分为:单表数据源,多表数据源,查询语句
- 单表数据源:select * from 表名;
- 多表数据源:select * from 表名1,表名2...;
从一张表中取出一条记录,去另一张表中匹配所有记录,而且全部保留。这种结果称为笛卡尔积,应该尽量避免。 - 子查询:数据的来源是一条查询语句
select * from (select 语句) as 表名;
4. where子句
where子句返回结果:0或者1,0代表false,1代表true
判断条件:
- 比较运算符:>, <, >=, <=, !=, <>, =, like, between and, in/not in
- 逻辑运算符:&&(and), ||(or), !(not)
where是唯一一个直接从磁盘获取数据的时候就开始判断的条件。
条件查询1:要求找出学生id为1或者3或者5的学生
select * from my_student where id = 1 || id = 3 || id = 5;
select * from my_student where id in(1, 3, 5);
-- 以上两条语句等价
条件查询2:查出区间落在180,190身高之间的学生。
select * from my_student where height >= 180 and height <= 190;
select * from my_student where height between 180 and 190;
-- 以上两条语句等价
between本身是闭区间,between左边的值必须小于或者等于右边的值。
5. group by子句
分组,根据某个字段进行分组
基本语法:group by 字段名;
SQL提供了一系列统计函数:
- count():统计分组后的记录数,每一组有多少记录
- max():统计每组中的最大值
- min():统计最小值
- avg():统计平均值
- sum():统计和
-- 按性别分组统计:身高高矮,年龄平均,总年龄
select sex, count(*), max(height), min(height), avg(age), sum(age) from my_student group by sex;
count函数:里面可以使用两种参数:*代表统计记录,字段名代表统计对应的字段(除了null的个数)。
分组会自动排序:根据分组字段:默认升序
group by 字段 [asc|desc];
多字段分组:先根据一个字段进行分组,然后对分组后的结果再按照其它字段进行分组
-- 多字段分组:先班级,后男女
select c_id, sex, count(*) from my_student group by c_id, sex;
group_concat()函数:
可以对分组的结果中的某个字段进行字符串连接(保留该组所有的某个字段)
select c_id, sex, count(*), group_concat(name) from my_student group by c_id, sex;
回溯统计:with rollup:任何一个分组后都会有一个小组,最后都需要向上级分组进行汇报统计,根据当前分组的字段,这就是回溯统计,回溯统计的时候将分组字段置空。
多字段回溯:考虑第一层会有此回溯,第二次分组要看第一次分组的组数,组数是多少,回溯就是多少,然后加上第一层回溯即可。
6. having子句
与where子句一样:进行条件判断。
where是针对磁盘数据进行判断,进入到内存之后,会进行分组操作,分组结果就需要having来处理。
having能做where能做的几乎所有事情,但是where却不能做having能做的很多事。
分组统计的结果或者说统计函数都只有having能够使用。
-- 求出所有班级人数大于等于2的学生人数
select c_id, count(*) from my_student group by c_id having count(*) >= 2;
having能够使用字段别名:where不能:where是从磁盘取数据,而名字只可能是字段名;别名是在字段进入到内存后才会产生。
select c_id, count(*) as total from my_student group by c_id having total >= 2;
7. order by子句
排序,根据某个字段进行升序或者降序排序,依赖校对集。
基本语法:order by 字段名 [asc|desc];
多字段排序:先根据某个字段进行排序,然后排序好的内部,再按照某个数据进行再次排序。
-- 先班级升序排序,后性别降序排序
select * from my_student order by c_id, sex desc;
8. limit子句
是一种限制结果的语句
两种方式:
- 方案1:只用来限制长度(数据量):limit 数据量;
- 方案2:限制起始位置,限制数量:limit 起始位置, 长度;
select * from my_student limit 0, 2;
-- 记录数是从0开始编号,从第一条数据开始取,一共取两条。
方案2主要用来实现数据分页,为用户节省时间,提交服务器的响应效率,减少资源的浪费。
对于用户来说:可以点击的分页按钮:1,2,3,4
对于服务器来讲:根据用户选择的页码来获取不同的数据:limit offset,length;
length:每页显示的数据量:基本不变
offset:offset = (页码 - 1) * 每页显示量。