5-高级SQL查询网站首页 技术杂谈

5-高级SQL查询

aurorarnw 2024-06-17 11:27:15

简介5-高级SQL查询

PS：插入查询结果

把一张表查询出的结果，插入到另一张表中。要求两张表的列数和列类型要匹配。

前面讲的所有select规则在此处都适用~

1.聚合查询

聚合查询：行和行之间进行运算。
带表达式查询：列和列之间进行运算。

常⻅的聚合函数（SQL里内置的函数）有：

它们都是针对表中某个列的所有行来进行运算的~

MySQL的函数，相当于Java里的方法：

聚合函数需要设置参数，在查询中可以使用多次聚合函数，可以多个聚合函数一起使用。

不是数字的数据，直接舍弃。

1.1.count函数

返回查询到的数据的条数。

用法一：

能查询出所有null和非null的数据总和。推荐使用，最标准，MySQL、SQL Server、Oracle都能使用。

用法二：

能查询出所有null和非null的数据总和。兼容性不是很好，MySQL能用，其他数据库不一定能用。

用法三：

count(列名)，查询当前字段中非null的数据总和。不推荐使用，查询结果极不稳定。

建议写成：

用法四：

count(表达式)。

count(1)1就是常数表达式。

在不同的count统计场景下，要使用不同的count查询。

若要查询表中非null的数据总和，建议使用count(*)配合where条件使用。

1.2.sum函数

返回查询到的数据的总和，不是数字没有意义。

PS：sum函数执行逻辑——只会统计有效的数据

判断数据是否为有效数据：

若是有效数据：会将其加入已经计算的结果集中。
若不是有效数据（NULL或非数值型（比如varchar型））：会将其看作0，并加入已经计算的结果集中。

PS：sum函数查询 VS 表达式求和查询

若要求和查询的数据中包含NULL：

sum函数：会把除去NULL外的其他数据进行求和运算。
表达式求和：直接得到和为NULL。

1.3.avg函数

返回查询到的数据的平均值，不是数字没有意义，会将含有不合规范数据的一行数据整体舍弃掉。

1.4.max函数

返回查询到的数据的最⼤值，不是数字没有意义。

1.5.min函数

返回查询到的数据的最⼩值，不是数字没有意义。

PS：ifnull函数

ifnull函数是 MySQL 控制流函数之⼀，它接收两个参数，如果第一个参数不是 NULL，则返回第⼀个参数，否则返回第⼆个参数。
ifnull(参数1,参数2);
使用ifnull函数的实例——解决遗留问题：总成绩为null的问题

另外的解决⽅案：使⽤⾮空约束或默认值 0 来解决。

注：

在公司里多使用分布式多份部署，一份程序部署到了多台服务器，处理能力会是原来的多倍，但没有办法把MySQL分成多份。
so~MySQL的资源很紧缺，而程序的资源相对不紧缺。在MySQL中应尽量不使用表达式和函数（它们应该是在Java程序里）。

所以这种问题最好在建表时就设置好非空约束，从而避免ifnull查询，减轻MySQL负担。

2.分组查询group by

select 中使⽤ group by ⼦句可以对指定列进⾏分组查询。需要满⾜：使⽤ group by 进⾏分组查询时，select 指定的字段必须是“分组依据字段”，其他字段若想出现在 select 中则必须包含在聚合函数中。

select 列名1, sum(列名2),...from 表名 group by 列名1, 列名3;

PS：distinct（去重） VS group by（分组）

①创建测试数据

②distinct使用

基本语法：
select distinct 列名 [,列名...] from 表名;
a.单列去重

根据 aid（文章 ID）去重：

b.多列（两列及以上）去重

根据 aid（文章 ID）和 uid（用户 ID）联合去重：

c.聚合函数 + distinct

计算 aid 去重之后的总条数：

③group by使用

基本语法：
select 列名 [,列名...] from 表名 group by 列名
a.单列去重

根据 aid（文章 ID）去重：

与 distinct 相比 group by 可以显示更多的列，而 distinct 只能展示去重的列。

b.多列去重

根据 aid（文章 ID）和 uid（用户 ID）联合去重：

c.聚合函数 + group by

统计每个 aid 的总数量：

从上述结果可以看出，使用 group by 和 distinct 加 count 的查询语义是完全不同的，distinct + count 统计的是去重之后的总数量，而 group by + count 统计的是分组之后的每组数据的总数。

④distinct 和 group by的区别

官方文档在描述 distinct 时提到：在大多数情况下 distinct 是特殊的 group by：

但二者还是有一些细微的不同的，比如以下几个：

区别1：查询结果集不同

1）当使用 distinct 去重时，查询结果集中只有去重列信息。当试图添加非去重字段查询时，SQL 会报错：

2）而使用 group by 排序可以查询一个或多个字段：

区别2：使用业务场景不同

1）统计去重之后的总数量需要使用 distinct。使用 distinct 统计某列去重之后的总数量：

2）而统计分组明细，或在分组明细的基础上添加查询条件时，就得使用 group by 了。使用 group by 统计分组之后数量大于 2 的文章：

区别3：性能不同

如果去重的字段有索引，那么 group by 和 distinct 都可以使用索引，此情况它们的性能是相同的。
而当去重的字段没有索引时，distinct 的性能就会高于 group by，因为在 MySQL 8.0 之前，group by 有一个隐藏的功能会进行默认的排序，这样就会触发 filesort 从而导致查询性能降低。