SQL 里怎么实现查询结果去重 – 来学习啦 – 编程乐园，实战驱动的编程学习平台

SQL 里怎么实现查询结果去重

天天向上

发布： 2024-12-22 13:50:20

原创

149 人浏览过

在 SQL 查询中，去重操作主要通过 DISTINCT 关键字来实现，DISTINCT 用于移除查询结果中的重复记录，只返回唯一的记录。

SELECT DISTINCT column1, column2, ... FROM table_name;

假设有一个 employees 表，内容如下：

id	name	department	salary
1	Alice	HR	5000
2	Bob	IT	6000
3	Alice	HR	5000
4	Carol	HR	5500
5	Alice	IT	7000

如果我们只想去掉 name 列中的重复项，可以使用：

SELECT DISTINCT name FROM employees;

结果：

如果我们希望去掉 name 和 department 列的重复项，可以使用：

SELECT DISTINCT name, department FROM employees;

结果：

在这种情况下，DISTINCT 会确保每一对 (name, department) 组合是唯一的，所以 Alice 在 HR 和 IT 部门的记录会被保留。

有时，你可能不仅需要去重，还想对数据进行聚合操作（例如计算总数、平均值等）。在这种情况下，DISTINCT 可以与聚合函数一起使用。

如果我们要统计 name 列中不同员工的数量，可以这样做：

SELECT COUNT(DISTINCT name) FROM employees;

结果：

COUNT(DISTINCT name)
3

因为 Alice 在表中有多条记录，但 DISTINCT 会把它们合并为一个唯一记录。

我们还可以去重并计算不同 name 的平均薪资：

SELECT AVG(DISTINCT salary) FROM employees;

结果：

AVG(DISTINCT salary)
6000

在此示例中，DISTINCT 会计算薪资中的唯一值（5000、6000、5500、7000），然后求其平均值。

DISTINCT 去重的是列组合，而不仅仅是单个列。如果多个列组合相同，DISTINCT 会去除重复的行。
性能问题：使用 DISTINCT 时，数据库会对结果集进行排序和去重操作，这可能会影响性能，尤其是在数据量非常大的时候。如果只需要对某些列去重，建议只选择那些必要的列，避免查询中包含不必要的字段。

如果查询数据量较大，且需要去重，可以考虑以下方法来优化性能：

例如：

SELECT DISTINCT name FROM employees;

在这里，如果 name 列上有索引，数据库可以更快速地识别唯一的 name。

DISTINCT 和 ORDER BY 可以结合使用，确保去重后的结果是有序的。

SELECT DISTINCT name FROM employees ORDER BY name;

结果：

这样会去除重复的 name 并按字母顺序对结果排序。

希望这些解释能帮助你更好地理解 SQL 中的去重操作！更多详细内容请关注其他相关文章。