sql中三种去重的方式

admin 2023年12月11日 06:48 30 0

# SQL中三种去重的方式

在SQL中，对重复数据进行处理是常见的需求，这通常是因为我们希望在查询结果中只看到唯一的记录，或者在插入数据时防止重复的记录被插入，我将介绍SQL中的三种去重的方式。

1. 使用DISTINCT关键字

DISTINCT关键字是SQL中最常见的去重方式，它会在查询结果中去除重复的记录，假设我们有一个名为"employees"的表，其中包含"name"和"salary"两列，如果我们想要查询所有员工的名字和工资，但不希望看到重复的名字，我们可以这样使用DISTINCT：

SELECT DISTINCT name, salary FROM employees;

这将返回所有员工的名字和工资，但每个名字只会出现一次。

2. 使用GROUP BY子句

GROUP BY子句可以让我们根据一个或多个列对查询结果进行分组，当我们使用GROUP BY时，我们可以选择在SELECT子句中显示的列，这些列必须是在GROUP BY子句中列出的列或聚合函数，如果我们在GROUP BY子句中使用COUNT函数，那么每个组中的记录数将被计算出来，这也可以达到去重的目的。

SELECT name, COUNT(*) FROM employees GROUP BY name;

这将返回每个员工的名字和对应的记录数，因为我们在GROUP BY子句中使用了COUNT函数，所以每个名字对应的记录数只会显示一次。

3. 使用主键或唯一索引

在插入数据时，如果主键或唯一索引已经存在，大多数数据库系统都会阻止插入重复的记录，在创建表时，可以为每列或几列创建主键或唯一索引，以防止重复的数据被插入。

CREATE TABLE employees (
    id INT PRIMARY KEY,
    name VARCHAR(100),
    salary INT,
    UNIQUE (name)
);

在这个例子中，我们为"name"列创建了一个唯一索引，这意味着我们不能插入具有相同名字的两条记录，如果尝试这样做，数据库将抛出一个错误。

以上就是在SQL中去重的三种方式，使用DISTINCT关键字可以在查询结果中去重，GROUP BY子句可以用来计算每个组的记录数并去重，而主键和唯一索引则可以在插入数据时防止重复的记录被插入，根据具体的需求和场景，我们可以选择合适的方式来达到去重的目的。