数组去重的四种方法

admin 2024年08月16日 11:29 12 0

### 数组去重的四种高效方法

在编程中，处理数组时经常需要去除数组中的重复元素，以保持数据的唯一性，数组去重是编程中的一项基础且常见的任务，它广泛应用于数据处理、算法优化等多个领域，本文将详细介绍四种高效的数组去重方法，包括使用JavaScript语言进行演示，但所介绍的概念和技术同样适用于其他编程语言。

#### 一、使用Set数据结构

**方法概述**：

`Set` 是ES6中引入的一种新的数据结构，它类似于数组，但成员的值都是唯一的，没有重复的值，利用这一特性，我们可以轻松地将数组转换为`Set`，自动去除重复项，然后再将`Set`转换回数组。

**代码示例**：

function uniqueArrayUsingSet(arr) {
    return [...new Set(arr)];
}

const arr = [1, 2, 2, 3, 4, 4, 5];
const uniqueArr = uniqueArrayUsingSet(arr);
console.log(uniqueArr); // 输出: [1, 2, 3, 4, 5]

**优点**：

- 代码简洁，易于理解。

- 效率高，特别是对于大数据集。

**缺点**：

- 改变了原始数组的顺序（如果顺序是重要的）。

- 适用于基本数据类型和对象引用（但对象引用去重时，需确保对象内容唯一）。

#### 二、使用Map数据结构（针对对象数组）

当需要处理的对象数组中包含复杂对象时，简单的`Set`去重可能无法满足需求，因为`Set`是基于引用或严格相等（`===`）来判断元素是否重复的，可以使用`Map`数据结构，通过自定义键（如对象的某个唯一属性）来实现去重。

function uniqueArrayUsingMap(arr, key) {
    const map = new Map();
    arr.forEach(item => {
        if (!map.has(item[key])) {
            map.set(item[key], item);
        }
    });
    return Array.from(map.values());
}

const people = [
    { id: 1, name: 'Alice' },
    { id: 2, name: 'Bob' },
    { id: 1, name: 'Alice' } // 重复项
];

const uniquePeople = uniqueArrayUsingMap(people, 'id');
console.log(uniquePeople); // 输出: [{ id: 1, name: 'Alice' }, { id: 2, name: 'Bob' }]

- 适用于对象数组，可以根据对象的某个属性进行去重。

- 保持了原始数组中对象的顺序。

- 需要指定一个唯一键作为去重的依据。

- 如果对象中没有唯一键，则此方法不适用。

#### 三、使用双重循环（或哈希表）

虽然这种方法在效率上不如使用`Set`或`Map`，但在某些特定场景下（如不支持ES6新特性的环境），它仍然是一个可行的选择，通过双重循环遍历数组，使用哈希表（在JavaScript中可以用对象模拟）来记录已经出现过的元素，从而实现去重。

**代码示例（使用哈希表）**：

function uniqueArrayUsingHash(arr) {
    const hash = {};
    const result = [];
    for (let i = 0; i < arr.length; i++) {
        if (!hash[arr[i]]) {
            hash[arr[i]] = true;
            result.push(arr[i]);
        }
    }
    return result;
}

const arr = [1, 2, 2, 3, 4, 4, 5];
const uniqueArr = uniqueArrayUsingHash(arr);
console.log(uniqueArr); // 输出: [1, 2, 3, 4, 5]

- 适用于所有JavaScript环境，无需ES6新特性支持。

- 灵活性强，可以根据需要自定义去重逻辑。

- 效率较低，特别是对于大数据集。

- 代码相对冗长，可读性较差。

#### 四、使用Array.prototype.filter()

`filter()` 方法创建一个新数组，其包含通过所提供函数实现的测试的所有元素，我们可以利用这个方法结合`indexOf()`（或`includes()`，但`indexOf()`在查找元素时效率更高）来实现