您现在的位置是:首页 >技术杂谈 >哈希表题目:数组中重复的数据网站首页技术杂谈
哈希表题目:数组中重复的数据
题目
标题和出处
标题:数组中重复的数据
难度
6 级
题目描述
要求
给你一个长度为 n exttt{n} n 的整数数组 nums exttt{nums} nums,其中 nums exttt{nums} nums 的所有整数都在范围 [1, n] exttt{[1, n]} [1, n] 内,且每个整数出现一次或两次。请你找出所有出现两次的整数,并以数组形式返回。
你必须设计并实现一个时间复杂度为 O(n) exttt{O(n)} O(n) 且仅使用常量额外空间的算法解决此问题。
示例
示例 1:
输入:
nums
=
[4,3,2,7,8,2,3,1]
exttt{nums = [4,3,2,7,8,2,3,1]}
nums = [4,3,2,7,8,2,3,1]
输出:
[2,3]
exttt{[2,3]}
[2,3]
示例 2:
输入:
nums
=
[1,1,2]
exttt{nums = [1,1,2]}
nums = [1,1,2]
输出:
[1]
exttt{[1]}
[1]
示例 3:
输入:
nums
=
[1]
exttt{nums = [1]}
nums = [1]
输出:
[]
exttt{[]}
[]
数据范围
- n = nums.length exttt{n} = exttt{nums.length} n=nums.length
- 1 ≤ n ≤ 10 5 exttt{1} le exttt{n} le exttt{10}^ exttt{5} 1≤n≤105
- 1 ≤ nums[i] ≤ n exttt{1} le exttt{nums[i]} le exttt{n} 1≤nums[i]≤n
- nums exttt{nums} nums 中的每个元素出现一次或两次
解法
思路和算法
这道题要求找出数组 nums extit{nums} nums 中的所有出现两次的整数并返回。常规的做法是使用哈希表存储数组中的整数,遍历数组并将每个整数存入哈希表,如果遍历到一个元素时发现该元素已经在哈希表中,则该元素是出现两次的整数。对于长度为 n n n 的数组,使用哈希表的时间复杂度是 O ( n ) O(n) O(n),符合题目要求,但是空间复杂度是 O ( n ) O(n) O(n),不符合题目要求的常数空间。
为了将空间复杂度降低到常数,不能额外创建哈希表,只能原地修改数组。由于数组 nums extit{nums} nums 的长度是 n n n,下标范围是 [ 0 , n − 1 ] [0, n - 1] [0,n−1],每个元素都在范围 [ 1 , n ] [1, n] [1,n] 内,因此可以将数组看成哈希表,利用数组下标的信息表示每个整数是否出现两次。对于下标 index extit{index} index,满足 0 ≤ index < n 0 le extit{index} < n 0≤index<n, 1 ≤ index + 1 ≤ n 1 le extit{index} + 1 le n 1≤index+1≤n, nums [ index ] extit{nums}[ extit{index}] nums[index] 可以用于表示整数 index + 1 extit{index} + 1 index+1 是否出现两次。
遍历数组 nums extit{nums} nums。对于元素 num extit{num} num,其对应的下标为 index = ∣ num ∣ − 1 extit{index} = | extit{num}| - 1 index=∣num∣−1,根据 nums [ index ] extit{nums}[ extit{index}] nums[index] 的正负性执行如下操作:
-
如果 nums [ index ] > 0 extit{nums}[ extit{index}] > 0 nums[index]>0,则将 nums [ index ] extit{nums}[ extit{index}] nums[index] 的值更新为其相反数;
-
如果 nums [ index ] < 0 extit{nums}[ extit{index}] < 0 nums[index]<0,则 ∣ nums ∣ = index + 1 | extit{nums}| = extit{index} + 1 ∣nums∣=index+1 是出现两次的整数,将其添加到结果中。
上述做法的原理如下:
-
初始时数组 nums extit{nums} nums 中的整数都是正数,表示尚未被访问;
-
当一个整数被访问时,如果该整数对应的下标处的元素是正数,则该整数尚未被访问,因此将该整数对应的下标处的元素改成其相反数,相反数是负数,表示被访问了一次;
-
当一个整数被访问时,如果该整数对应的下标处的元素是负数,则该整数已经被访问,因此该整数被第二次访问,即该整数是出现两次的整数。
需要注意的是,遍历数组 nums extit{nums} nums 的过程中,遍历到的元素 num extit{num} num 可能已经被改成负数,因此在计算下标 index extit{index} index 时需要对 num extit{num} num 取绝对值然后减 1 1 1。
代码
class Solution {
public List<Integer> findDuplicates(int[] nums) {
List<Integer> duplicates = new ArrayList<Integer>();
int n = nums.length;
for (int i = 0; i < n; i++) {
int num = nums[i];
int index = Math.abs(num) - 1;
if (nums[index] > 0) {
nums[index] = -nums[index];
} else {
duplicates.add(index + 1);
}
}
return duplicates;
}
}
复杂度分析
-
时间复杂度: O ( n ) O(n) O(n),其中 n n n 是数组 nums extit{nums} nums 的长度。需要遍历数组 nums extit{nums} nums 一次,对于每个元素的操作时间都是 O ( 1 ) O(1) O(1)。
-
空间复杂度: O ( 1 ) O(1) O(1)。由于是原地修改数组,因此额外使用的空间是常数。注意返回值不计入空间复杂度。