LeetCode: 187. 重复的DNA序列

友情支持

如果您觉得这个笔记对您有所帮助，看在D瓜哥码这么多字的辛苦上，请友情支持一下，D瓜哥感激不尽，😜

支付宝

有些打赏的朋友希望可以加个好友，欢迎关注D 瓜哥的微信公众号，这样就可以通过公众号的回复直接给我发信息。

wx jikerizhi

公众号的微信号是: jikerizhi。因为众所周知的原因，有时图片加载不出来。如果图片加载不出来可以直接通过搜索微信号来查找我的公众号。

187. 重复的DNA序列

LeetCode - 187. 重复的DNA序列

DNA序列 由一系列核苷酸组成，缩写为 A, C, G 和 T.。

例如，ACGAATTCCG 是一个 DNA序列 。

在研究 DNA 时，识别 DNA 中的重复序列非常有用。

给定一个表示 DNA序列 的字符串 s ，返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。

示例 1：

输入：s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出：["AAAAACCCCC","CCCCCAAAAA"]

示例 2：

输入：s = "AAAAAAAAAAAAA"
输出：["AAAAAAAAAA"]

提示：

0 <= s.length <= 10⁵
s[i] == A、C、G or T

思路分析

最容易想到的方式就是暴力法，从当前位置出发，与从下一个位置出发，逐个比较十个字符，如果都相等，则符合要求。通过 30/31 个测试用例。

看题解，竟然可以直接子串+哈希，优化一下，直接使用 Set 集合来判重。

一刷

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
/**
 * 使用集合优化
 * <p>
 * 优化前：暴力法，通过 30/31 个测试用例。
 *
 * @author D瓜哥 · https://www.diguage.com
 * @since 2025-06-29 23:01:27
 */
public List<String> findRepeatedDnaSequences(String s) {
  Set<String> dict = new HashSet<>();
  Set<String> result = new HashSet<>();
  for (int i = 0; i <= s.length() - 10; i++) {
    String sub = s.substring(i, i + 10);
    if (dict.contains(sub)) {
      result.add(sub);
    } else {
      dict.add(sub);
    }
  }
  return new ArrayList<>(result);
}

LeetCode: 187. 重复的DNA序列

友情支持

187. 重复的DNA序列

思路分析

参考资料