友情支持
如果您觉得这个笔记对您有所帮助,看在D瓜哥码这么多字的辛苦上,请友情支持一下,D瓜哥感激不尽,😜
有些打赏的朋友希望可以加个好友,欢迎关注D 瓜哥的微信公众号,这样就可以通过公众号的回复直接给我发信息。
公众号的微信号是: jikerizhi 。因为众所周知的原因,有时图片加载不出来。 如果图片加载不出来可以直接通过搜索微信号来查找我的公众号。 |
187. 重复的DNA序列
DNA序列 由一系列核苷酸组成,缩写为 A
, C
, G
和 T
.。
-
例如,
ACGAATTCCG
是一个 DNA序列 。
在研究 DNA 时,识别 DNA 中的重复序列非常有用。
给定一个表示 DNA序列 的字符串 s
,返回所有在 DNA 分子中出现不止一次的 长度为 10
的序列(子字符串)。你可以按 任意顺序 返回答案。
示例 1:
输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT" 输出:["AAAAACCCCC","CCCCCAAAAA"]
示例 2:
输入:s = "AAAAAAAAAAAAA" 输出:["AAAAAAAAAA"]
提示:
-
0 <= s.length <= 105
-
s[i] == A、C、G or T
思路分析
最容易想到的方式就是暴力法,从当前位置出发,与从下一个位置出发,逐个比较十个字符,如果都相等,则符合要求。通过 30/31 个测试用例。
看题解,竟然可以直接子串+哈希,优化一下,直接使用 Set
集合来判重。
-
一刷
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
/**
* 使用集合优化
* <p>
* 优化前:暴力法,通过 30/31 个测试用例。
*
* @author D瓜哥 · https://www.diguage.com
* @since 2025-06-29 23:01:27
*/
public List<String> findRepeatedDnaSequences(String s) {
Set<String> dict = new HashSet<>();
Set<String> result = new HashSet<>();
for (int i = 0; i <= s.length() - 10; i++) {
String sub = s.substring(i, i + 10);
if (dict.contains(sub)) {
result.add(sub);
} else {
dict.add(sub);
}
}
return new ArrayList<>(result);
}