友情支持
如果您觉得这个笔记对您有所帮助,看在D瓜哥码这么多字的辛苦上,请友情支持一下,D瓜哥感激不尽,😜
|
|
有些打赏的朋友希望可以加个好友,欢迎关注D 瓜哥的微信公众号,这样就可以通过公众号的回复直接给我发信息。

公众号的微信号是: jikerizhi。因为众所周知的原因,有时图片加载不出来。 如果图片加载不出来可以直接通过搜索微信号来查找我的公众号。 |
591. 标签验证器
给定一个表示代码片段的字符串,你需要实现一个验证器来解析这段代码,并返回它是否合法。合法的代码片段需要遵守以下的所有规则:
-
代码必须被合法的闭合标签包围。否则,代码是无效的。
-
闭合标签(不一定合法)要严格符合格式:
<TAG_NAME>TAG_CONTENT</TAG_NAME>。其中,<TAG_NAME>是起始标签,</TAG_NAME>是结束标签。起始和结束标签中的TAG_NAME应当相同。当且仅当TAG_NAME和TAG_CONTENT都是合法的,闭合标签才是合法的。 -
合法的
TAG_NAME仅含有大写字母,长度在范围 [1,9] 之间。否则,该TAG_NAME是不合法的。 -
合法的
TAG_CONTENT可以包含其他合法的闭合标签,cdata (请参考规则7)和任意字符(注意参考规则1)除了不匹配的<、不匹配的起始和结束标签、不匹配的或带有不合法TAG_NAME的闭合标签。否则,TAG_CONTENT是不合法的。 -
一个起始标签,如果没有具有相同
TAG_NAME的结束标签与之匹配,是不合法的。反之亦然。不过,你也需要考虑标签嵌套的问题。 -
一个
<,如果你找不到一个后续的>与之匹配,是不合法的。并且当你找到一个<或</时,所有直到下一个>的前的字符,都应当被解析为TAG_NAME(不一定合法)。 -
cdata 有如下格式:
<![CDATA[CDATA_CONTENT]]>。CDATA_CONTENT的范围被定义成<![CDATA[和后续的第一个]]>之间的字符。 -
CDATA_CONTENT可以包含任意字符。cdata 的功能是阻止验证器解析CDATA_CONTENT,所以即使其中有一些字符可以被解析为标签(无论合法还是不合法),也应该将它们视为常规字符。
示例 1:
输入:code = "<DIV>This is the first line <![CDATA[<div>]]></DIV>" 输出:true 解释: 代码被闭合的标签包围:<DIV> 和 </DIV>。 TAG_NAME 是合法的,TAG_CONTENT 只包含一些字母和 cdata。 尽管 CDATA_CONTENT 有一个非法 TAG_NAME 的未匹配开始标签,它可以被认为是普通文本,不被解析为一个标签。 所以 TAG_CONTENT 是合法的,并且代码是合法的。因此返回 true。
示例 2:
输入:code = "<DIV>>> ![cdata[]] <![CDATA[<div>]>]]>]]>>]</DIV>" 输出:true 解释: 我们首先将代码分割为:start_tag|tag_content|end_tag。 start_tag -> "<DIV>" end_tag -> "</DIV>" tag_content 也可以被分割为:text1|cdata|text2。 text1 -> ">> ![cdata[]] " cdata -> "<![CDATA[<div>]>]]>",其中 CDATA_CONTENT 是 "<div>]>" text2 -> "]]>>]" start_tag 不是 "<DIV>>>" 的原因是规则 6。 cdata 不是 "<![CDATA[<div>]>]]>]]>" 的原因是规则 7。
示例 3:
输入:code = "<A> <B> </A> </B>" 输出:false 解释:不平衡。如果 "<A>" 是闭合的,那么 "<B>" 一定没有匹配,反之亦然。
注意:
-
1 <= code.length <= 500 -
code 只包含英文字母、数字、
<、>、/、!、[、]和<空格>。
思路分析
代码不复杂!就是各种边界条件比较麻烦!
-
一刷
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
/**
* @author D瓜哥 · https://www.diguage.com
* @since 2026-03-27 21:33:39
*/
public boolean isValid(String code) {
if (code.length() < 7) {
return false;
}
Deque<String> stack = new ArrayDeque<>();
int length = code.length();
int index = 0;
String cStart = "<![CDATA[", cEnd = "]]>";
while (index < length) {
if (index > 0 && stack.isEmpty()) {
return false;
}
if (code.charAt(index) == '<') {
if (code.charAt(index + 1) == '/') {
// 结束标签
int end = 0;
for (int i = index + 2; i < length; i++) {
char c = code.charAt(i);
if (c == '>') {
end = i;
break;
}
if (c < 'A' || 'Z' < c
|| i - index - 1 > 9) {
return false;
}
}
if (end == 0) {
return false;
}
String endTag = code.substring(index + 2, end);
if (stack.isEmpty() || !endTag.equals(stack.peek())) {
return false;
} else {
stack.pop();
index = end + 1;
}
} else if (code.indexOf(cStart, index) == index) {
// CDATA
int end = code.indexOf(cEnd, index + cStart.length());
if (end < 0) {
return false;
} else {
index = end + cEnd.length();
}
} else {
// 开始标签
int end = 0;
for (int i = index + 1; i < length; i++) {
char c = code.charAt(i);
if (c == '>') {
end = i;
break;
}
if (c < 'A' || 'Z' < c
|| i - index - 1 > 9) {
return false;
}
}
if (end == 0 || end == index + 1) {
return false;
}
String startTag = code.substring(index + 1, end);
stack.push(startTag);
index = end + 1;
}
} else {
index++;
}
}
return stack.isEmpty() && index == length;
}

