友情支持

如果您觉得这个笔记对您有所帮助,看在D瓜哥码这么多字的辛苦上,请友情支持一下,D瓜哥感激不尽,😜

支付宝

微信

有些打赏的朋友希望可以加个好友,欢迎关注D 瓜哥的微信公众号,这样就可以通过公众号的回复直接给我发信息。

wx jikerizhi

公众号的微信号是: jikerizhi因为众所周知的原因,有时图片加载不出来。 如果图片加载不出来可以直接通过搜索微信号来查找我的公众号。

591. 标签验证器

给定一个表示代码片段的字符串,你需要实现一个验证器来解析这段代码,并返回它是否合法。合法的代码片段需要遵守以下的所有规则:

  1. 代码必须被合法的闭合标签包围。否则,代码是无效的。

  2. 闭合标签(不一定合法)要严格符合格式:<TAG_NAME>TAG_CONTENT</TAG_NAME>。其中,<TAG_NAME> 是起始标签,</TAG_NAME> 是结束标签。起始和结束标签中的 TAG_NAME 应当相同。当且仅当 TAG_NAMETAG_CONTENT 都是合法的,闭合标签才是合法的

  3. 合法的 TAG_NAME 仅含有大写字母,长度在范围 [1,9] 之间。否则,该 TAG_NAME不合法的

  4. 合法的 TAG_CONTENT 可以包含其他合法的闭合标签cdata (请参考规则7)和任意字符(注意参考规则1)除了不匹配的 <、不匹配的起始和结束标签、不匹配的或带有不合法 TAG_NAME 的闭合标签。否则,TAG_CONTENT不合法的

  5. 一个起始标签,如果没有具有相同 TAG_NAME 的结束标签与之匹配,是不合法的。反之亦然。不过,你也需要考虑标签嵌套的问题。

  6. 一个 <,如果你找不到一个后续的 > 与之匹配,是不合法的。并且当你找到一个 <</ 时,所有直到下一个 > 的前的字符,都应当被解析为 TAG_NAME(不一定合法)。

  7. cdata 有如下格式:<![CDATA[CDATA_CONTENT]]>CDATA_CONTENT 的范围被定义成 <![CDATA[后续的第一个 ]]> 之间的字符。

  8. CDATA_CONTENT 可以包含任意字符。cdata 的功能是阻止验证器解析 CDATA_CONTENT,所以即使其中有一些字符可以被解析为标签(无论合法还是不合法),也应该将它们视为常规字符

示例 1:

输入:code = "<DIV>This is the first line <![CDATA[<div>]]></DIV>"
输出:true
解释:
代码被闭合的标签包围:<DIV> 和 </DIV>。
TAG_NAME 是合法的,TAG_CONTENT 只包含一些字母和 cdata。
尽管 CDATA_CONTENT 有一个非法 TAG_NAME 的未匹配开始标签,它可以被认为是普通文本,不被解析为一个标签。
所以 TAG_CONTENT 是合法的,并且代码是合法的。因此返回 true。

示例 2:

输入:code = "<DIV>>>  ![cdata[]] <![CDATA[<div>]>]]>]]>>]</DIV>"
输出:true
解释:
我们首先将代码分割为:start_tag|tag_content|end_tag。
start_tag -> "<DIV>"
end_tag -> "</DIV>"
tag_content 也可以被分割为:text1|cdata|text2。
text1 -> ">>  ![cdata[]] "
cdata -> "<![CDATA[<div>]>]]>",其中 CDATA_CONTENT 是 "<div>]>"
text2 -> "]]>>]"
start_tag 不是 "<DIV>>>" 的原因是规则 6。
cdata 不是 "<![CDATA[<div>]>]]>]]>" 的原因是规则 7。

示例 3:

输入:code = "<A>  <B> </A>   </B>"
输出:false
解释:不平衡。如果 "<A>" 是闭合的,那么 "<B>" 一定没有匹配,反之亦然。

注意:

  1. 1 <= code.length <= 500

  2. code 只包含英文字母、数字、 <>/![]<空格>

思路分析

代码不复杂!就是各种边界条件比较麻烦!

  • 一刷

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
/**
 * @author D瓜哥 · https://www.diguage.com
 * @since 2026-03-27 21:33:39
 */
public boolean isValid(String code) {
  if (code.length() < 7) {
    return false;
  }
  Deque<String> stack = new ArrayDeque<>();
  int length = code.length();
  int index = 0;
  String cStart = "<![CDATA[", cEnd = "]]>";
  while (index < length) {
    if (index > 0 && stack.isEmpty()) {
      return false;
    }
    if (code.charAt(index) == '<') {
      if (code.charAt(index + 1) == '/') {
        // 结束标签
        int end = 0;
        for (int i = index + 2; i < length; i++) {
          char c = code.charAt(i);
          if (c == '>') {
            end = i;
            break;
          }
          if (c < 'A' || 'Z' < c
            || i - index - 1 > 9) {
            return false;
          }
        }
        if (end == 0) {
          return false;
        }
        String endTag = code.substring(index + 2, end);
        if (stack.isEmpty() || !endTag.equals(stack.peek())) {
          return false;
        } else {
          stack.pop();
          index = end + 1;
        }
      } else if (code.indexOf(cStart, index) == index) {
        // CDATA
        int end = code.indexOf(cEnd, index + cStart.length());
        if (end < 0) {
          return false;
        } else {
          index = end + cEnd.length();
        }
      } else {
        // 开始标签
        int end = 0;
        for (int i = index + 1; i < length; i++) {
          char c = code.charAt(i);
          if (c == '>') {
            end = i;
            break;
          }
          if (c < 'A' || 'Z' < c
            || i - index - 1 > 9) {
            return false;
          }
        }
        if (end == 0 || end == index + 1) {
          return false;
        }
        String startTag = code.substring(index + 1, end);
        stack.push(startTag);
        index = end + 1;
      }
    } else {
      index++;
    }
  }
  return stack.isEmpty() && index == length;
}