Java编程实战10:正则表达式匹配
创始人
2024-02-16 18:58:01
0

目录

  • 正则表达式匹配
    • 题目
      • 示例 1
      • 示例 2
      • 示例 3
      • 提示
    • 解答
      • 解题思路
      • 完整代码

正则表达式匹配

题目

给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 ‘.’ 和 ‘*’ 的正则表达式匹配。

‘.’ 匹配任意单个字符
‘*’ 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

示例 1

输入:s = “aa”, p = “a”
输出:false
解释:“a” 无法匹配 “aa” 整个字符串。

示例 2

输入:s = “aa”, p = “a*”
输出:true
解释:因为 ‘*’ 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 ‘a’。因此,字符串 “aa” 可被视为 ‘a’ 重复了一次。

示例 3

输入:s = “ab”, p = “.*”
输出:true
解释:“.*” 表示可匹配零个或多个(‘*’)任意字符(‘.’)。

提示

  • 1 <= s.length <= 20
  • 1 <= p.length <= 30
  • s 只包含从 a-z 的小写字母。
  • p 只包含从 a-z 的小写字母,以及字符 . 和 *。
  • 保证每次出现字符 * 时,前面都匹配到有效的字符

解答

解题思路

题目中的匹配是一个「逐步匹配」的过程:我们每次从字符串 p 中取出一个字符或者「字符 + 星号」的组合,并在 s 中进行匹配。对于 p 中一个字符而言,它只能在 s 中匹配一个字符,匹配的方法具有唯一性;而对于 p 中字符 + 星号的组合而言,它可以在 s 中匹配任意自然数个字符,并不具有唯一性。因此我们可以考虑使用动态规划,对匹配的方案进行枚举。
我们用 f[i][j] 表示 s 的前 i 个字符与 p 中的前 j 个字符是否能够匹配。在进行状态转移时,我们考虑 p 的第 j 个字符的匹配情况:如果 p 的第 j 个字符是一个小写字母,那么我们必须在 s 中匹配一个相同的小写字母,即$ f[i][j] = \begin{cases} f[i - 1][j - 1], & s[i] = p[j]\ \text{false}, & s[i] \neq p[j] \end{cases} 也就是说,如果s的第i个字符与p的第j个字符不相同,那么无法进行匹配;否则我们可以匹配两个字符串的最后一个字符,完整的匹配结果取决于两个字符串前面的部分。如果p的第j个字符是∗,那么就表示我们可以对p的第j−1个字符匹配任意自然数次。在匹配0次的情况下,我们有也就是说,如果 s 的第 i 个字符与 p 的第 j 个字符不相同,那么无法进行匹配;否则我们可以匹配两个字符串的最后一个字符,完整的匹配结果取决于两个字符串前面的部分。 如果 p 的第 j 个字符是 * ,那么就表示我们可以对 p 的第 j-1 个字符匹配任意自然数次。在匹配 0 次的情况下,我们有也就是说,如果s的第i个字符与p的第j个字符不相同,那么无法进行匹配;否则我们可以匹配两个字符串的最后一个字符,完整的匹配结果取决于两个字符串前面的部分。如果p的第j个字符是∗,那么就表示我们可以对p的第j−1个字符匹配任意自然数次。在匹配0次的情况下,我们有 f[i][j] = f[i][j - 2] 也就是我们「浪费」了一个字符+星号的组合,没有匹配任何s中的字符。在匹配1,2,3,⋯次的情况下,类似地我们有也就是我们「浪费」了一个字符 + 星号的组合,没有匹配任何 s 中的字符。在匹配 1,2,3, \cdots 次的情况下,类似地我们有也就是我们「浪费」了一个字符+星号的组合,没有匹配任何s中的字符。在匹配1,2,3,⋯次的情况下,类似地我们有 \begin{aligned} & f[i][j] = f[i - 1][j - 2], \quad && \text{if~} s[i] = p[j - 1] \ & f[i][j] = f[i - 2][j - 2], \quad && \text{if~} s[i - 1] = s[i] = p[j - 1] \ & f[i][j] = f[i - 3][j - 2], \quad && \text{if~} s[i - 2] = s[i - 1] = s[i] = p[j - 1] \ & \cdots\cdots & \end{aligned} 如果我们通过这种方法进行转移,那么我们就需要枚举这个组合到底匹配了s中的几个字符,会增导致时间复杂度增加,并且代码编写起来十分麻烦。我们不妨换个角度考虑这个问题:字母+星号的组合在匹配的过程中,本质上只会有两种情况:匹配s末尾的一个字符,将该字符扔掉,而该组合还可以继续进行匹配;不匹配字符,将该组合扔掉,不再进行匹配。如果按照这个角度进行思考,我们可以写出很精巧的状态转移方程:如果我们通过这种方法进行转移,那么我们就需要枚举这个组合到底匹配了 s 中的几个字符,会增导致时间复杂度增加,并且代码编写起来十分麻烦。我们不妨换个角度考虑这个问题:字母 + 星号的组合在匹配的过程中,本质上只会有两种情况:匹配 s 末尾的一个字符,将该字符扔掉,而该组合还可以继续进行匹配; 不匹配字符,将该组合扔掉,不再进行匹配。如果按照这个角度进行思考,我们可以写出很精巧的状态转移方程:如果我们通过这种方法进行转移,那么我们就需要枚举这个组合到底匹配了s中的几个字符,会增导致时间复杂度增加,并且代码编写起来十分麻烦。我们不妨换个角度考虑这个问题:字母+星号的组合在匹配的过程中,本质上只会有两种情况:匹配s末尾的一个字符,将该字符扔掉,而该组合还可以继续进行匹配;不匹配字符,将该组合扔掉,不再进行匹配。如果按照这个角度进行思考,我们可以写出很精巧的状态转移方程: f[i][j] = \begin{cases} f[i - 1][j] \text{or} f[i][j - 2], & s[i] = p[j - 1] \ f[i][j - 2], & s[i] \neq p[j - 1] \end{cases} $ 在任意情况下,只要 p[j] 是 . ,那么 p[j] 一定成功匹配 s 中的任意一个小写字母。
最终的状态转移方程如下:
f[i][j] = \begin{cases} \text{if~} (p[j] \neq \text{~`'}) = \begin{cases} f[i - 1][j - 1], & \textit{matches}(s[i], p[j])\ \text{false}, & \text{otherwise} \end{cases} \ \text{otherwise} = \begin{cases} f[i - 1][j] \text{or} f[i][j - 2], & \textit{matches}(s[i], p[j-1]) \ f[i][j - 2], & \text{otherwise} \end{cases} \end{cases}
其中 \textit{matches}(x, y) 判断两个字符是否匹配的辅助函数。只有当 y 是 . 或者 x 和 y 本身相同时,这两个字符才会匹配。
动态规划的边界条件为 f[0][0] = \text{true},即两个空字符串是可以匹配的。最终的答案即为 f[m][n],其中 m 和 n 分别是字符串 s 和 p 的长度。由于大部分语言中,字符串的字符下标是从 0 开始的,因此在实现上面的状态转移方程时,需要注意状态中每一维下标与实际字符下标的对应关系。
在上面的状态转移方程中,如果字符串 p 中包含一个「字符 + 星号」的组合(例如 a
),那么在进行状态转移时,会先将 a 进行匹配(当 p[j] 为 a 时),再将 a* 作为整体进行匹配(当 p[j] 为 * 时)。然而,在题目描述中,我们必须将 a* 看成一个整体,因此将 a 进行匹配是不符合题目要求的。看来我们进行了额外的状态转移,这样会对最终的答案产生影响吗?这个问题留给读者进行思考。

完整代码

class Solution {public boolean isMatch(String s, String p) {int m = s.length();int n = p.length();boolean[][] f = new boolean[m + 1][n + 1];f[0][0] = true;for (int i = 0; i <= m; ++i) {for (int j = 1; j <= n; ++j) {if (p.charAt(j - 1) == '*') {f[i][j] = f[i][j - 2];if (matches(s, p, i, j - 1)) {f[i][j] = f[i][j] || f[i - 1][j];}} else {if (matches(s, p, i, j)) {f[i][j] = f[i - 1][j - 1];}}}}return f[m][n];}public boolean matches(String s, String p, int i, int j) {if (i == 0) {return false;}if (p.charAt(j - 1) == '.') {return true;}return s.charAt(i - 1) == p.charAt(j - 1);}
}

相关内容

热门资讯

原创 私... 西安雁塔警方通报查处一家提供“异性陪侍”的私人影院,经营者被刑拘,陪侍人员被行拘。这背后,为何处理结...
天玑科技及相关责任人因涉嫌串通... 12月22日,天玑科技(300245.SZ)发布公告,公司近期收到上海市虹口区人民检察院送达的《起诉...
「期刊文摘」 蔡昉:人工智能时... 蔡昉:人工智能时代的社会保障,理念更新与制度建设 期刊文摘 ★★★★★ 一、引言 人们惊叹于近年来人...
千万人受益 详解信用修复政策 个人信用修复政策重磅落地。12月22日,中国人民银行发布一次性信用修复政策:符合相关条件的逾期信息,...
“祥源系”爆雷后,“浙商大佬”... 22日晚间,交建股份、祥源文旅双双发布公告称,公司于2025年12月22日收到公司实际控制人俞发祥家...
涉嫌串通投标!天玑科技及相关责... 天玑科技12月22日晚间公告,公司于近日收到上海市虹口区人民检察院送达的《起诉书》,上海市虹口区人民...
深圳龙华举行法律援助志愿律师首... 为进一步提升法律援助服务质量,加强法律援助志愿律师队伍建设,12月17日下午,龙华区司法局组织开展了...
(图表)十年来全国检察机关共办... 新华社图表,北京,2025年12月22日 记者从最高人民法院、最高人民检察院12月22日举行的发布...
反思独居蒋女士离世事件:补齐制... 家住上海虹口区的46岁独居人士蒋女士,12月14日因病离世,但她的遗产不能用来购买墓地,引发舆论广泛...
俄副外长:保证不进攻欧盟北约,... 【文/观察者网 柳白】 据俄新社报道,当地时间12月22日,俄罗斯外交部副部长谢尔盖·里亚布科夫在...