C C++算法题解LeetCode1408数组中的字符串匹配

题目描述

题目链接：1408. 数组中的字符串匹配

给你一个字符串数组 words ，数组中的每个字符串都可以看作是一个单词。请你按任意顺序返回 words 中是其他单词的子字符串的所有单词。

如果你可以删除 words[j] 最左侧和/或最右侧的若干字符得到 word[i] ，那么字符串 words[i] 就是 words[j] 的一个子字符串。

提示:

C C++算法题解LeetCode1408数组中的字符串匹配

示例 1：

输入：words = ["mass","as","hero","superhero"]
输出：["as","hero"]
解释："as" 是 "mass" 的子字符串，"hero" 是 "superhero" 的子字符串。
["hero","as"] 也是有效的答案。

示例 2：

输入：words = ["leetcode","et","code"]
输出：["et","code"]
解释："et" 和 "code" 都是 "leetcode" 的子字符串。

示例 3：

输入： words = ["blue","green","bu"]
输出： []

整理题意

题目给定一个字符串数组 words，对于数组中的每个字符串来说，如果该字符串为数组中其他某个字符串的子串，那么就将该字符串加入答案字符串数组。可以按照任意顺序返回该答案数组。

解题思路分析

注意题目的数据提示：题目数据保证每个 words[i] 都是独一无二的。所以不存在两个相同的字符串，也避免了互为子字符串的情况。

根据题目数据范围来看，完全可以采用较为暴力的方法来进行解题，枚举每个字符串作为子串，检查是否为其他某个字符串的子串即可。

优化

在字符串匹配的时候可以采用 KMP 字符串匹配算法来进行优化时间复杂度。

具体实现

对于字符串匹配部分可以调用 string 中的 find() 函数进行匹配 t.find(p)（在字符串 t 中匹配字符串 p，也就是查找字符串 t 中是否包含字符串 p）：

此处需要用到 string 库中的 find() 函数与 string::npos 参数；

string::npos 参数是一个常数，用来表示不存在的位置。

string 中 find() 返回值是子串的第一个字符在母串中的位置（下标记录），如果没有找到，那么会返回一个特别的标记 string::npos。

可以对字符串数组 words 进行排序处理，这样就可以从最短的字符串开始匹配，且每次往后遍历匹配，因为前面的字符串一定短于当前字符串。

在使用 KMP 字符串匹配算法时需要注意：

KMP 字符串匹配算法的核心思想是 递归回溯思想，当匹配失败时根据 nxt 数组来进行回溯跳转；
nxt 数组表示模式串的子串的前缀和后缀相同的最长长度，这样就可以在匹配的过程中如果遇到不匹配的字符，模式串用 nxt 数组进行递归跳转到最长符合的位置进行继续匹配，从而不需要目标串进行重复的往返匹配。
其中需要要注意的一个技巧是 nxt[0] = -1，在把 nxt 数组进行向右偏移时，第 0 位的值，我们将其设成了 -1，这只是为了编程的方便，并没有其他的意义。
还需要注意 nxt 数组的优化，优化后在回溯跳转的时候会回溯跳转到首次与当前字符不一样字符的位置，避免了跳转到和当前字符一样的位置进行重复判断。
在实现 getNext() 函数的时候需要注意 nxt 数组溢出问题，可以通过增加 nxt 数组大小，或减少 getNext() 函数中循环遍历的次数来防止越界出现的运行错误。
需要注意在 getNext() 函数中 j 的初始化为 -1，但在 KMP() 函数中 j 的初始化为 0。

复杂度分析

C C++算法题解LeetCode1408数组中的字符串匹配

代码实现

暴力

class Solution {
public:
    vector<string> stringMatching(vector<string>& words) {
        // 新知识：string::npos
        vector<string> ans;
        ans.clear();
        // 双重循环暴力寻找
        for(auto &word1 : words){
            int l1 = word1.length();
            for(auto &word2 : words){
                int l2 = word2.length();
                // 当 l2 大于 l1 时 并且可以在 w2 中找到 w1 时
                if(l1 < l2 && word2.find(word1) != string::npos){
                    ans.emplace_back(word1);
                    break;
                }
            }
        }
        return ans;
    }
};

暴力 + 优化

class Solution {
public:
    vector<string> stringMatching(vector<string>& words) {
        sort(words.begin(), words.end(), [](string &a, string &b){
            return a.length() < b.length();
        });
        // 新知识：string::npos
        vector<string> ans;
        ans.clear();
        int n = words.size();
        // 双重循环暴力寻找
        for(int i = 0; i < n; i++){
            int l1 = words[i].length();
            for(int j = i + 1; j < n; j++){
                int l2 = words[j].length();
                // 当 l2 大于 l1 时 并且可以在 w2 中找到 w1 时
                if(l1 < l2 && words[j].find(words[i]) != string::npos){
                    ans.emplace_back(words[i]);
                    break;
                }
            }
        }
        return ans;
    }
};

KMP

class Solution {
    void getNext(string &p, vector<int> &nxt){
        // 把PMT进行向右偏移时，第0位的值，我们将其设成了-1，
        // 这只是为了编程的方便，并没有其他的意义。
        nxt[0] = -1;
        int i = 0, j = -1;
        int len = p.length();
        // ★注意 nxt 数组越界
        while(i < len){
            // j = -1 或者 匹配成功
            if(j == -1 || p[i] == p[j]){
                // nxt[++i] = ++j; 未优化前
                i++;
                j++;
                if(p[i] == p[j]) nxt[i] = nxt[j];
                else nxt[i] = j;
            }
            // 匹配失败，回溯
            else{
                j = nxt[j];
            }
        }
    }
    bool kmp(string &t, string &p, vector<int> &nxt){
        // ★注意这里的 j = 0 不是 j = -1
        int i = 0, j = 0;
        int lent = t.length();
        int lenp = p.length();
        while(i < lent && j < lenp){
            if(j == -1 || t[i] == p[j]){
                ++i;
                ++j;
            }
            else j = nxt[j];
        }
        if(j == lenp) return true;
        return false;
    }
public:
    vector<string> stringMatching(vector<string>& words) {
        sort(words.begin(), words.end(), [](string a, string b){
            return a.length() < b.length();
        });
        vector<string> ans;
        ans.clear();
        vector<int> nxt;
        int n = words.size();
        for(int i = 0; i < n; i++){
            int len_p = words[i].length();
            // ★注意 nxt 数组溢出
            // 可以这里 len_p + 1 也可以 getNext 中 -1
            nxt.resize(len_p + 1);
            getNext(words[i], nxt);
            for(int j = i + 1; j < n; j++){
                if(kmp(words[j], words[i], nxt)){
                    ans.emplace_back(words[i]);
                    break;
                }
            }
        }
        return ans;
    }
};

总结

通过该题了解到了一个新的知识点：string::npos 参数用来表示不存在的位置。当 string 中 find() 函数没有匹配成功时，那么就会返回这个参数 string::npos。
同时通过该题复习了 KMP 字符串匹配算法的实现，在实现过程中需要注意 nxt 数组的大小，防止下标越界的运行错误；同时还需要注意在 getNext() 函数中 j 的初始化为 -1，但在 KMP() 函数中 j 的初始化为 0。

测试结果：

C C++算法题解LeetCode1408数组中的字符串匹配

以上就是C C++算法题解LeetCode1408数组中的字符串匹配的详细内容，更多关于C C++算法数组字符串匹配的资料请关注其它相关文章！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

C C++算法题解LeetCode1408数组中的字符串匹配

目录

题目描述

整理题意

解题思路分析

优化

具体实现

复杂度分析

代码实现

暴力

暴力 + 优化

KMP

总结

评论(0)

提示：请文明发言取消回复

作者信息

本站推荐

OpenCV全攻略C++计算机视觉项目实践含源码

何伟元素流瑜伽系统基础师资培训67GB

移动端APP渗透测试（价值199元）网络攻防

Python高级编程实战及应用[前后端开发]

清栀老师AI风景短视频剪辑自学课入门到进阶

阿炳老师·2026Coze平台搭建智能体课程

热门资源

苹果cms海螺影视模板/大橙子模板/仿B站模板/v7模板/带手机移动端+详细安装使用说明

【已测】修复版H5骰子微信竞猜游戏骰宝免公众号版修复登录ID相同完美全套源码对接免签支付

网页游戏卧龙吟一键服务端加远程工具带架设教程

邪风曲单机版 2D回合制网络游戏源码一键安装即玩服务端公益服+GM工具

完整可用版本去水印小程序源码带教程源码

仙侠H5【苍穹剑诀】一键即玩端+授权后台+外网教程

C C++算法题解LeetCode1408数组中的字符串匹配

目录

题目描述

整理题意

解题思路分析

优化

具体实现

复杂度分析

代码实现

暴力

暴力 + 优化

KMP

总结

评论(0)

提示：请文明发言 取消回复

相关文章

作者信息

本站推荐

热门资源

提示：请文明发言取消回复