当前位置:   article > 正文

KMP算法 与 字符串哈希_kmp如何用字符串哈希做

kmp如何用字符串哈希做

基础 kmp

KMP算法用于在线性时间复杂度内寻找字符串中是否含有某个子串的情况

本质上是通过移动待查询子串的相对位置来寻找是否有该子串, 移动的方式则通过Next数组来记录

Next数组中记录的是最大相同前后缀的长度

视频: 最浅显易懂的 KMP 算法讲解_哔哩哔哩_bilibili

KMP寻找所有匹配区间

  1. int f[N + 10];
  2. //预处理
  3. void getfill(string s) {
  4. memset(f, 0, sizeof(f));
  5. for (int i = 1; i < s.length(); i++){
  6. int j = f[i];
  7. while (j && s[i] != s[j])
  8. j = f[j];
  9. f[i + 1] = (s[i] == s[j]) ? j + 1 : 0;
  10. }
  11. }
  12. //记录所有匹配区间 [指在长串中的下标,下标从0开始]
  13. struct Interval{
  14. int l, r;
  15. }q[N];
  16. //记录匹配次数
  17. int t;
  18. //找到并记录所有的匹配区间, a长 s短
  19. void findinterval(string a, string s){
  20. getfill(s);
  21. int j = 0;
  22. t = 0;
  23. for (int i = 0; i < a.length(); ++i){
  24. while (j && a[i] != s[j])
  25. j = f[j];
  26. if (a[i] == s[j])
  27. j++;
  28. if (j == s.length()){
  29. t++;
  30. q[t].l = i - s.length() + 1;
  31. q[t].r = i;
  32. }
  33. }
  34. }

拓展 kmp (待补充)

字符串哈希

通过一个哈希值来表示整个字符串的方法

求哈希值需要两个素数 base 和 mod , 一般 base < mod , 尽量取大

一般 base == 131 , mod == 19260817 或 1e9+7 即可

对一段标记为 s == x1x2x3...xn 的字符串, 有如下公式

单哈希公式

hash[i]=(hash[i-1]*base + F(s[i]))\%mod

其中 F(s[i]) 表示字符串中第 i 个字符所映射到的数值, 例如 'a' 映射到 1 , 'z' 映射到 26

求某段子串的哈希值

res = ((hash[r] - hash[l-1]*base^{r-l+1})\%mod+mod)\%mod

base 幂的地方一般先预处理一遍

实例代码如下

  1. ll base = 131;
  2. ll mod = 1e11+7;
  3. ll has[N];
  4. ll p[N];
  5. void init()
  6. {
  7. p[0] = 1;
  8. for (ll i = 1; i < N; i++)
  9. {
  10. p[i] = p[i - 1] * base;
  11. }
  12. }
  13. ll hashs(string s)
  14. {
  15. has[0] = 0;
  16. for (ll i = 0; i < s.length(); i++) //配合string的下标表示
  17. {
  18. has[i+1] = (has[i] * base + (s[i] - 'a' + 1)) % mod;
  19. }
  20. return has[s.length()];
  21. }
  22. ll gethas(ll l, ll r)
  23. {
  24. return ((has[r] - has[l - 1] * p[r - l + 1]) % mod + mod) % mod;
  25. }

二维哈希

与双哈希并非一个意思, 双哈希用于进一步降低哈希冲突的概率, 而二维哈希是用于解决矩阵性质的问题

原理与一维哈希类似, 通过先对每一行横向求哈希值, 在此哈希表的基础上再对每一列纵向求哈希值, 由此得到一个哈希阵列, 因此二维哈希需要两个base, 也同样需要两次预处理

二维哈希公式

has[i][j] = has[i][j - 1] * base1 + F(M[i][j])

has[i][j] = has[i-1][j] * base2 + F(M[i][j])

求子矩阵 (a, b) * (x, y) 的哈希值                (a <= x, b <= y)

res = hash[x][y] - hash[x][b-1]*base_{1}^{y-b+1} - hash[a-1][y]*base_{2}{}^{x-a+1} + hash[a-1][b-1]*base_{1}^{y-b+1}*base_{2}{}^{x-a+1}

实例代码如下

  1. ll hashs(ll x, ll y)
  2. {
  3. has[0][0] = 0;
  4. for(ll i = 1; i<N;i++)
  5. {
  6. has[0][i] = 0;
  7. has[i][0] = 0;
  8. }
  9. for (ll i = 1; i <= x; i++)
  10. {
  11. for (ll j = 1; j <= y; j++)
  12. {
  13. has[i][j] = (has[i][j - 1] * base1 + (M[i][j] - 'a' + 1));
  14. }
  15. }
  16. for (ll j = 1; j <= y; j++)
  17. {
  18. for (ll i = 1; i <= x; i++)
  19. {
  20. has[i][j] = (has[i - 1][j] * base2 + has[i][j]);
  21. }
  22. }
  23. return has[x][y];
  24. }
  25. ll gethas(ll a, ll b, ll x, ll y)
  26. {
  27. return has[x][y] - has[x][b - 1] * p1[y - b + 1] - has[a - 1][y] * p2[x - a + 1] + has[a - 1][b - 1] * p1[y - b + 1] * p2[x - a + 1];
  28. }

本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/黑客灵魂/article/detail/900886
推荐阅读
相关标签
  

闽ICP备14008679号