字符串相似算法-tft每日頭條

字符串相似算法

科技更新时间:2026-07-31 08:52:47

字符串相似算法（什麼是字符串匹配算法）1

作者 | 程序員小灰

本文經授權轉載自程序員小灰（ID：chengxuyuanxiaohui ）

責編 | 胡巍巍

字符串相似算法（什麼是字符串匹配算法）2

字符串相似算法（什麼是字符串匹配算法）3

————— 第二天 —————

字符串相似算法（什麼是字符串匹配算法）4

字符串相似算法（什麼是字符串匹配算法）5

字符串相似算法（什麼是字符串匹配算法）6

什麼意思呢？讓我們來舉一個例子：

字符串相似算法（什麼是字符串匹配算法）7

在上圖中，字符串B是A的子串，

B第一次在A中出現的位置下标是2（字符串的首位下标是0），

所以返回 2。

我們再看另一個例子：

字符串相似算法（什麼是字符串匹配算法）8

在上圖中，字符串B在A中并不存在，

所以返回 -1。

為了統一概念，

在後文中，

我們把字符串A稱為主串，

把字符串B稱為模式串。

字符串相似算法（什麼是字符串匹配算法）9

字符串相似算法（什麼是字符串匹配算法）10

小灰的想法簡單粗暴，

讓我們用下面的例子來演示一下：

第一輪，我們從主串的首位開始，

把主串和模式串的字符逐個比較：

字符串相似算法（什麼是字符串匹配算法）11

顯然，主串的首位字符是a，

模式串的首位字符是b，兩者并不匹配。

第二輪，我們把模式串後移一位，

從主串的第二位開始，

把主串和模式串的字符逐個比較：

字符串相似算法（什麼是字符串匹配算法）12

主串的第二位字符是b，

模式串的第二位字符也是b，

兩者匹配，繼續比較：

字符串相似算法（什麼是字符串匹配算法）13

主串的第三位字符是b，

模式串的第三位字符也是c，

兩者并不匹配。

第三輪，我們把模式串再次後移一位，

從主串的第三位開始，

把主串和模式串的字符逐個比較：

字符串相似算法（什麼是字符串匹配算法）14

主串的第三位字符是b，

模式串的第三位字符也是b，

兩者匹配，繼續比較：

字符串相似算法（什麼是字符串匹配算法）15

主串的第四位字符是c，

模式串的第四位字符也是c，

兩者匹配，繼續比較：

字符串相似算法（什麼是字符串匹配算法）16

主串的第五位字符是e，

模式串的第五位字符也是e，

兩者匹配，比較完成！

由此得到結果，

模式串 bce 是主串 abbcefgh 的子串，

在主串第一次出現的位置下标是 2：

字符串相似算法（什麼是字符串匹配算法）17

以上就是小灰想出的解決方案，

這個算法有一個名字，叫做BF算法，

是Brute Force（暴力算法）的縮寫。

字符串相似算法（什麼是字符串匹配算法）18

字符串相似算法（什麼是字符串匹配算法）19

字符串相似算法（什麼是字符串匹配算法）20

上圖的情況，在每一輪進行字符匹配時，

模式串的前三個字符a都和主串中的字符相匹配，

一直檢查到模式串最後一個字符b，才發現不匹配：

字符串相似算法（什麼是字符串匹配算法）21

這樣一來，

兩個字符串在每一輪都需要白白比較4次，

顯然非常浪費。

假設主串的長度是m，

模式串的長度是n，

那麼在這種極端情況下，

BF算法的最壞時間複雜度是O（mn）。

字符串相似算法（什麼是字符串匹配算法）22

字符串相似算法（什麼是字符串匹配算法）23

字符串相似算法（什麼是字符串匹配算法）24

字符串相似算法（什麼是字符串匹配算法）25

————————————

字符串相似算法（什麼是字符串匹配算法）26

字符串相似算法（什麼是字符串匹配算法）27

字符串相似算法（什麼是字符串匹配算法）28

字符串相似算法（什麼是字符串匹配算法）29

字符串相似算法（什麼是字符串匹配算法）30

字符串相似算法（什麼是字符串匹配算法）31

字符串相似算法（什麼是字符串匹配算法）32

比較哈希值是什麼意思呢？

用過哈希表的朋友們都知道，

每一個字符串都可以通過某種哈希算法，

轉換成一個整型數，

這個整型數就是hashcode：

hashcode = hash（string）

顯然，相對于逐個字符比較兩個字符串，

僅比較兩個字符串的hashcode要容易得多。

字符串相似算法（什麼是字符串匹配算法）33

字符串相似算法（什麼是字符串匹配算法）34

給定主串和模式串如下

（假定字符串隻包含26個小寫字母）：

字符串相似算法（什麼是字符串匹配算法）35

第一步，

我們需要生成模式串的hashcode。

生成hashcode的算法多種多樣，比如：

按位相加

這是最簡單的方法，

我們可以把a當做1，b當做2，c當做3......

然後把字符串的所有字符相加，

相加結果就是它的hashcode。

bce = 2 3 5 = 10

但是，這個算法雖然簡單，

卻很可能産生hash沖突，

比如bce、bec、cbe的hashcode是一樣的。

轉換成26進制數

既然字符串隻包含26個小寫字母，

那麼我們可以把每一個字符串當成一個26進制數來計算。

bce = 2*(26^2) 3*26 5 = 1435

這樣做的好處是大幅減少了hash沖突，

缺點是計算量較大，

而且有可能出現超出整型範圍的情況，

需要對計算結果進行取模。

為了方便演示，

後續我們采用的是按位相加的hash算法，

所以bce的hashcode是10：

字符串相似算法（什麼是字符串匹配算法）36

第二步，

生成主串當中第一個等長子串的hashcode。

由于主串通常要長于模式串，

把整個主串轉化成hashcode是沒有意義的，

隻有比較主串當中和模式串等長的子串才有意義。

因此，

我們首先生成主串中第一個和模式串等長的子串hashcode，

即abb = 1 2 2 = 5：

字符串相似算法（什麼是字符串匹配算法）37

第三步，比較兩個hashcode。

顯然，5！=10，

說明模式串和第一個子串不匹配，

我們繼續下一輪比較。

第四步，

生成主串當中第二個等長子串的hashcode。

bbc = 2 2 3 = 7：

字符串相似算法（什麼是字符串匹配算法）38

第五步，比較兩個hashcode。

顯然，7！=10，說明模式串和第二個子串不匹配，

我們繼續下一輪比較。

第六步，生成主串當中第三個等長子串的hashcode。

bce= 2 3 5 = 10：

字符串相似算法（什麼是字符串匹配算法）39

第七步，比較兩個hashcode。

顯然，10 ==10，兩個hash值相等！

這是否說明兩個字符串也相等呢？

别高興的太早，

由于存在hash沖突的可能，

我們還需要進一步驗證。

第八步，逐個字符比較兩字符串。

hashcode的比較隻是初步驗證，

之後我們還需要像BF算法那樣，

對兩個字符串逐個字符比較，

最終判斷出兩個字符串匹配。

字符串相似算法（什麼是字符串匹配算法）40

最後得出結論，

模式串bce是主串abbcefgh的子串，

第一次出現的下标是2。

字符串相似算法（什麼是字符串匹配算法）41

字符串相似算法（什麼是字符串匹配算法）42

什麼意思呢？讓我們再來看一個例子：

字符串相似算法（什麼是字符串匹配算法）43

上圖中，

我已知子串abbcefg的hashcode是26，

那麼如何計算下一個子串，

也就是bbcefgd的hashcode呢？

字符串相似算法（什麼是字符串匹配算法）44

我們沒有必要把子串的字符重新進行累加運算，

而是可以采用一個更簡單的方法。

由于新子串的前面少了一個a，

後面多了一個d，所以：

新hashcode = 舊hashcode - 1 4 = 26-1 4 = 29

再下一個子串bcefgde的計算也是同理：

新hashcode = 舊hashcode - 2 5 = 29-2 5 = 32

字符串相似算法（什麼是字符串匹配算法）45

字符串相似算法（什麼是字符串匹配算法）46

public static int rabinKarp(String str, String pattern){//主串長度int m = str.length();//模式串的長度int n = pattern.length();//計算模式串的hash值int patternCode = hash(pattern);//計算主串當中第一個和模式串等長的子串hash值int strCode = hash(str.substring(0, n));//用模式串的hash值和主串的局部hash值比較。//如果匹配，則進行精确比較；如果不匹配，計算主串中相鄰子串的hash值。for (int i=0; i<m-n 1; i ) {if(strCode == patternCode && compareString(i, str, pattern)){return i;}//如果不是最後一輪，更新主串從i到i n的hash值if(i<m-n){strCode = nextHash(str, strCode, i, n);}}return -1;}private static int hash(String str){int hashcode = 0;//這裡采用最簡單的hashcode計算方式：//把a當做1，把b當中2，把c當中3.....然後按位相加for (int i = 0; i < str.length(); i ) {hashcode = str.charAt(i)-'a';}return hashcode;}private static int nextHash(String str, int hash, int index, int n){hash -= str.charAt(index)-'a';hash = str.charAt(index n)-'a';return hash;}private static boolean compareString(int i, String str, String pattern) {String strSub = str.substring(i, i pattern.length());return strSub.equals(pattern);}public static void main(String[] args) {String str = "aacdesadsdfer";String pattern = "adsd";System.out.println("第一次出現的位置:" rabinKarp(str, pattern));}

字符串相似算法（什麼是字符串匹配算法）47

字符串相似算法（什麼是字符串匹配算法）48

字符串相似算法（什麼是字符串匹配算法）49

字符串相似算法（什麼是字符串匹配算法）50

字符串相似算法（什麼是字符串匹配算法）51

字符串相似算法（什麼是字符串匹配算法）52

字符串相似算法（什麼是字符串匹配算法）53

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技 mac用什麼rar壓縮軟件
在衆多Mac壓縮軟件中，免費又好用的壓縮軟件真是少之又少。而今天推薦的這款軟件——FastZIP，簡直是壓縮軟件界的一股清流。想在macOS上打開一個壓縮文件，有原生的歸檔實用工具或BetterZip、Keka、TheUnarchiver等... 2022-11-28
科技監控專用硬盤有哪些品牌
随着科技的發展，現在監控系統越來越發達，價格也越來越親民。不管是大型企業、學校還是企事業單位，監控已經成了必需品。而企業級監控數據量大，穩定性要求高，對存儲的要求也就更高。尤其是企業監控，一定要使用容量更大、穩定性更高的專業監控硬盤來存儲數... 2023-02-01
科技 oppo手機如何快閃
oppo手機如何快閃?在設置--常規--應用程序/程序管理--全部，找到閃退的遊戲--清除數據試試，今天小編就來聊一聊關于oppo手機如何快閃?接下來我們就一起去研究一下吧!oppo手機如何快閃在設置--常規--應用程序/程序管理--全部，... 2022-06-02
科技抖音最火短如何制作
抖音短視頻如何制作？那些抖音上百萬點贊的短視頻，都是怎麼制作的，有沒有最火的短視頻教程分享？當然有！其實，那些爆款視頻，都借助了第三方短視頻制作軟件！格格最近就發現了一款風頭最熱的短視頻制作軟件！短視頻制作教程它集齊抖音最火卡點模闆、短視頻... 2023-01-12
科技總強制關機對電腦的影響
說到“長按電源鍵強制關機”的操作，想必大家都不會陌生，畢竟在電腦卡死的時候，我們總是束手無策。而且，身邊的人在遇到同樣的情況時，往往都是選擇長按電源鍵強制關機，所以當我們遇到同樣的情況時，也會不自覺的使用同樣的做法！但是，也有很多人說強制關... 2022-12-17
科技十大好玩的網遊推薦手機
第一《誅仙》評價：雖然是完美出品，總的來說在國内也是一部良作，但是坑爹的強化系統，小編已經無法用詞語來表達，就算是沖到9999，也不能保證全裝備強到滿級，失敗一次掉5級，試問“誰的心髒受得了”。第二《王者榮耀》評價：moba手遊中的典型快餐... 2022-11-28
科技小米10手機降價了嗎
IT之家6月3日消息618期間，小米10手機标準版出現大降價，官方标配降200元，小米10手機8GB256GB京東再降價375元，另外大家還可以領取滿1000元減50元的小米手機專享優惠券，最終小米10手機售價3374元，享白條24期免息。... 2023-02-03
科技華為手機呼叫限制怎麼解除
華為手機呼叫限制怎麼解除?首先在手機上找到并打開【設置】的軟件圖标，然後繼續點擊頁面下方“電話”，今天小編就來說說關于華為手機呼叫限制怎麼解除?下面更多詳細答案一起來看看吧!華為手機呼叫限制怎麼解除首先在手機上找到并打開【設置】的軟件圖标，... 2022-06-09
科技 windows的哪個系統比較好
更多科技互聯網趣聞，歡迎點擊右上角關注我~彼時電腦還是一件價格昂貴的奢侈品，彼時我們用電腦還帶着一些屬于那個年代的儀式感，走進機房時還要穿上一雙藍色的鞋套。相信差友們第一次接觸電腦，接觸Window這個系統。不是在學校幹淨整潔的計算機教室，... 2022-12-02
科技華為手環手表怎麼設置
1.1.華為手表/手環配對安卓手機1、手表開機後選擇語言，點擊進入二維碼頁面（增加手表選擇語言，首頁，二維碼顯示圖片）2、手機安裝華為運動健康應用。（1）若未安裝應用：手機掃描穿戴設備側二維碼安裝華為運動健康應用。（2）若已安裝應用：請進入... 2023-02-24
科技怎樣讓手機進入刷機狀态
怎樣讓手機進入刷機狀态?嗨，大家好，我是大海，歡迎大家來欣賞我的文章，我每天給大家分享手機實用技巧，現在是網絡時代，信息時代，每個人都離不開手機，無論是哪一種生活方式的人，每一個階段的人來說都是非常重要的，現在是手機時代，人人都離不開手機，... 2022-11-28
科技王者榮耀體驗服如何有标
王者榮耀11月18日體驗服更新，這一次除了明世隐、後羿上線之外，也有英雄劉邦、大喬增強，裝備不死鳥之眼、冷靜之靴增強，而複活甲則被大削，被動改為隻能複活兩次。另外一部分就是本文所說的優化内容，訓練營界面大改，局内文字檢測系統上線，罵人會被檢... 2023-02-13
科技人社部能查到的證書是正規的嗎
人社部能查到的證書是正規的嗎?近日，人力資源和社會保障部在其門戶網站開設“職業資格和職業技能等級認定證書查詢”專欄，公布了20個專業技術人員職業資格證書查詢網站和技能人才評價證書全國聯網查詢系統，接下來我們就來聊聊關于人社部能查到的證書是正... 2022-10-18
科技電熱水器怎麼選大容量
“我家人多，要買一個大點的電熱水器。”很多人都是這樣想的，但另一個問題又出現了：同樣是60L的電熱水器（60L是最常見的電熱水器容量），為什麼有的人夠用，有的人就不夠用呢？或者同一個人，為什麼這台熱水器就夠用，換了一台新的就不夠了呢？夠用和... 2023-01-01
科技拳皇97有大部分角色的版本
拳皇97一款定制版格鬥遊戲，還原經典格鬥風味您可以選擇免費的草薙京、八神庵等着名角色，還可以進入暴走狀态，在有限的時間内可以展開一場PVE或者PVP，使用藍牙就能聯機免費對戰了，重溫像素風格，來一場熱血對決吧，修改内置金手指和支持存檔！, 2022-12-09
科技華為官網哪些機型不帶充電器
從今年年初開始，不少華為手機粉絲們都在期待華為P50系列旗艦的消息，因為這代表着希望，隻要華為公司宣布了華為P50系列旗艦的存在，那麼就意味着華為公司還有多的處理器，相反如果華為P50未能出現，那麼也代表了華為公司真的非常缺芯片，然而可惜的... 2023-01-17
科技 dnf110版本裝備強化概率
dnf110版本裝備強化概率?韓服在110版本送出了“安全強化系統”，那麼這個系統的材料和金币消耗巨大，但是概率如何呢？1112的時候，基礎概率隻有3%，每失敗一次增加1%，直接加算的小狐狸君直接上結論吧：就是官方回收金币的陰謀罷了和那個希... 2022-10-05
科技 oppok9s手機什麼時候發布
性能是看不見摸不着的數據，但是它又能被明顯感知到，比如一台設備的流暢性，絕大部分是由性能的高低決定的。同時，性能的提升不僅影響到手機的流暢度，還會對手機的續航、拍照等功能産生作用。毫無疑問的是，目前Android手機和iPhone的性能差距... 2022-12-03
科技開學第一課科技的重要性
開學第一課科技的重要性?香城都市報訊（記者漆兵趙忠志劉震毛亞軒）昨日下午，由市科協、市教育局聯合主辦的2022年鹹甯市全國科普日專題活動——開學科普季在鹹甯香城學校開課本次科普課堂采取線上直播線下授課的方式同步進行，邀請全國優秀教師、湖北省... 2023-01-20
科技用手機下載歌曲到u盤怎麼下載
用手機下載歌曲到u盤怎麼下載?首先準備一個有手機插口的優盤，然後下載歌曲到手機，在手機上插入優盤，我來為大家科普一下關于用手機下載歌曲到u盤怎麼下載?下面希望有你要的答案，我們一起來看看吧!用手機下載歌曲到u盤怎麼下載首先準備一個有手機插口... 2022-06-02
科技初中孩子經常玩手機怎麼辦
初中孩子經常玩手機怎麼辦?家長要以身作則家長在孩子面前也不可經常玩手機，給孩子一個好的榜樣和家庭氛圍，現在小編就來說說關于初中孩子經常玩手機怎麼辦?下面内容希望能幫助到你，我們來一起看看吧!初中孩子經常玩手機怎麼辦家長要以身作則家長在孩子面... 2022-06-19
科技手機話費被亂扣怎麼辦
說起手機亂扣費現象，令廣大人民感到痛恨，據統計近幾年，像這樣的事情可以說屢見不鮮。前不久央視新聞報道：有一位曹先生，平時手機通訊費比較高，因為做生意，業務電話不少，所以一直也沒怎麼注意話費。不久前，他查了一下自己的通訊費用詳單，結果讓他氣不... 2023-03-29
科技倉庫管理有哪些軟件
倉庫管理軟件在企業應用當中，可以說是現象級的存在。因倉庫管理軟件的輕量化和應用廣泛等特點，對于有庫存商品的中小企業來說，應用企業管理軟件，首先想到的就是倉庫管理軟件的應用。那麼市場上主流的倉庫管理軟件哪個品牌好呢？下面，小編就選取了市場上四... 2023-01-14
科技能加速谷歌浏覽器的手機軟件
谷歌浏覽器app官方版也叫GoogleChrome，這是一款非常好用的手機浏覽器軟件，它不僅在桌面設備上表現卓越，在Android手機和平闆電腦上也可讓你暢享快速流暢的浏覽體驗。同時該軟件将簡約的界面設計與先進的技術進行了相互的融合，用戶通... 2022-11-10
科技電腦免費數據恢複軟件哪款好用
電腦已經是我們日常工作學習不可或缺的工具之一，電腦的操作系統使用時間長了後運行速度就會越來越慢。這是因為我們在系統裡安裝的軟件越來越多，産生了許多臨時數據和垃圾文件等，這些都會影響操作系統的運行速度；有時系統還會出現突然崩潰的情況。當電腦出... 2023-01-09
科技愛奇藝電視果好不好用
Hello大家好，我是Lewis今天給大家帶來的是[愛奇藝電視果5SPlus奇異果特别版]這款産品的衆測。經過了約一周的上手體驗，今天給大家帶來這款産品的深度測評。「開箱回顧」ZEALER&Zaaap!精緻包裝環繞展示一圈包裝清單電視果主機... 2023-01-09
科技北鬥跟gps對比
衆所周知，如今中國的發展令很多西方發達國家都羨慕不已，而我們的發展也是非常均衡的，我們在經濟、科技和軍事等領域都得到了很好的發展，而我們的發展走的，卻不是向西方靠着殖民，掠奪資源勞動力來發展自己國家，而是通過自身的努力，一步步的走到了今天！... 2022-11-26
科技 pc端抖音有什麼操作
像以往，如果我們想要在PC端刷抖音的話，最開始隻能靠安卓模拟器裝上抖音安卓版，不過安卓模拟器對電腦硬件有一定要求，否則會比較卡頓，另外你隻能用鼠标左鍵按住上下切換，并沒有在手機上用手指上下滑動那麼便捷，體驗感其實是比較差的。當然了，在這兩年... 2022-11-06
科技華為mate40到底是麒麟還是海思
華為作為國産手機的驕傲，我覺得其最大的特色就是自研的麒麟處理器和鴻蒙系統，但是由于制程受限，麒麟處理器目前定格在了麒麟9000，一直沒有推出最新的處理器。但是僅僅是麒麟9000這顆處理器，就用在了多款手機上，例如mate40pro5G、ma... 2022-11-28
科技用excel表格設置進銷存
大家好，今天給大家介紹一款excel函數實現的年度進銷存管理系統表格模闆，功能完整（圖1），獲取方式在文章末尾，需要的朋友可以下載使用和學習！圖1供應商信息維護，在這裡輸入信息後，在其他功能中可以引用（圖2）圖2客戶信息維護，在這裡輸入信息... 2022-12-12

tft每日頭條

> 科技

> 字符串相似算法

字符串相似算法

相关科技资讯推荐

热门科技资讯推荐

网友关注