根據關鍵字查找文件linux-tft每日頭條

根據關鍵字查找文件linux

科技更新时间:2026-06-26 16:05:39

根據關鍵字查找文件linux?本部分算是對find強大功能的擴展使用方法說明在find的基礎上，我們可與（如xargs命令）等其它基本Linux命令相結合，即能創造出無限的命令行功能，比如：可以快速查找出Linux某個文件夾及其子文件夾中的重複文件列表要實現這個功能在流程上是比較簡單的，隻要查找遍曆出所有文件，再通過命令去比較每個文件的MD5就OK啦，我來為大家科普一下關于根據關鍵字查找文件linux?以下内容希望對你有幫助!

根據關鍵字查找文件linux

方法一：使用Find命令

本部分算是對find強大功能的擴展使用方法說明。在find的基礎上，我們可與（如xargs命令）等其它基本Linux命令相結合，即能創造出無限的命令行功能，比如：可以快速查找出Linux某個文件夾及其子文件夾中的重複文件列表。要實現這個功能在流程上是比較簡單的，隻要查找遍曆出所有文件，再通過命令去比較每個文件的MD5就OK啦。

聽起來好像比較抽象，其實命令就一條：

find -not -empty -type f -printf "%s\n" | sort -rn | uniq -d | xargs -I{} -n1 find -type f -size {}c -print0 | xargs -0 md5sum | sort | uniq -w32 --all-repeated=separate

find -not -empty -type f -printf “%sn” 表示使用find命令搜索出所有非空文件，再打印出他們的大小

sort -rn 命令不用多說了把，這條命令就是按文件大小進行反向排序

uniq -d | xargs -I{} -n1 find -type f -size {}c -print0 表示隻打印了重複的行，這裡使用代表打印出文件名相同的文件

uniq -w32 –all-repeated=separate 最後這裡表示對MD5的前32個字節進行對比，以篩選出重複文件使用命令行的整個過程就是這麼簡單和容易。

方法二：使用dupeGuru工具

DupeGuru是一個跨平台應用，有Linux、Windows和Mac OS X版本，它可以通過文件大小、MD5和文件名等多種标準來幫助用戶找出Linux中的重複文件。Ubuntu用戶可以直接通過添加如下PPA源來方式來進行安裝：

sudo add-apt-repository ppa:hsoft/ppasudo apt-get updatesudo apt-get install dupeguru*

方法三：使用Find命令解析

在工作生活當中，我們很可能會遇到查找重複文件的問題。比如從某遊戲提取的遊戲文本有重複的，我們希望找出所有重複的文本，讓翻譯隻翻譯其中一份，而其他的直接替換。那麼這個問題該怎麼做呢？當然方法多種多樣，而且無論那種方法應該都不會太難，但筆者第一次遇到這個問題的時候第一反應是是用Linux的Shell腳本，所以文本介紹這種方式。

先上代碼：

find -not -empty -type f -printf "%sn" | sort -rn |uniq -d | xargs -I{} -n1 find -type f -size {}c -print0 | xargs -0 md5sum | sort | uniq -w32 --all-repeated=separate | cut -b 36-

大家先cd到自己想要查找重複文件的文件夾，然後copy上面代碼就可以了，系統會對當前文件夾及子文件夾内的所有文件進行查重。

下面分析一下上面的命令。

首先看第一句：

find -not -empty -type f -printf "%sn"

find是查找命令；-not -empty是要尋找非空文件；-type f是指尋找常規文件；-printf “%sn”比較具有迷惑性，這裡的%s并非C語言中的輸出字符串，它實際表示的是文件的大小，單位為bytes（不懂就man，man一下find，就可以看到了），n是換行符。所以這句話的意思是輸出所有非空文件的大小。

通過管道，上面的結果被傳到第二句：

sort -rn

sort是排序，-n是指按大小排序，-r是指從大到小排序（逆序reverse）。

第三句：

uniq -d

uniq是把重複的隻輸出一次，而-d指隻輸出重複的部分（如9出現了5次，那麼就輸出1個9，而2隻出現了1次，并非重複出現的數字，故不輸出）。

第四句：

xargs -I{} -n1 find -type f -size {}c -print0

這一部分分兩部分看，第一部分是xargs -I{} -n1，xargs命令将之前的結果轉化為參數，供後面的find調用，其中-I{}是指把參數寫成{}，而-n1是指将之前的結果一個一個輸入給下一個命令（-n8就是8個8個輸入給下一句，不寫-n就是把之前的結果一股腦的給下一句）。後半部分是find -type f -size {}c -print0，find指令我們前面見過，-size{}是指找出大小為{}bytes的文件，而-print0則是為了防止文件名裡帶空格而寫的參數。

第五句：

xargs -0 md5sum

xargs我們之前說過，是将前面的結果轉化為輸入，那麼這個-0又是什麼意思？man一下xargs，我們看到-0表示讀取參數的時候以為分隔符讀取，這也不難理解，畢竟的二進制表示就是00。後面的md5sum是指計算輸入的md5值。

第六句：sort是排序，這個我們前面也見過。

第七句：

uniq -w32 --all-repeated=separate

uniq -w32是指尋找前32個字符相同的行，原因在于md5值一定是32位的，而後面的--all-repeated=separate是指将重複的部分放在一類，分類輸出。

第八句：

cut -b 36-

由于我們的結果帶着md5值，不是很好看，所以我們截取md5值後面的部分，cut是文本處理函數，這裡-b 36-是指隻要每行36個字符之後的部分。

我們将上述每個命令用管道鍊接起來，存入result.txt：

find -not -empty -type f -printf "%sn" | sort -rn |uniq -d | xargs -I{} -n1 find -type f -size {}c -print0 | xargs -0 md5sum | sort | uniq -w32 --all-repeated=separate | cut -b 36- >result.txt

雖然結果很好看，但是有一個問題，這是在Linux下很好看，實際上如果有朋友把輸出文件放到Windows上，就會發現換行全沒了，這是由于Linux下的換行是n，而windows要求nr，為了解決這個問題，我們最後執行一條指令，将n轉換為nr：

cat result.txt | cut -c 36- | tr -s 'n'

關注IT運維技術圈獲取更多的面試題、腳本等運維資料點擊: 運維知識社區獲取

腳本之---短信轟炸機

腳本之---QQ微信轟炸機

ansible---一鍵搭建redis5.0.5集群

elk7.9真集群docker部署文檔

全球最全loki部署及配置文檔

最強安全加固腳本2.0

一鍵設置iptbales腳本

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技如何學習十九屆六中全會精神初中
新湖南客戶端3月17日訊（通訊員周德含）連日來，宜章縣教育系統學習貫徹黨的十九屆六中全會精神專題讀書班在宜章縣教師進修附屬小學開班。學習黨的十九屆六中全會精神，進一步明确辦學方向，把握教育規律，勤奮努力工作，落實黨中央教育大政方針，全面開創... 2023-03-08
科技 iphone手機标志意義
蘋果手機的logo幾乎做到了無人不知無人不曉，辨識度簡直太高了。但是蘋果logo這麼火爆的今天，是怎樣一步步的走來的呢？我們可以一起看看它的曆史：其實最初的時候“蘋果”的logo跟蘋果有關系，但并不如如今這樣密切和直接，甚至幾經變革才有了今... 2022-12-17
科技老年人微信使用手冊
群聊相信大家都不陌生，可能每個人微信裡都加了不止一個群，但是你真的知道關于群聊的一些小操作嗎？小編今天就給大家分享一下：【1】如何新建一個群多數人加群是受别人邀請進去的，但是如果你自己想單獨建一個新群，該怎麼操作呢？首先點擊你選定的第一個群... 2023-01-19
科技杭州戴爾電腦授權維修網點
杭州拱墅區杭州大廈、中央商城武林廣場B1-125室，（地鐵1号線武林廣場站）；是杭州核心區大型城市綜合體——杭州大廈的重要組成部分,當然杭州戴爾電腦旗艦店及售後維修服務中心也在這裡,位于杭州大廈中央商場B1層125室,是杭州首家2.0新概念... 2023-03-08
科技蘋果手機來電鈴聲越來越小怎麼回事
蘋果手機來電鈴聲越來越小怎麼回事?把“單聲道音頻”下面的“左——右”把按鈕撥到左或者右即可點擊打開手機主屏上的“設置，找到“通用”點擊進去，再找到“輔助功能”點擊進去，往下翻，把“單聲道音頻”下面的“左——右”，把按鈕撥到左或者右，就可以了... 2022-06-19
科技怎麼轉發微信上的朋友圈
值得注意的是微信新版本6.5.3新增了一個功能，不僅可以将自己拍的小視頻轉發到朋友圈，還可以将别人發的以及非微信小視頻拍的視頻轉發到朋友圈。總之一句話就是不管是你拍的還是别人拍的小視頻，你都可以轉發到微信朋友圈啦，再也不用購買什麼插件，冒着... 2022-12-24
科技紅米手機的隐藏功能怎麼設置
提到手機快捷鍵，相信網友們都或多或少掌握那麼幾個技能，比如最常使用的功能“截圖”。對此，為了讓米粉們更全面了解紅米手機的快捷鍵使用技巧，數碼日記君特搜集了6個組合件技巧，感興趣的米粉不妨往下看！首先，先來說說鎖屏狀态下，組合鍵的使用方法：1... 2022-11-13
科技微信朋友圈可以發嗎
■IT時報記者潘少穎微信朋友圈可以發相冊視頻了！現在，朋友圈視頻是主角。在微信iOS最新的6.5.1版本更新中，隻有一個功能——可以在朋友圈分享相冊中的視頻。這實在是一個千呼萬喚始出來的改善功能，被诟病已久的微信朋友圈視頻終于等來了可喜的改... 2022-12-24
科技榮耀20毛絨手機殼
産品名稱:榮耀magic40系列液态矽膠手機殼1、手機殼采用3層工藝，外層液态矽膠柔軟材質(不是塗層)，中間硬PC材質定型，内裡植絨布内襯。2、一開始使用手感滑滑的，使用一段時間後會有橡皮擦手感雷3采用真機1:1開口，孔位準确4、不頂膜，高... 2022-11-14
科技免費的自媒體素材網站
随着自媒體、短視頻等平台的興起，已經成為不少人的第二副業，那麼做好自媒體素材從哪裡來呢？下期給新手小白們分享8個自媒體大牛們都在用的找素材網站1、自媒體135一個自媒體多功能網站，裡面各種素材及實用工具分類直達，一目了然，功能非常強大。2、... 2022-11-19
科技英雄聯盟4k超清手機壁紙動漫
PS：打開圖片，長按保存-End-圖源網絡侵删, 2022-12-18
科技想進鐵路系統考什麼大學
想進鐵路系統要這樣選專業才可以。不是你考上了鐵路院校的任何一個專業都能夠進入鐵路系統的，每年都有家長拿着高分搶到的專業，畢業後發現想進鐵路系統一點優勢都沒有。就比如說計算機或者财務管理類的專業，這是當下熱門的專業，自然分數會很高，但是想進鐵... 2023-03-08
科技雲南楚雄州各縣市經濟排名
楚雄彜族自治州，雲南省下轄的自治州之一，楚雄州具有悠久的曆史文化，境内是人類發祥地之一，早在170萬年前，生活在州内金沙江流域的元謀人就已進入了舊石器時代。楚雄地理位置較為優越，省外和四川省接壤，省内和麗江市、大理白族自治州、普洱市、玉溪市... 2023-01-25
科技電腦突然之間黑屏是什麼原因呢
電腦原先一直可以正常使用，但這段時間突然時不時就黑屏了，這是怎麼回事？是哪裡出現故障了呢？其實電腦突然黑屏，常見的故障點有三個，接下來就為大家一一分析講解。電腦突然黑屏的原因1、顯示器有問題在我們正常使用電腦的過程中，明明沒有斷電，但是顯示... 2022-12-12
科技路由器當交換機要關閉dhcp服務嗎
拓撲較複雜的網絡環境會出現有意或者無意的非法DHCP服務器，導緻局域網中的設備獲取到之後又無法正常訪問網絡，并且還容易産生相應的網絡完全問題，這裡使用交換機的DHCPSnooping信任功能來攔截非法的DHCP分配信息。基本配置，AR1，用... 2023-02-03
科技雪佛蘭科魯茲哪裡有usb
每次有同事或者朋友來坐科魯茲，我總會先提及到中控這套高清的液晶屏幕，因為在同等價位，甚至大膽點說50萬以内都沒有這麼高清晰度的屏幕。另外，這套MyLink2.0系統運行很流暢，我平常用到的音樂播放（藍牙和USB）、收音機和導航這三項功能，雖... 2022-11-12
科技 dnf各版本副本排名
dnf許許多多的副本，也有那麼幾個副本給玩家留下不少的回憶。冒險團沒改版之前，升級的主線任務都是要過一遍，等級才能跟上去，那麼在升級中遇到過哪些最費時間的副本呢？小編覺得這下面這4個副本刷的時候最難受。第一：羅斯特的宮殿（舊）第八使徒“羅斯... 2022-11-28
科技京東新興市場規劃圖
京東科技中原總部落戶鄭州據最新消息，京東集團旗下的京東科技位于河南省的中原總部選址已敲定，就在鄭州市鄭東新區，這将是京東科技繼長三角總部落戶無錫經開區後，又一總部落地，該總部的落地将為河南省本土企業、金融機構、政府等各類客戶提供全價值鍊的技... 2023-02-14
科技自媒體十大短
在短視頻很火的今天，很多自媒體新人不知道有哪些自媒體平台能做短視頻，今天就整理12個自媒體人常用的短視頻平台，這些平台都是目前市面上比較火的自媒體平台，希望能對想做自媒體的你能有所幫助。1、頭條号今日頭條旗下媒體/自媒體平台,緻力于幫助企業... 2022-11-27
科技利用數字技術為産業賦能
利用數字技術為産業賦能?2022年6月24日至25日，第六屆世界智能大會在天津隆重舉行，吸引了衆多知名企業參與本屆大會以“智能制造”為主題，其重應用、重産業的鮮明特點，成為世界智能大會邁向新台階的标志，接下來我們就來聊聊關于利用數字技術為産... 2022-11-01
科技個人農機補貼怎麼辦理
啟動新一輪政策實施工作2018—2020年是農機購置補貼政策實施新一個三年周期，今年是啟動年，準備工作任務重、時間緊、要求高。今年2月，農财兩部印發了全國性的指導意見，召開了實施工作座談會，對新一輪實施工作做了全面部署。省級農機化主管部門、... 2022-11-15
科技網絡管理員常見問題及處理
破解管理員賬戶的方法在Windows操作系統中，管理員賬戶有着極大的控制權限，黑客常常利用各種技術對該賬戶進行破解，從而獲得電腦的控制權。強制清除管理員賬戶密碼在Windows中提供了netuser命令，利用該命令可以強制修改用戶賬戶的密碼... 2022-11-24
科技 win8系統怎麼安裝ie浏覽器
Win8系統無法打開IE浏覽器怎麼辦？最近有一個使用Win8系統的用戶詢問該如何解決電腦無法啟動IE浏覽器的問題，今天就給大家分享Win8系統無法打開IE浏覽器的修複教程。解決方法：1、首先需要打開電腦裡面的注冊表，然後鼠标點擊右鍵找到桌面... 2023-01-11
科技怎麼把手機錄音轉換成文字
如今我們的生活越來越離不開手機了，确實，手機中也有很多好玩又有用的功能。那下面這個功能你用過了嗎？使用下面這個功能，能快速将手機中的錄音文件轉為文字，真的超級好用~下面我們就一起來了解一下這個功能吧，千萬别再吃虧了，白白浪費了這麼好用的功能... 2023-02-08
科技手機屏幕怎麼保養
手機屏幕怎麼保養?可以使用三星手機原廠皮套：皮套等于是為手機多加一件外衣，一是能夠減少手機外殼的磨損，二是發生摔倒或遇水時能夠減輕手機所受的傷害，我來為大家科普一下關于手機屏幕怎麼保養?以下内容希望對你有幫助!手機屏幕怎麼保養可以使用三星手... 2022-06-01
科技科學好玩機械
01成都八零介紹“成都八零”全球金融科技産品設計與研發大賽是由西南财經大學、加州大學伯克利分校國際風險數據分析聯盟（CDAR）和成都交子金融控股集團有限公司聯合主辦，西南财經大學金融科技國際聯合實驗室、成都市金融科技協會和交子金融夢工場協辦... 2022-11-18
科技汽車上隻有aux接口怎麼用
汽車上隻有aux接口怎麼用?想把汽車的AUX接口和手機連接在一起，首先要準備好一根AUX連接線找到AUX接口并把AUX連接線的一端接在接口上，然後把AUX的另一端插在手機的耳機孔上即可完成連接需要注意的是，AUX連接線連接手機的一端為3.5... 2022-11-19
科技筆記本電腦打遊戲畫質差怎麼解決
筆記本電腦打遊戲畫質差怎麼解決?第一步，将電腦的獨顯打開電腦的配置高低顯卡占很大的比重，因為顯卡是一個遊戲能否運行的直接原因每台電腦調節顯卡的方法不同，根據各人的電腦進行相應的設置，我來為大家科普一下關于筆記本電腦打遊戲畫質差怎麼解決?以下... 2022-06-30
科技美妝博主宇芽被男友打
近日知名仿妝博主宇芽被家暴的事件引發網友熱議，簡直太不可思議了，也真的很生氣，當知名仿妝博主宇芽曬出了丈夫家暴自己的視頻，網友都忍不住了，大家一起來看看吧！知名仿妝博主宇芽是誰個人資料11月25日，擁有數十萬粉絲知名仿妝博主宇芽發博：我被家... 2023-03-08
科技 win7網頁打不開什麼原因
近日有網友向小編反饋，自己在使用電腦過程當中經常遇到網頁打不開的現象，導緻很多工作事情無法正常進行。那麼Win7打不開網頁怎麼辦呢？小編教大家Win7電腦網頁打不開解決方法，詳情如下。1.首先我們先來檢查網絡是否正常連接，再來看看是其他什麼... 2022-12-09

tft每日頭條

> 科技

> 根據關鍵字查找文件linux

根據關鍵字查找文件linux

根據關鍵字查找文件linux

相关科技资讯推荐

热门科技资讯推荐

网友关注