python合并兩個列表并去重-tft每日頭條

python合并兩個列表并去重

科技更新时间:2026-07-18 07:52:46

本文以爬取一部小說為例,因使用的是多線程爬取,所以每個小說章節都是一個txt文件,而這些文件都是亂序的,要閱讀的話我們也不可能每閱讀一章小說就去翻另一個txt文件,這時就需要合并了.

----------------------------------------

爬取時間2022/8/16

代碼如下:

python合并兩個列表并去重（大量亂序文件如何合并成有序的）1

代碼1-25行

python合并兩個列表并去重（大量亂序文件如何合并成有序的）2

代碼28-49行

python合并兩個列表并去重（大量亂序文件如何合并成有序的）3

代碼50-75行

運行結果:

python合并兩個列表并去重（大量亂序文件如何合并成有序的）4

pycharm中的結果

python合并兩個列表并去重（大量亂序文件如何合并成有序的）5

文件管理器中的結果

從結果中可以看到,程序從運行到結束,一共花了3秒鐘,

三秒内做完了從網站獲取url鍊接,再通過120個url下載了120個txt文件,合并成一個大的txt文件後,再删除之前的120個小txt文件.

----------------------------------------------

代碼10-25行>>>

從主頁面發起請求,結合bs4和正則獲取了小說每個章節的url鍊接和名字,并将順序正常的名字寫入叫1000.txt的文件. 第22行用unicodedatach處理了文本中的非正常空格(類似 )

代碼第28-39行>>>

以每個章節的url為函數參數,獲取了小說内容,并寫入txt文件,

用章節名 (例如: 第四十九回琉璃世界白雪紅梅　脂粉香娃割腥啖) 作為xxt文件的名字. 因為原本的章節名含有空格以及非正常空格,不利于後續排序處理,就采用正則提取了 "第"和"回"中間的文字作為txt文件名.

python合并兩個列表并去重（大量亂序文件如何合并成有序的）6

不用正則處理xtxt文件名就是這個樣子

代碼第69-71行>>>

創建了線程池下載txt文件

代碼第41-55行>>>

打開名為1000.txt文件,提取裡面的正常順序的章節名,以此作為已下載的120個txt文件的合并順序.

代碼第57-61行>>>

将之前下載的120個小txt文件删除,保留合并後的大的txt文件,接下來就可以愉快地閱讀小說了

python合并兩個列表并去重（大量亂序文件如何合并成有序的）7

手機中顯示的效果

注: 将ts文件合并成MP4文件也是通用的,但需要注意的是使用os模塊單次合并ts文件數量在650個左右,不到700個.

至于用os模塊單次合并txt文件的數量限制是多少,暫時未測試.

----------------------------------------------

最後:源碼以及小說txt文件,封面原圖鍊接阿裡雲盤分享

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技兒童眼睛近視補充葉黃素
随着武漢一聲令下：封城，全國進入了全民抗疫時期。盡管截止目前，抗疫取得了階段性的勝利，企業也陸陸續續複工了，但是作為學生，還隻能待在家裡，有些高年級的學生也開始接受網課的教學。當這些出現的時候，當大家不可避免的去使用電子産品進行網絡學習的時... 2023-01-01
科技施工現場水箱容積
水箱箱體與周圍牆體之間留出不小于500mm的檢修通道,方便水箱保養。玻璃鋼模壓單闆不要碰在堅硬物體的尖角上,不要用堅硬工具敲擊。為防止管子的膨脹收縮、震動作用破壞水箱,水箱的進水、出水管必須采用橡膠繞性接頭,接管的重量應另加支撐,不要作用在... 2023-02-16
科技怎麼用當貝投影儀投電腦
慧投無屏智能電腦投影儀H2S安裝了正版的Windows10系統，不但手機能夠投到H2S，而且其他的Windows10也能夠無線投影到H2S，隻要你的設備具有WIFI無線連接。1、H2S投影設置：桌面右擊選“顯示設置”，點“投影到這台電腦”，... 2023-01-14
科技拉薩公交能用手機支付嗎
拉薩公交能用手機支付嗎?智慧公交昨日，記者了解到，拉薩8路公交車已實現免費WiFi全覆蓋，在車上連入名為“LSGJ”的WiFi信号，便可使用運營商共享的本地資源，比如看電影、聽歌、玩遊戲等據介紹，在“智慧公交”項目中，除公交車内的免費WiF... 2023-02-16
科技筆記本顯卡不見了怎麼辦
我的筆記本電腦是宏基的，最近一段時間發現：電腦的獨立顯卡消失了，從裝系統驅動都不行，就是找不到獨立顯卡還有現在就是打字電腦就會死機，輸入法也換了幾種了，還是解決不了而卻發現現在也不好開機了是不是我該換電腦了？各位幫我看下還有沒有救沒錢買電腦... 2023-01-11
科技買手機一定要看的幾個參數
大家應該發現一個問題，市面上的手機型号越來越多，而且手機的更新換代很快，品牌之間的競争激烈，促成了“機海戰術”的營銷策略，這種打法雖然是給消費者帶來更多的選擇，但是這麼多同價位相似的機型中選擇變得更難了，所以買手機一定要擦亮眼睛，手機圈中很... 2023-02-10
科技遠景x6有胎壓監測嗎
遠景X6的定位就是一款家用SUV車型，整車的配置上也都是以實用為主，新款的車型基本都是配備有胎壓監測系統，可以在用車過程中實時監測胎壓，保持車輛胎壓處于一個良好的狀态，确保行車安全。雖然遠景X6基本都是配備胎壓監測系統，但還沒有做到每款車型... 2022-12-23
科技如何在虛拟機中安裝系統圖文
點擊紅色關注不迷路，定期分享實用技巧來鋪路！相信很多同學在平時使用電腦時可能都遇到這樣一些困擾：有時候看到一條鍊接，但是怕是病毒不敢點擊；想下載個軟件，但是擔心一不小心被安裝了流氓軟件全家桶；有個古董軟件隻能在WindowsXp上打開可是身... 2023-03-30
科技和平精英光子bug
玩吃雞，就用#榮耀X10#，性能旗艦，流暢遊戲！引言：陌瑾出品，争做精品！大家好，我是你們的老朋友，陌小瑾。和平精英作為當下比較熱門的一款PVP即時戰鬥手遊，在遊戲内有着豐富的地圖系統，僅僅是經典模式的四個地圖，就能給玩家帶來無窮的玩法和樂... 2022-12-17
科技範偉的演技水平
過去的這個暑期檔，如果要排一個失望榜單，李玉導演的《斷·橋》一定名列前茅。曾拍出過多部佳作的導演、影帝影後齊聚的演員陣容、看上去充滿可能性的題材，《斷·橋》的賣相本是極好的。但看過的人都知道結果了。野心挺大，完成度卻極差，懸疑不懸疑，文藝不... 2023-03-22
科技駕駛時如有兒童同行需使用安全座椅安裝...
駕駛時如有兒童同行需使用安全座椅安裝在哪裡最安全?駕駛時如有兒童同行需使用安全座椅安裝在司機正後方最安全，我來為大家講解一下關于駕駛時如有兒童同行需使用安全座椅安裝在哪裡最安全?跟着小編一起來看一看吧!駕駛時如有兒童同行需使用安全座椅安裝在... 2022-06-05
科技 officeexcel怎麼顯示多個工...
Hello大家好！又到了每天中午學習office幹貨的時間啦！我們今天要學習的小技巧是如何凍結窗口。有的小夥伴們看到這裡就疑惑了，為什麼跟标題說的不一樣呀？這時，我們要對固定的幾行幾列單元格進行凍結，使它們保持不變。1.視圖選項卡-凍結窗格... 2023-02-11
科技電腦藍屏0x0000008b是怎麼解...
電腦藍屏0x0000008b是怎麼解決?開機馬上按F8不動到高級選項出現在松手，選“最近一次的正确配置”回車修複，還不行按F8進入安全模式還原一下系統或重裝系統（如果重裝也是藍屏，建議還是檢修一下去，如果可以進入安全模式，說明你安裝了不合适... 2022-06-08
科技諾基亞手機未曾搭載過哪個系統
諾基亞已經确認要重回手機圈，最快今年年底發布新機，此消息一出便讓不少老粉絲期待不已。現在，諾基亞兩款新機出現在GeekBench跑分庫中，其中一款是高端機，而另外一款手機配置有些古老，應該是很早之前的原型機了吧。我們着重來說說這個高端機，它... 2023-03-02
科技拍的美顔加濾鏡在哪裡
視頻怎麼加濾鏡美顔？大家一般在拍完照片之後都會給照片添加濾鏡和美顔效果，拍完視頻之後其實也可以添加，這樣不僅更能體現整個視頻的美感，還有利于增加視頻的層次感，那麼應該怎麼該視頻加美顔和濾鏡呢？下面給大家分享幾款可以給視頻加美顔濾鏡的軟件，一... 2023-02-19
科技京考面試萬能句式
京考面試萬能句式?科技興則國運興，教育強則國家強教育與科技的發展息息相關所以我們也需要大量去積累教育科技類的名言警句、好詞好句今天就為大家整理了一些與之相關的内容，供大家參考：，今天小編就來聊一聊關于京考面試萬能句式?接下來我們就一起去研究... 2023-04-04
科技西部數據固态硬盤黑盤512評測
今天，全球領先的存儲解決方案提供商西部數據公司在滬舉辦了“榮耀盛典璀璨起航”西部數據WD品牌固态硬盤新品發布會。發布會中西部數據除了展示首款WD品牌SATA接口客戶級固态硬盤産品：WDBlueSSD和WDGreenSSD，還邀請了全球知名的... 2023-02-26
科技南陽800目碳酸鈣成分
碳酸鈣的作用聚乙烯蠟碳酸鈣一般是指為趕緊聚合物強度和各種性能或者為降低生産成本而在聚氯乙烯塑料中添加的較為惰性的物質。。碳酸鈣即是這種物質,也是聚氯乙烯塑料制品用量最大的填充劑。碳酸鈣的分子式為CaCO3。/span>碳酸鈣的作用碳酸鈣來源... 2023-04-04
科技魔獸世界食物黑科技
炖土豆大餐和肉排大餐是魔獸世界裡的兩種食物。這兩種大餐可以在主城的PVP商人處用1個榮耀印記兌換，打戰場給的箱子裡也有小幾率掉。除了能回複血和藍，它們還可以給玩家提供10%的耐力加成。雖然耐力加的多，但它們的缺點很明顯：隻能在戰場中使用。不... 2023-03-07
科技高難度工作的程序員也會被ai取代
高難度工作的程序員也會被ai取代?要說2022年科技最熱的領域方向，生成式AI（AIGC）絕對是繞不開的一個詞多名互聯網大廠員工對《科創闆日報》記者表示，已經開始嘗試用ChatGPT自動生成業務代碼和重構代碼“親測真的可以，就是要多檢查幾遍... 2023-03-21
科技條形碼如何制作電子版
條形碼如何制作電子版?條形碼生成軟件中除了制作出常見到的黑白條形碼還可以制作出彩色的條形碼，或者是通過“繪制模式”制作出各種各樣的個性化條形碼接下來就來介紹一下如何通過條形碼生成軟件繪制模式制作出個性化條形碼的操作步驟，現在小編就來說說關于... 2022-10-14
科技免費下載各類歌曲的音樂軟件
今天我們推薦一款剛剛更新的福利版音樂類軟件，相信喜歡音樂的都會知道，一款可免費下載無損及收費高品質音樂的APP。QMD音樂下載器APP名稱：QMD音樂下載器APP版本：V1.4.4APP大小：3.5M支持系統：5.0及更高版本更新福利免費下... 2023-03-09
科技 1噸智能手機能提純多少克黃金
1噸智能手機能提純多少克黃金?通常情況下，開采一噸金砂能提煉出5克左右的黃金可你知道嗎，同樣的重量下，一噸廢舊手機中可以提煉出足足400克黃金、2.3公斤銀、172克銅等，下面我們就來聊聊關于1噸智能手機能提純多少克黃金?接下來我們就一起去... 2023-02-14
科技電腦耳麥音響都沒有聲音怎麼回事
電腦耳麥音響都沒有聲音怎麼回事?這種情況多半是連接出現了問題，正真硬件問題的很少，下面我們就來聊聊關于電腦耳麥音響都沒有聲音怎麼回事?接下來我們就一起去了解一下吧!電腦耳麥音響都沒有聲音怎麼回事這種情況多半是連接出現了問題，正真硬件問題的很... 2022-10-18
科技實體店買手機可以分期付款嗎
随着人們消費觀念的轉變，繼貸款買房、貸款買車之後，分期付款買手機正逐漸成為一種潮流。然而，一些無良商家，卻抓住消費者想要分期買手機的心理，在手機分期業務背後，布下一個又一個套路。分期付款買手機，這四點一定要注意!一、分期前先問清楚利息真正了... 2023-02-21
科技華為手機最好用的是哪款
在國内手機市場中，華為手機旗下的很多機型都稱得上是優質旗艦，對于想換機的用戶來說，華為所帶來的吸引力往往會非常的強。更何況這幾年的華為手機一直都在突破，并且帶來了很多全新的機型和功能，以及突破了很多特性。但是華為手機看似非常的好，但是在選擇... 2023-03-12
科技文件目錄清單如何整理
在工作中，經常會碰到需要歸類一些文件的事情。如果文件的數量少，其實還好，但一旦數量巨大的時候，挨個操作非常容易給人帶來疲勞，下面小編給大家分享幾個歸類文件的方法，希望能給大家帶來幫助。第一步，運行軟件，在主頁中的【文件智能管理箱】闆塊，這個... 2023-02-14
科技剪輯的三十個技巧和方法
有的人說剪輯很簡單，就是把拍好的視頻組合起來就可以了，是的。剪輯就是這樣的，說簡單也是非常的簡單，但是每年各大影視獎項這麼多，而與你無緣，這就說明了剪輯其實很不簡單。現在就給大家說說剪輯的一些常見的術語吧，也給自己打一點預防針。切出切入指上... 2023-04-04
科技守望先鋒60幀怎麼調最好
從2016年到2022年，你的電腦配置提升了多少？曾經能暢玩《守望先鋒》的配置如今在“歸來”版本中也理應毫無壓力。不過相信很多人已經發現在OW歸來中幀率較低、畫面發糊，或者是顯卡“不出力”跑不滿，以及各個英雄、鏡頭的細節優化等等……那到底要... 2023-03-08
科技女子剪發被轟走
女子剪發被轟走?來源：湖北日報8月31日晚，今天小編就來聊一聊關于女子剪發被轟走?接下來我們就一起去研究一下吧!女子剪發被轟走來源：湖北日報8月31日晚#女子剪發被4部手機對着直播#的話題登上微博熱搜“他用4台手機對着我拍，我不同意，他就說... 2022-12-29

tft每日頭條

> 科技

> python合并兩個列表并去重

python合并兩個列表并去重

相关科技资讯推荐

热门科技资讯推荐

网友关注