深入理解并行編程設計-tft每日頭條

深入理解并行編程設計

科技更新时间:2026-07-23 07:05:22

今天給大家介紹下并行編程在實際場景中的應用

1 需求

給定一篇文章A，從備選的1000份文章中找出和文章A相似度最高的一篇。如果相似度大于50%，則認為該文章有抄襲嫌疑，将文章提取出來進行人工篩查。而且效率要足夠高。

這裡請大家暫停10分鐘，思考下如果換做是你，你将如何實現這個需求。

深入理解并行編程設計（并行編程應用計算文章相似度）1

我來講下方法，如果大家有更好的想法，小豆君希望大家在評論區讨論。每個人積極交換思想，才能碰撞出更亮的火花。

2 方法

在數據分析中，有個叫做餘弦相似度的概念

其公式為：

深入理解并行編程設計（并行編程應用計算文章相似度）2

餘弦相似度公式

其中，a·b表示向量點積

深入理解并行編程設計（并行編程應用計算文章相似度）3

向量點積

||a||*||b||表示：

深入理解并行編程設計（并行編程應用計算文章相似度）4

距離乘積

舉例：

文章A内容：中國人民都愛喝牛奶
文章B内容：我們中國百姓都喜歡喝牛奶
文章C内容：外國人不喜歡牛奶

然後将三篇文章做成一個矩陣表格，其中每個單元格的數字表示這個字在文章中出現的次數

深入理解并行編程設計（并行編程應用計算文章相似度）5

字矩陣

那麼

A·B=6 (A和B對應每列相乘再求和)
sqrt(A^2)=3
sqrt(B^2)=3.46
cos(A,B)=6/(3*3.46)=0.58

你可以嘗試求一下cos(A,C)，我這裡就不給答案了，你可以将答案寫到評論區。

故文章A與B的餘弦相似度為0.58

解釋：

餘弦相似度實際上是兩個向量之間的夾角餘弦值，夾角越小越相似。在用點積除以距離時，實際上是将它們進行了歸一化處理，這時我們就不需要考慮向量的長度了。

在取點積時，如果乘數中有0，則相當于是将彼此間互不包含的字符去掉了，這會使得整個分子變小，而分子變小，餘弦值減小，角度增大，其相似度也就增大了。當餘弦值為0時，角度為90度，說明它們之間不包含任何相同的文字了。

通過上面的解釋，你應該已經弄懂了什麼是餘弦相似度了。接下來我們用代碼實現之

3 餘弦相似度代碼實現

上代碼：

#include <QDebug> //獲取字符串a和字符串b每個字的出現次數 QMap<QString, QList<int> > get_dict(const QString& a, const QString& b) { QMap<QString, QList<int> > dict; QList<int> empty_list; //空的一位列表，索引0為a的字符次數，索引1為b的字符次數 empty_list.append(0); empty_list.append(0); //找到所有的字，并初始化為空列表 foreach (const QString& v, a b) { if (!dict.contains(v)) { dict[v] = empty_list; } } //計算a中字符出現次數 foreach (const QString& v, a) { if (dict.contains(v)) { dict[v][0] =1; } } //計算b中字符出現次數 foreach (const QString& v, b) { if (dict.contains(v)) { dict[v][1] = 1; } } return dict; } double cos_ab(const QString& a, const QString& b) { int ab = 0; //點積 int a_distance2 = 0; //a距離平方 int b_distance2 = 0; //b距離平方 QMap<QString, QList<int> > dict = get_dict(a, b); QMapIterator<QString, QList<int> > i(dict); while (i.hasNext()) { i.next(); const QList<int>& v = i.value(); ab = v[0]*v[1]; a_distance2 = v[0]*v[0]; b_distance2 = v[1]*v[1]; } double s_a = sqrt(a_distance2); double s_b = sqrt(b_distance2); return ab/(s_a*s_b); } int main() { double result = cos_ab(QString("中國人民都愛喝牛奶"), QString("我們中國百姓都喜歡喝牛奶")); qDebug() << result; }

以上，我們已經解決了比較文章相似度的問題了，但需求是需要從1000篇文章中進行篩選，所以我們要充分發揮計算機的資源，盡快找出相似度最高的文章，所以需要用到多線程。

4 使用Qt中的Concurrent實現并行計算

在Qt中，QtConcurrent提供了并行處理方案。

上代碼：

#include <QApplication> #include <QDebug> #include <QTextStream> #include <QFile> #include <QDir> #include <qtconcurrentmap.h> // 查找指定目錄下的所有文件，并指定過濾條件，返回文件路徑列表 QStringList find_files(const QString &startDir, QStringList filters) { QStringList names; QDir dir(startDir); foreach (QString file, dir.entryList(filters, QDir::Files)) names = startDir '/' file; foreach (QString subdir, dir.entryList(QDir::AllDirs | QDir::NoDotAndDotDot)) names = find_files(startDir '/' subdir, filters); return names; } // 讀取文件中的所有内容 QString read_file(const QString& file) { QFile f(file); f.open(QIODevice::ReadOnly); return f.readAll(); } // 餘弦函數代理，用于在mappedReduced中計算餘弦相似度 double cos_ab_proxy(const QString& file) { static QString src = read_file("./src.txt"); // 存放原始文件内容，"中國人民都愛喝牛奶" QString compare = read_file(file); // 讀取被比較的文件内容 double res = cos_ab(src, compare); qDebug() <<QString("原字符串[%1] 被比較字符串[%2] 相似度[%3]").arg(src).arg(compare).arg(res); return res; } // 對計算後的餘弦相似度進行處理，找出最大的餘弦相似度 void reduce(double &result, double calc_result) { if (result < calc_result) { result = calc_result; } } int main(int argc, char** argv) { QApplication app(argc, argv); // 查找files目錄下的所有txt文件，并返回文件路徑列表。1.txt (我們中國百姓都喜歡喝牛奶) 2.txt (外國人不喜歡牛奶) QStringList files = find_files("./files/", QStringList() << "*.txt"); double result = QtConcurrent::mappedReduced(files, cos_ab_proxy, reduce); qDebug() << "最高相似度為：" << result; }

輸出結果：

深入理解并行編程設計（并行編程應用計算文章相似度）6

并行計算結果

使用QtConcurrent編寫的程序可以根據可用的處理器内核數自動調整線程數來加快計算速度，那麼當部署到核數更多的機器上時，計算速度将自動提高。

QtConcurrent::mappedReduced函數，第一個參數是一個序列，它會将序列中的每一個元素分别傳遞給cos_ab_proxy函數作為參數，然後将cos_ab_proxy的結果傳遞給reduce，作為reduce的入參。reduce的結果将是整個函數的返回值。

你可以嘗試增加文本和文件數量，當數量越來越多時，就會體現出并行計算的優勢。

此處小豆君計算文本之間的相似度，是很初級的。因為中國是漢字，這裡隻計算的漢字之間的相似度，實際應計算詞語相似度，過濾掉特殊符号，标點符号等。還需要處理同一種詞語或詞義的不同形式。這個留給後面我們進行探索。

最後留一個問題，本代碼中，并沒有返回是哪篇文章相似度最高，大家可以思考下應該怎麼做。

喜歡本文的大家就點個贊吧，同時也歡迎關注

知乎号：小豆君編程分享

小豆君編程分享（關注後，可加入小豆君交流群進行學習交流，也可第一時間看到最新文章）

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技微信為什麼收不到别人發的信息
以iphone12，ios14，微信7.0.21為例。首先檢查當前的網絡是否正常，如果網絡正常可能是由于收發消息（包括群聊、給好友發送消息）操作頻繁導緻，可退出不常用且收發非常頻繁的群，24小時後再操作即可。微信是騰訊公司于2011年1月21日推出的一個為智能終端提供即時通訊服務的免費應用程序，由張小龍所帶領的騰訊廣州研發中心産品團隊打造。微信支持跨通信運營商、跨操作系統平台通過網絡快速發送免費（ 2023-07-18
科技華為賬号申訴
華為賬号申訴的具體操作方法如下：1、打開手機的設置。2、點擊上方的華為賬号頭像。3、點擊“賬号安全”，進入賬号安全的設置。4、點擊“更多”按鈕，點擊“安全中心”。5、進入“自助申訴”然後開始申訴即可。1、打開手機的設置。2、點擊上方的華為賬号頭像。3、點擊“賬号安全”。4、點擊“更多”按鈕。5、點擊... 2023-07-18
科技美團借錢怎麼借
美團借錢的具體操作步驟如下：1、打開美團app。2、點擊右下角“我的”。3、點擊“進入錢包”按鈕。4、在美團借錢的右邊點擊“立即申請”。5、勾選同意協議，點擊“申請額度”然後根據系統提示操作即可。1、打開美團app。2、點擊右下角“我的”。3、點擊“進入錢包”按鈕。4、在美團借錢的右邊點擊“立即申請... 2023-07-18
科技蘋果id消費記錄怎麼删除
蘋果id的消費記錄可以進行隐藏，具體的操作步驟如下：1、打開手機的AppStore。2、點擊右上角的蘋果id頭像。3、點擊“已購項目”按鈕。4、把需要删除的消費記錄向左滑動，點擊“隐藏”即可。1、打開手機的AppStore。2、點擊右上角的蘋果id頭像。3、點擊“已購項目”按鈕。4、把需要删除的消費... 2023-07-18
科技 iphone6s尺寸大小
iPhone6s高度為138.3毫米(5.44英寸)，寬度為67.1毫米(2.64英寸)，厚度為7.1毫米(0.28英寸)，重量為143克(5.04盎司)。iPhone6s設計采用離子玻璃以及7000系列鋁金屬外殼，屏幕為4.7英寸。iPhone6s系列機型中，iPhone6Plus的屏幕尺寸為5.... 2023-07-18
科技微信如何讓對方聽到我設置的鈴聲
微信讓對方聽到自己設置的鈴聲的操作方法如下：1、打開微信app。2、點擊右下角的“我”。3、點擊“設置”。4、點擊“新消息通知”。5、把“呼叫我時朋友也可聽見我的來電鈴聲”後面的按鈕打開即可。1、打開微信app。2、點擊右下角的“我”。3、點擊“設置”。4、點擊“新消息通知”。5、把“呼叫我時朋友也... 2023-07-18
科技手機時不時斷網幾秒鐘後恢複
如果出現手機時不時斷網幾秒鐘後恢複的情況，可以嘗試還原一下手機的網絡設置。操作如下：1、打開手機的設置。2、點擊“通用”按鈕。3、點擊“還原”按鈕。4、點擊“還原網絡設置”，然後确認還原即可。1、打開手機的設置。2、點擊“通用”按鈕。3、點擊“還原”按鈕。4、點擊“還原網絡設置”，然後确認還原即可。... 2023-07-18
科技天玑720相當于骁龍多少
天玑720相當于骁龍765。天玑7205G芯片基于ARM架構，擁有2個主頻2.0GHz的Cortex-A76核心和6個主頻2.0GHz的高能效核心，7nm制程。骁龍765基于7nm制程，内置SnapdragonX52Modem，實現對5G的支持。天玑720集成MediaTek最新的5G基帶，支持NS... 2023-07-18
科技 oppo手機開機鍵壞了怎麼開機
oppo手機開機鍵壞了想要開機的具體操作方法如下：1、打開手機的設置。2、點擊“其他設置”選項。3、點擊“定時開關機”按鈕。4、打開定時開機并且設定一個想要的時間。1、打開手機的設置。2、點擊“其他設置”。3、點擊“定時開關機”按鈕。4、打開定時開機并且設定一個想要的時間。操作環境品牌型号：OPPO... 2023-07-18
科技小牛app過戶怎麼操作
過戶具體的操作方法如下：1、打開小牛電動app。2、點擊右下角“我的”。3、點擊“在線客服”按鈕。4、在對話框中輸入“過戶”然後發送。5、可以根據客服的回答進行操作。1、打開小牛電動app。2、點擊右下角“我的”。3、點擊“在線客服”按鈕。4、在對話框中輸入“過戶”然後發送。5、可以根據客服的回答進... 2023-07-18
科技電腦usb接口不能用怎麼辦
1、有些電腦機箱前置USB接口不可用。如果是遇到前置USB接口不可用，不妨連接機箱後面的USB接口，後置USB接口由主闆提供，一般問題就可以解決。2、系統禁用了USB服務。如果以前用的好好的，隻是優化了一些系統項目導緻的問題，則多數是禁用了USB服務導緻的，解決辦法大家可以截止金山衛士或者360安全衛士的開機優化服務項目檢查下是否禁用了某些關鍵系統服務，發現了開機，或者使用金山衛士優化推薦項，還是 2023-07-18
科技抖音怎麼轉發給微信好友
抖音視頻轉發給微信好友的具體操作方法如下：1、打開抖音app。2、進入左下角的“首頁”界面。3、在播放視頻的頁面中，點擊右下方的分享按鈕。4、選擇“微信”即可複制口令發送給微信好友。1、打開抖音app。2、進入左下角的“首頁”界面。3、在播放視頻的頁面中，點擊右下方的分享按鈕。4、選擇“微信”即可複... 2023-07-18
科技朋友圈如何發60秒以上的視頻
朋友圈發60秒以上的視頻的方法如下：1、打開微信app。2、點擊右下角的“我”。3、選擇“收藏”。4、點擊右上角的“+”。5、從相冊中添加一段60秒以上的視頻。6、添加完成後點擊“分享到朋友圈”即可。1、打開微信app。2、點擊右下角的“我”。3、點擊“收藏”。4、點擊右上角的“+”。5、從相冊中添... 2023-07-18
科技喜馬拉雅uid在哪裡看
喜馬拉雅uid的查看方法如下：1、打開喜馬拉雅app。2、進入右下方“我的”界面。3、點擊上方的“創作中心”按鈕。4、點擊右上角的小人頭像按鈕。5、進入後在頭像旁邊即可查看賬号的uid。1、打開喜馬拉雅app。2、進入右下方“我的”界面。3、點擊上方的“創作中心”按鈕。4、點擊右上角的小人頭像按鈕。... 2023-07-18
科技蘋果手機勿擾模式怎麼設置
蘋果手機勿擾模式怎麼設置具體操作步驟如下：1、打開“設置”。2、點擊“勿擾模式”。3、開啟“勿擾模式”或設定“勿擾模式”時間即可。1、打開“設置”，進入手機設置頁面。2、點擊“勿擾模式”，進入勿擾模式頁面。3、開啟“勿擾模式”或設定“勿擾模式”時間即可。操作環境品牌型号：iPhone13系統版本：i... 2023-07-18
科技退出微信群會通知群主嗎
退出微信群是不會通知群主的，微信退群群裡不會有通知，包括群主也不會有通知。具體操作如下：1、打開微信app。2、選擇一個需要退出的群，進入聊天界面。3、點擊右上角的“...”。4、點擊“删除并退出”，确認即可。1、打開微信app。2、選擇一個需要退出的群，進入聊天界面。3、點擊右上角的“...”。4... 2023-07-18
科技釘釘怎麼連麥老師
釘釘連麥老師的操作方法如下：1、打開釘釘app。2、選擇一個需要進行連麥的群聊，進入聊天界面。3、進入正在直播的課堂。4、點擊右下角的“舉手連線”按鈕。5、點擊“發起申請”即可。1、打開釘釘app。2、選擇一個需要進行連麥的群聊，進入聊天界面。3、進入正在直播的課堂。4、點擊右下角的“舉手連線”按鈕... 2023-07-18
科技聯動雲新用戶首日0租金怎麼使用
聯動雲新用戶首日0租金的活動規則查看方法如下：1、打開聯動雲租車app。2、進入首頁點擊右上角的“客服”按鈕。3、點擊頁面内的“優惠活動”按鈕。4、拉到下方就可以看到新用戶首日0租金怎麼使用了。1、打開聯動雲租車app。2、進入首頁點擊右上角的“客服”按鈕。3、點擊頁面内的“優惠活動”按鈕。4、拉到... 2023-07-18
科技掃碼抗疫情如何更換個人信息
掃碼抗疫情更換個人信息的具體操作步驟如下：1、打開支付寶app。2、在“首頁”點擊“健康碼”按鈕。3、點擊“立即查看”按鈕。4、進入健康碼頁面後，在右上角點擊“重新填寫”按鈕即可更換個人信息。1、打開支付寶app。2、在“首頁”點擊“健康碼”按鈕。3、點擊“立即查看”按鈕。4、進入健康碼頁面後，在右... 2023-07-18
科技在手機上怎麼激活醫保卡
在手機上激活醫保卡的具體操作方法如下：1、打開支付寶app。2、在“首頁”點擊“市民中心”按鈕。3、進入市民中心後點擊“醫保”。4、勾選協議，點擊“刷臉激活”完成激活醫保卡流程即可。1、打開支付寶app。2、在“首頁”點擊“市民中心”按鈕。3、進入市民中心後點擊“醫保”。4、勾選協議，點擊“刷臉激活... 2023-07-18
科技華為手機傳輸照片到電腦
通過華為手機将照片傳輸到電腦的具體操作方法如下：1、取一根USB數據線連接手機和電腦。2、從手機狀态欄下滑呼出通知面闆。3、點擊“點擊查看更多選項”按鈕。4、勾選“傳輸照片”即可。1、取一根USB數據線連接手機和電腦。2、從手機狀态欄下滑呼出通知面闆。3、點擊“點擊查看更多選項”按鈕。4、勾選“傳輸... 2023-07-18
科技怎麼關注公衆号
關注微信公衆号的具體操作方法如下：1、打開微信app。2、在“微信”頁面點擊右上角的“+”。3、點擊“添加朋友”。4、點擊“公衆号”。5、在搜索框中，輸入要添加的公衆号名稱。6、進入後點擊“關注”即可。1、打開微信app。2、在“微信”頁面點擊右上角的“+”。3、點擊“添加朋友”。4、點擊“公衆号”... 2023-07-18
科技 b站動态視頻怎麼關
b站動态視頻的關閉方法如下：1、打開哔哩哔哩app。2、點擊右下角“我的”。3、點擊“設置”。4、點擊“播放設置”。5、點擊“動态/活動頁單列視頻是否自動播放”。6、勾選“關閉自動播放”即可。1、打開哔哩哔哩app。2、點擊右下角“我的”。3、點擊“設置”。4、點擊“播放設置”。5、點擊“動态/活動... 2023-07-18
科技微博怎麼隐藏自己的贊
微博隐藏自己的贊的操作步驟如下：1、打開微博國際版app。2、點擊右下角我的按鈕。3、點擊“設置”。4、點擊“隐私”按鈕。5、把“隐藏我的贊”後面的開關打開即可，開啟後别人将無法看到我贊過的微博。1、打開微博國際版app。2、點擊右下角我的按鈕。3、點擊“設置”。4、點擊“隐私”按鈕。5、把“隐藏我... 2023-07-18
科技手機鈴聲怎麼下載
具體的操作方法如下：1、打開酷狗鈴聲app。2、進入左下角的“首頁”界面。3、選擇“來電”标簽。4、選擇一首喜歡的歌曲，點擊右邊的“...”按鈕。5、點擊“設鈴聲”即可。1、打開酷狗鈴聲app。2、進入左下角的“首頁”界面。3、選擇“來電”标簽。4、選擇一首喜歡的歌曲，點擊右邊的“...”按鈕。5、... 2023-07-18
科技蘋果鎖屏不顯示微信具體内容
如果蘋果手機鎖屏不顯示微信具體内容的話，可以進行以下的設置：1、打開手機的設置。2、點擊“通知”按鈕。3、點擊進入“微信”。4、打開“允許通知”按鈕，勾選“鎖定屏幕”的提醒。5、把顯示預覽設置為“始終”。1、打開手機的設置。2、點擊“通知”按鈕，進入通知的設置頁面。3、點擊“微信”進入微信的通知設置... 2023-07-18
科技實況照片怎麼發給别人才會動
實況照片想要實現發給别人也會動的效果，可以用以下方法進行操作：1、打開手機的照片app。2、進入右下方的“相簿”界面。3、打開一張實況照片。4、把左上角的“實況”勾選為“循環播放”或者“來回播放”。5、點擊分享按鈕進行發送即可。1、打開手機的照片app。2、進入右下方的“相簿”界面。3、打開一張實況... 2023-07-18
科技 oppo手機插u盤沒反應
oppo手機插u盤沒反應，需要打開手機的設置，打開的方法如下：1、打開手機的設置。2、點擊“其他設置”按鈕。3、把“OTG連接”的功能打開，開啟該功能之後，再把手機插上u盤即可。1、打開手機的設置。2、點擊“其他設置”。3、把“OTG連接”的功能打開，開啟該功能之後，再把手機插上u盤即可。操作環境品... 2023-07-18
科技微信如何不用銀行卡進行實名認證
微信不使用銀行卡進行實名認證的方法如下：1、打開微信app。2、點擊右下角的“我”。3、點擊“支付”。4、點擊右上角的三小點按鈕。5、點擊“實名認證”。6、填寫身份證号等信息，進行實名認證即可，無需用到銀行卡。1、打開微信app。2、點擊右下角的“我”。3、點擊“支付”。4、點擊右上角的三小點按鈕。... 2023-07-18
科技黑貓投訴是什麼平台
可以去手機應用商店下載黑貓投訴平台，方法如下：1、打開AppStore。2、點擊右下角的“搜索”。3、在上方搜索框輸入“黑貓投訴”。4、點擊黑貓投訴應用右邊的“獲取”即可下載安裝。1、打開AppStore。2、點擊右下角的“搜索”。3、在上方搜索框輸入“黑貓投訴”。4、點擊黑貓投訴應用右邊的“獲取”... 2023-07-18

tft每日頭條

> 科技

> 深入理解并行編程設計

深入理解并行編程設計

相关科技资讯推荐

热门科技资讯推荐

网友关注