大數據面試150題-tft每日頭條

大數據面試150題

職場更新时间:2025-11-13 09:53:27

每晚10點，捕獲技術思考和創業資源洞察

“分而治之”( Divide and conquer)方法(又稱“分治術”) ，是有效算法設計中普遍采用的一種技術。

有一個1G大小的一個文件，裡面每一行是一個英文單詞，詞的大小不超過16字節，内存限制是1M。請設計一個算法思路，返回頻數最高的100個詞.

初步一看，要處理的文件大小1G，可内存卻隻有1M。我們知道1G的文件用1M的内存空間處理不太現實。按照1M的上限來計算，假設每個單詞都為16個字節，那麼1M的内存可以處理多少個單詞？

我們來計算下，1M = 1024 KB = 1024 * 1024 B 。1M / 16B = 2^16個單詞，那麼1G大概有多少個單詞呢？有2^26個單詞，但是實際中應該不止，因為我們是按照最大單詞長度來計算的，有可能有的單詞隻有兩個字母。

方案1大概思路：
分而治之/hash映射：順序讀文件中，對于每個詞x，取hash(x)P00，然後按照該值存到5000個小文件（記為x0,x1,...x4999）中。這樣每個文件大概是200k左右。如果其中的有的文件超過了1M大小，還可以按照類似的方法繼續往下分，直到分解得到的小文件的大小都不超過1M。
hash統計：對每個小文件，采用trie樹/hash_map等統計每個文件中出現的詞以及相應的頻率。
堆/歸并排序：取出出現頻率最大的100個詞（可以用含100個結點的最小堆），并把100個詞及相應的頻率存入文件，這時我們又得到了5000個文件。最後把這5000個文件進行歸并（類似與歸并排序）的過程。

類似這樣的方案應該有很多，我們共同去研究學習，經驗都是個人實踐總結出來的，以上僅代表個人觀點。以此分享給大家，不足之處望大家留言補充。
,
更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

職場專業監理工程師如何就業
一、考試改革肯定了證書的價值2020年，住房和城鄉建設部、交通運輸部、水利部、人力資源和社會保障部正式發布《監理工程師職業資格制度規定》和《監理工程師職業資格制度規定》。《監理工程師職業資格考試實施辦法》，對監理工程師考試進行了改革。以上反... 2022-11-28
職場面試時建議轉崗
求職說疫情緻使很多企業啟動線上面試，也是應聘的新的模式，但是你真的知道怎麼應試嗎？提前做好這些準備，穩穩拿下線上面試1、熟悉簡曆内容看到這個很多人會覺得很搞笑，簡曆是自己寫的，内容上肯定是很清楚的，但現實往往是相反的，很多人寫簡曆就是網上下... 2022-12-07
職場機關事業單位平均工資
#頭條創作挑戰賽#在網上我們總能看到一些曬自己工資的，自稱是哪個地區哪個單位的公務員，這些人曬的工資都比較高，惹得衆網友是羨慕紛紛。很多時候，曬工資的這種人完全就不是本人，也不是機關事業單位人員，而是一些人根據網上零碎的信息編造的。就比如... 2023-01-08
職場班組長可以加入公司嗎
近年來中國鐵路哈爾濱局集團有限公司特别重視班組長隊伍建設将班組長精準定位為最基層的“一把手”吸引更多優秀大學畢業生從最基層做起小編從這些出色的“一把手”中找出6位“95後”典型一起看看年輕的班組長們↓↓每天都忙些啥↓↓8:00牡丹江電務段雞... 2022-12-02
職場領導說我是老實人什麼意思
在職場中，領導總是會對職場人士予以評價，而他們的每一句話都是有其弦外之音，正确地理解領導所言對職場人士尤為重要。當領導說你太善良了時，他究竟是什麼意思呢？一.什麼是職場的“善良”所謂“善良”，辭典是這樣解釋的：“善良是指心地純潔，純真溫厚，... 2023-04-01
職場領取法律職業資格證書需要宣誓嗎
近些日子，小瑞到北京市政務服務中心采訪到一位瑞達通關學員。該學員客觀題211分，主觀題118分，通過了2021年法律職業資格考試，4月25日上午來領取法律職業資格證書，在采訪過程中，談到備考過程的艱辛時，他落淚了。非法本在職考生，2021年... 2023-01-24
職場順德碧桂園學校官網
廣東碧桂園職業學院由碧桂園集團董事會主席楊國強先生、聯席主席楊惠妍女士建立的廣東省國強公益基金會投資創辦，經廣東省人民政府批準、教育部備案、廣東省教育廳主管的一所慈善性質的民辦全日制普通高等學校。碧桂園集團是廣東碧桂園職業學院人才培養的主體... 2023-03-01
職場商務部是做什麼的
商務部是做什麼的?商品服務是指以實物産品為基礎的行業，為支持實物産品的銷售而向消費者提供的附加服務，下面我們就來說一說關于商務部是做什麼的?我們一起去了解并探讨一下這個問題吧!商務部是做什麼的商品服務是指以實物産品為基礎的行業，為支持實物産... 2022-07-17
職場河南信息與統計職業學院北校區
來源：【開封廣播電視報】6月27日下午，河南信息統計職業學院與河南博物院共建文物保護與修複專業戰略合作框架協議在河南博物院舉行。河南博物院院長馬蕭林、黨委副書記丁福利、文物修複與保護研究中心主任單曉明、副主任杜安，河南信息統計職業學院院長梁... 2023-03-11
職場雙創學院與雙創基地
西安歐亞學院2021年度雙創工作總結表彰暨2022年度雙創工作啟動會現場12月1日下午，西安歐亞學院2021年度雙創工作總結表彰暨2022年度雙創工作啟動會在大學生活動中心舉行。西安歐亞學院董事長胡建波，副校長李正、張軍宏、張樂芳、王曉華出... 2023-03-09
職場大司馬為什麼離開鬥魚了
最近電競圈所有事件可謂是都在圍繞着鬥魚打轉，先是平台多名主播開挂，後來又是跳槽事件。說起跳槽事件，目前熱度最高的當屬蕪湖大司馬。蕪湖大司馬已經停播數日，期間pdd還透漏又一名大主播跳槽虎牙，大家都知道，pdd與蕪湖大司馬不僅是上下級關系，還... 2022-11-21
職場西安歐亞學院新校區建設單位
2022年7月11日上午，西安歐亞學院2022年中工作會議在大學生活動中心舉行。本次會議對年度重點任務完成情況進行了回顧，分享了學校階段性工作成果，明确了下半年重點工作思路，為年度目标達成奠定了良好基礎。會議通過小型現場會議與網絡同步直播的... 2023-03-09
職場 95版pvz寶石迷陣怎麼過
各位小夥伴大家好，此前玩咖遊戲寶典曾為大家介紹了《未知：升變》的遊戲玩法和遊戲内容。但作為一款高難度遊戲，我想不會就我一個人在第一天沒通關吧!本次玩咖遊戲就帶大家來看看本人的首次通關玩法搭配吧。PS：本文有參考網絡上的大神搭配第一階段：開局... 2023-01-08
職場工作後怎麼樣才能讀全日制大專
工作後怎麼樣才能讀全日制大專?面試官:簡單介紹一下自己我:我叫xx，來之xx，現住在xx我應聘的職位是xx，本人性格……愛好……，我來為大家科普一下關于工作後怎麼樣才能讀全日制大專?下面希望有你要的答案，我們一起來看看吧!工作後怎麼樣才能讀... 2022-11-30
職場田亮女兒首獲網球青少年世界排名
田雨橙擊敗對手晉級次輪。圖/ITF官網新京報訊（首席記者孫海光）1月31日，跳水奧運冠軍田亮的女兒田雨橙首次亮相國際青少年網球賽事。今天上午進行的ITF（國際網球聯合會）新加坡青少年冠軍賽J30中，持外卡參賽的田雨橙首輪戰勝新加坡選手董奕卓... 2023-03-29
職場退休工資發少了怎麼找回
今天我們來說一說，如果退休工資發錯了，我們應當如何處理？在退休之後，退休人員就開始按月領取養老金。一般來說，退休工資的計算公式是比較複雜的，相關計算也是由相關部門來完成的，一般不會出錯。但是任何事情都有萬一，退休金也存在着計算錯或者是發錯的... 2023-03-29
職場五十歲大姐想再婚
文|塗兔魚我周圍很多大齡剩女，因為沒有遇到那個合适的人，不想将就，所以遲遲不肯結婚。但是他們個個獨立優秀，在工作上獨當一面，在生活中優雅自信。我覺得這種人一輩子不結婚都沒事，因為一輩子遇不到合适的人，一輩子都有錢花，因為自己有能力實現人生自... 2023-03-08
職場職業生涯決策的常用方法
【小序：這是一群來自不同地域、不同職業、不同年齡，懷着相同願望相遇于社科小院的學生，他們用自己的故事，講述決策如何讓自己成長。】選擇，像是一種不需承擔後果的放肆無拘束的自由；決策，更像是一種承載着責任的選擇。人生的道路是漫長的，但關鍵的那幾... 2023-02-02
職場企業戰略目标及诠釋
戰略管理門派衆多，不管師出何門，戰略規劃甚至于企業創立那一刻起就得做一件非常重要的事：确定企業的使命、願景和戰略目标。怎麼來理解三者關系呢？我比較認同的說法是：使命是企業應該做的事情；願景是适合自己且自己願意做的事情（既可以是我們将做什麼，... 2022-12-12
職場如何拒絕面試邀請
如何拒絕面試邀請?要表示感謝謝謝公司願意花人力物力來邀請面試在結尾的時候，不要把話說得太死，可以表示希望未來還有合作的機會，接下來我們就來聊聊關于如何拒絕面試邀請?以下内容大家不妨參考一二希望能幫到您!如何拒絕面試邀請要表示感謝。謝謝公司願... 2022-07-12
職場員工安全生産常識教育ppt 228頁
新員工公司級安全生産培訓, 2023-03-02
職場 hr面試提問12種方法
面試時HR常問的幾大問題！教你掌握面試主動權！作為一名大型國有企業資深求職者，大大小小參加過無數場面試，今天把面試時HR常問的幾個問題分享給大家，讓大家掌握面試主導權！1、面試官：請做一下自我介紹。求職者：我叫哈欠，畢業于哈欠大學，專業是哈... 2022-10-21
職場深圳男子在路邊求救
【信源】磁浮公司【編輯】倪炜近日，早高峰時段東方體育中心地鐵站，8号線往沈杜公路方向站台上，一位冒着冷汗表情痛苦的乘客向站台工作人員求助。站務員第一時間利用對講機将情況彙報給車控室，值班站長吳偉忠得知後立刻叫上駐站民警前往現場。到達現場後，... 2023-03-02
職場商丘新冠肺炎疫情信息登記管理
商丘新冠肺炎疫情信息登記管理?商丘市檔案館是集中和永久保管商丘市地方曆史檔案資料的綜合檔案館為真實記錄貫徹落實黨中央部署和要求，在市委、市政府正确領導下，全市社會各界和廣大人民群衆奮力抗擊疫情的曆史過程，确保疫情防控工作的珍貴記憶得以永存，... 2023-03-09
職場哪些公司必須為員工繳納五險一金
企業單位，是不是一定要給自己的員工繳納五險一金呢？這個是不一定的，為什麼？因為它取決于勞動合同關系的因素來決定。如果說你跟自己的企業單位建立了全日制的勞動合同關系，并且依法簽訂了勞動合同書，那麼這種情況下就應該嚴格的根據勞動合同法的規定為員... 2022-11-03
職場工地上施工受了一點小傷算工傷嗎
在工地上幹過活的小夥伴都知道，工地上是一個非常危險的地方，隻要是不注意就會發生危險，可以說危險是無處不在的。所以在工地上幹活一定要小心，小心，再小心！在今年我們老闆因為一個工人的粗心大意賠償了80000元，并且是第一天上班！在我們抹灰班組裡... 2023-02-07
職場面試題的答案在哪裡看
近日，一道面試題登上熱搜面試官：如果有5杯水卻來了6個領導，你該怎麼辦?面對這個“刁鑽”問題，某網友給出了“諧音梗”式的回答：據了解，這道面試題的近似版本曾出現在大學生求職面試環節中。據工人日報客戶端報道，鐵托是西安某高校計算機科學與技術專... 2023-04-01
職場找工作被騙10萬怎麼辦
找工作被騙10萬怎麼辦?為提高廣大群衆的防騙意識和識騙能力，本周，珠海公安将推出防範“冒充客服”騙局系列專題，公布一批“冒充客服”常用手法，增強廣大群衆識騙防騙能力，現在小編就來說說關于找工作被騙10萬怎麼辦?下面内容希望能幫助到你，我們來... 2023-02-03
職場少年公益學院志願者是幹什麼的
為進一步加強未成年人思想道德建設，增強未成年人安全意識和自我防範意識，促進未成年人健康成長，9月20日，山東經貿職業學院組織了20名志願者來到志願服務基地——濰坊市濰城區倉南街社區清華星幼兒園，開展了“關愛未成年牽手共成長”志願服務活動。活... 2023-01-12
職場山東電子職業技術學院智能制造
齊魯網·閃電新聞9月23日訊為深入推進産教融合，深化校企合作，推動職業教育發展，9月22日下午，濟南職業學院與濟南二機床集團有限公司舉行新時代産教融合戰略合作簽約暨吉爾智能制造産業學院揭牌儀式。濟南二機床董事長張世順、濟南職業學院黨委書記蘇... 2023-01-19

tft每日頭條

> 職場

> 大數據面試150題

大數據面試150題

相关職場资讯推荐

热门職場资讯推荐

网友关注