程式師世界 >> 編程語言 >> 更多編程語言 >> 編程綜合問答 >> 海量數據-大眾點評面試題:有10個文件，每個文件1G，每個文件的每一行存放的都是用戶的query....

海量數據-大眾點評面試題:有10個文件，每個文件1G，每個文件的每一行存放的都是用戶的query....

編輯：編程綜合問答

大眾點評面試題:有10個文件，每個文件1G，每個文件的每一行存放的都是用戶的query....: 有10個文件，每個文件1G，每個文件的每一行存放的都是用戶的query，每個文件的query都可能重復。要求你按照query的頻度排序10個文件中的所有query。
http://www.manong1024.com/q/355

最佳回答：

先說解決方案。在不計內存消耗的情況下。構建一個全局Map，其中Key為query，value為計數器。然後開10個線程，分別讀取文件，然後，操作Map，如果key已存在，value計算器加1，如果Key不存在，新增一個Entry，value記為1。。當然處理時主要多線程同步就行了。。。。當然也可以構建10個Map，都處理完後做Map合並。。。最後對Map進行排序就可以了。。。處理過程中，如果內存開銷太大可以將Map改為數據庫存儲。就可以了。。。。。。當然如果有hadoop平台直接使用wordcount就更完美了。

編程綜合問答

web開發-WEB開發當中，定時器如何選擇？有勞各位大大描述下為什麼選擇這種定時器。

WEB開發當中，定時器如何選

mysql-Mysql contact 連接數字怎麼把那

Mysql contact

shell-怎麼用Git Shell把線上fork的倉庫下載到本地？

怎麼用Git Shell把線

ie 8-innerHTML的兼容問題？IE8以上提交數據後獲取不了內容

innerHTML的兼容問題

word文檔-Android 如何將一個文本保存成Word文檔

Android 如何將一個文

java-關於c++和Java的問題，耽誤幾分鐘的時間幫幫忙

關於c++和Java的問題，