首先一點就是mongodb 不會釋放已經占用的硬盤空間,即使drop collection也不行,除非drop database。如果一個db曾經有大量的數據一段時間後又刪除的話,硬盤空間就是一個問題,如何收回被mongdodb占用的多余空間?方法有兩種
1. dump & restore
mongodump -d databasename -o /path/to/dump_dir echo 'db.dropDatabase()' | mongo <databasename> mongorestore -d <databasename> /path/to/dump_dir
如果數據量不大,dump不需要太長時間的情況下,或者經常備份有dump文件的情況下,這種方法很簡單。
2. repair database
即在mongo shell中運行
db.repairDatabase()
, 或者
db.runCommand({ repairDatabase: 1 })
, 第二種方法可以帶其他幾個參數
{ repairDatabase: 1, preserveClonedFilesOnFailure: <boolean>, backupOriginalFiles: <boolean> }
repairDatabase是官方文檔中認為唯一可以回收硬盤空間的方法。
repairDatabase is the appropriate and the only way to reclaim disk space.
當你有多個shard的且數據量巨大時,dump & restore方法會花費巨大的時間,這時第二種方法的優勢就很明顯,就是分別在每個shard上運行repairDatabase,結果會快很多。
PS:格式化mongo shell的輸出
如果數據量大的情況下,mongo shell 默認的輸出很亂,幾乎沒法閱讀。我們可以用.pretty() 來解決這樣的問題:
db.collection.find().pretty()
這樣的輸出會漂亮很多,每個field一行,
{ "_id" : ObjectId("5396cd3823e97923ba689ef3"), "batch" : 66, "category" : 4, "cover_imgs" : [ "/post_imgs/5396cd3823e97923ba689ef3/c_2.jpg", "/post_imgs/5396cd3823e97923ba689ef3/c_3.jpg", "/post_imgs/5396cd3823e97923ba689ef3/c_4.jpg" ], "created_at" : ISODate("2014-06-10T09:18:06.383Z"), "fav_count" : 0, "host_reply_count" : 338, "last_reply_date" : "2014-06-17 21:22:00", "post_date" : "2014-06-06 19:57:00", "referer" : "http://tieba.baidu.com/f?kw=%B9%C5%D7%B0%B5%E7%CA%D3%BE%E7", "reply_count" : 716, "reuse_type" : 2, "section" : "古裝電視劇", "seq" : 27180, "serial" : false, "sort_index" : 0.997, "source_site" : "貼吧", "updated_at" : ISODate("2014-06-18T09:04:55.228Z"), "visible" : true } { "_id" : ObjectId("5396c7ca23e97921fb7de8e4"), "batch" : 74, "category" : 4, }
配置使其成為Default:
添加如下配置到$HOME/.mongorc.js, 如果不存在則創建。
DBQuery.prototype._prettyShell = true
這樣就不需要每次使用pretty()方法了,直接db.collection.find()即可。