MongoDB 是一個跨平台的,面向文檔的數據庫,提供高性能,高可用性和可擴展性方便。 MongoDB 工作在收集和文件的概念。
數據庫
數據庫是一個物理容器集合。每個數據庫都有自己的一套文件系統上的文件。一個單一的MongoDB服務器通常有多個數據庫。
集合
集合是一組MongoDB的文檔。它相當於一個RDBMS表。收集存在於一個單一的數據庫。集合不執行模式。集合內的文檔可以有不同的領域。通常情況下,一個集合中的所有文件是相同或相關的目的。
文檔
文檔是一組鍵 - 值對。文件動態模式。動態模式是指,在相同集合中的文檔不需要具有相同的字段或結構組的公共字段的集合的文檔,可以容納不同類型的數據。
1. 單表數據的導出
針對單表數據的導出操作,MongoDB 提供了 mongoexport 命令。mongoexport 既可以將數據導出為 CSV 格式的文件,也可以導出 JSON 格式的文件。這兩者之間的區別是:
JSON 是 mongoexport 默認的導出格式,不需要指定,而要導出 CSV 格式的話需要明確指定;導出 CSV 格式必須顯式指定各屬性名,而導出 JSON 格式不需要。由此可見導出 JSON 格式更靈活、更方便,而且對於復雜的表結構還不會有屬性丟失的風險,因此筆者比較傾向於這種導出格式。本文示例用的就是這種格式。
trans.sp 表結構如下:
{ "_id" : ObjectId("56ea7cc7ec8d83257c013844"), "orderNum" : "804918166317174541239", "sysOrderNum" : "43fd399715df4e874c773373c422a896", "respCode" : "09", "merId" : "991653448160401", "transAmt" : NumberLong(300), "transStatus" : "10", "transType" : NumberInt(1), "chanMerId" : "1244891002", "chanCode" : "WXP", "createTime" : "2016-03-17 17:45:43", "updateTime" : "2016-03-17 17:45:43", "refundStatus" : NumberInt(0), "fee" : NumberLong(2), "netFee" : NumberLong(2), "tradeFrom" : "openapi", "lockFlag" : NumberInt(0), "settRole" : "WXP", "currency" : "CNY", "busicd" : "PAUT", "agentCode" : "25911283", "qrCode" : "weixin://wxpay/bizpayurl?pr=lh73Vjt", "terminalid" : "802918", "errorDetail" : "處理中", "goodsInfo" : "雙山趣兒85g,3.0,1", "discountAmt" : NumberLong(0), "merName" : "雲高科技服務有限公司", "agentName" : "白山機構" }
使用 mongoexport 將該表導出:
$ mongoexport --host localhost --port 27017 --username quicktest --password quicktest --collection trans.sp --db quicktest --out trans.sp.json
2016-03-14T14:23:36.985+0800 connected to: localhost:27017
2016-03-14T14:29:28.085+0800 exported 2823382 records
trans.sp.json 大小為 2.6 G,共計兩百八十萬條記錄,本次導出耗時 6 分鐘。各參數具體說明:
--host 後的 localhost:要導出數據庫 ip--port 後的 27017:要導出的實例節點端口號--username 後的 quicktest:數據庫用戶名--password 後的 quicktest:數據庫用戶密碼--collection 後的 trans.sp:要導出的表名--db 後的 quicktest:要導出的表所在數據庫名--out 後的 trans.sp.json:要導出的文件路徑(默認為當前文件夾)
2. 單表數據的導入
有借有還,MongoDB 提供了與 mongoexport 命令相對應命令 mongoimport。以下是導入命令:
$ mongoimport --host localhost --port 27019 --username quicktest --password quicktest --collection trans.sp --db quicktest --file /opt/kdf/trans.sp.json
2016-03-17T18:15:33.909+0800 connected to: localhost:27019
2016-03-17T18:15:36.888+0800 [........................] quicktest.trans.sp 1
5.0 MB/2.5 GB (0.6%)
各參數具體說明:
-- host 後的 localhost:要導入的數據庫 ip--port 後的 27019:要導入的實例節點端口號--username 後的 quicktest:數據庫用戶名--password 後的 quicktest:數據庫用戶密碼--collection 後的 trans.sp:要導入的表名--db 後的 quicktest:要導入的表所在數據庫名--file 後的 /opt/kdf/trans.sp.json:要導入的源文件路徑(默認為當前文件夾)就這麼簡單。
但是有一些地方還是需要注意一下的:
mongoimport 執行導入前,新數據庫中沒有 trans.sp 表一樣可以導入成功;mongoexport 和 mongoimport 所需的各個參數輸入的先後順序不嚴格;對於副本集,mongoexport 的數據導出可以是副本集中的 primary 節點,也可以是 secondary 節點;對於副本集,mongoimport 的數據導入必須是 primary 節點;對於大數據量的導出,用 mongoexport 操作完全不會有生產問題;對於大數據量的導入(超過 500 MB),用 mongoimport 操作的話會很容易將 primary 節點拖垮,因為這會導致全量同步導致主節點崩潰,所以要避免生產環境中大數據量的導入。正確的做法是先建立單點,導入,之後再建立副本集。本文示例中所用 MongoDB 版本號為 3.2.1。
關於MongoDB單表數據的導出和恢復實例講解知識就給大家介紹到這裡,希望對大家有所幫助!