一、什麼是bson
BSON是一種類json的一種二進制形式的存儲格式,簡稱Binary JSON,它和JSON一樣,支持內嵌的文檔對象和數組對象,但是BSON有JSON沒有的一些數據類型,如Date和BinData類型。
BSON可以做為網絡數據交換的一種存儲形式,這個有點類似於Google的Protocol Buffer,但是BSON是一種schema-less的存儲形式,它的優點是靈活性高,但它的缺點是空間利用率不是很理想,BSON有三個特點:輕量性、可遍歷性、高效性,
{“hello":"world"} 這是一個BSON的例子,其中"hello"是key name,它一般是cstring類型,字節表示是cstring::= (byte*) "/x00" ,其中*表示零個或多個byte字節,/x00表示結束符;後面的"world"是value值,它的類型一般是string,double,array,binarydata等類型。
二、bson在MongoDB中的使用
MongoDB使用了BSON這種結構來存儲數據和網絡數據交換。把這種格式轉化成一文檔這個概念(Document),因為BSON是schema-free的,所以在MongoDB中所對應的文檔也有這個特征,這裡的一個Document也可以理解成關系數據庫中的一條記錄(Record),只是這裡的Document的變化更豐富一些,如Document可以嵌套。
MongoDB以BSON做為其存儲結構的一種重要原因是其可遍歷性。
三、幾個BSON的例子
3.1 一個Document的BSON表示:
復制代碼 代碼如下:
{
title:"MongoDB",
last_editor:"192.168.1.122",
last_modified:new Data("27/06/2011"),
body:"MongoDB introduction",
categories:["Database","NoSQL","BSON"],
revieved:false
}
這是一個簡單的BSON結構體,其中每一個element都是由key/value對組成的
3.2 一個嵌套的例子
復制代碼 代碼如下:
{
name:"lemo",
age:"12",
address:{
city:"suzhou",
country:"china",
code:215000
}
scores:[
{"name":"english","grade:3.0},
{"name":"chinese","grade:2.0}
]
}
這是一種相對復雜點的例子,其中包括了地址對象和分數對象數組,這裡使用了嵌套文檔對象與文檔對象數據來表示單個學生的信息,這種嵌套的文檔結構要使用關系數據庫來做是比較復雜的。
4. BSON c++ 代碼分析
MongoDB源代碼樹中包括了BSON的代碼庫,你只要包含bson.h這個頭文件就行了,其中有四個類是比較重要的:
復制代碼 代碼如下:
* mongo::BSONObj,這個是BSON對象的表示
* mongo::BSONElement,這個是BSON對象中元素的表示方法
* mongo::BSONObjBuilder,這是構建BSON對象的類
* mongo::BSONObjIterator,這是用來遍歷BSON對象中每一個元素的一個迭代器
下面是創建一個BSON對象
復制代碼 代碼如下:
BSONObjBuilder b;
b.append("name","lemo"),
b.append("age",23);
BSONObj p = b.obj();
或者
復制代碼 代碼如下:
BSONObj p = BSONObjBuilder().append("name","lemo").append("age",23).obj();
或者用流的方法來
復制代碼 代碼如下:
BSONObjBuilder b;
b << "name" << "lemo" << "age" << 23;
BSONObj p = b.obj();
或者用宏來創建一個對象
復制代碼 代碼如下:
BSONObj p = BSON( "name" << "Joe" << "age" << 33 );
這裡分析一下這四個類的一些代碼:
mongo::BSONObj主要是用於存儲BSON對象的,具體的存儲格式如下
復制代碼 代碼如下:
<unsigned totalSize> {<byte BSONType><cstring FieldName><Data>}* EOO
-------------------- ------------- ----------------- ---- ---
totalSize: 一個總的字節長度,包含自身
BSONType: 對象類型,這裡有Boolean,String,Date等類型,具體可以參考bsontypes.h這個文件
FieldName: 這裡表示字段名
Data: 這裡是放具體的數據,數據的存儲方式根據不同的BSONType來
* : 表示可以有多個元素組成
EOO: 這是一個結束符,一般是/x00來表示
一般來說,BSONObj的創建都是通過BSONObjBuilder來做的,除非你已經得到了其字節流,那可以直接生成BSONObj
mongo::BSONElement 它主要是用於存儲對象中的單個元素,存儲格式如下
復制代碼 代碼如下:
<type><fieldName><value>
這個對象主要是指向BSONObj對象中具體元素的地址,它不實際存儲元素的值。
mongo::BSONObjBuilder 它主要是用於生成BSONObj,這個對象集成了StringBuilder,它主要用於存儲實際的字節點,用於替換std::stringstream,而這個StringBuilder集成了BufBuilder,這是一個可以動態增長內存緩沖區,但最大容量不能超過64MB的大小,也就是說一個BSONObj最大不能超過64MB。
mongo::BSONOBjIterator 它主要是用來遍歷BSONObj對象中的每一個元素,提供了類似於stl iterator的一些接口,它還提供了一個ForEach宏來提供更方便的操作,如
復制代碼 代碼如下:
if (foo) {
BSONForEach(e, obj)
doSomething(e);
}