我們都知道2005 Winter TopTen Award Winners的相關報告,它包含了一些直接關系到世界排名,其前幾位的 VLDB 的信息。VLDB,超大Oracle數據庫,其實叫做"狂大數據庫"倒是也很貼切。
如果不區分操作系統環境,Yahoo! 力拔數據倉庫一項的頭籌,單個數據庫數據大小接近 100T 。采用的是 Oracle 數據庫,部署在 Unix 上, 存儲是 EMC 的設備。這是 2005年的數據,雅虎現在每日接近 40 億 PV,這個數據倉庫現在應該遠超 100T 了吧。
電信巨頭 AT&T 的數據倉庫屈居亞軍。Amazon 的兩個數據倉庫也不小,數據量多達 24773 GB,是用 Oracle RAC 實現的,部署在 Linux 操作系統上。
OLTP Top 10
我比較關心 OLTP 數據庫的情況。下面這個圖表是包括所有操作系統環境的 OLTP 數據庫情況。前 10 名中只有兩個采用了集群,而且都是集中式集群(Centralized/Cluster)。其余8個席位都采用了 SMP 架構,而且大多是集中式(Centralized)。
分布式超大 OLTP 的成功案例看來並不多(只有 1 例,另外有一例是Federated)。讓 Fenng 稍微有些驚訝的是 SQL Server 占了三個席位,數據量最大接近 8T 。整個表看來,數據庫類別、所用的軟件平台還真的比較平均。並非我想象的完全是 DB2/Oracle+Unix 的格局。
Unix 上 OLTP TOP 10
下表是使用 Unix 操作系統 OLTP TOP 10。好家伙,幾乎清一色的 Oracle。DB2 不見蹤影,只有 Sybase ASE 還算爭氣,占了一個席位。 9 個 Unix 平台上的 Oracle OLTP DB,只有兩個使用了 RAC ,其他都是 Centralized/SMP。
到現在為止,都還沒有看到互聯網站點的身影。
Linux 上 OLTP Top
終於有互聯網公司出現了。
仍然全部是 Oracle 數據庫。而且, 四個中的三個都是通過 RAC 來實現的。
從上面的數據可以作如下總結:
1) Linux 上 Oracle 通過 RAC 可以提高擴展能力;
2) 但是,Oracle RAC 的擴展性並非那麼好;
如果從峰值處理能力(Peak Workload)的角度上看,Oracle 就不那麼風光了。DB2 與 CA 的 CA-Datacom 瓜分了 10個 席位。操作系統平台都是 z/OS。 排在第一的是 UPS 的Oracle數據庫系統,每個小時處理 1,134,034,718 條 SQL 語句。很強悍。
或許有個的朋友看過我介紹的 eBay 的數據量,可能比較納悶,為何整個報告中沒有 eBay 數據庫上榜? Fenng 猜測是 eBay SOA 化之後,單個的Oracle數據庫就並不大了,這樣也避免了風險。