程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> SyBase數據庫 >> SyBase綜合文章 >> Sybase IQ以“綠色數據庫”構建綠色信息環境

Sybase IQ以“綠色數據庫”構建綠色信息環境

編輯:SyBase綜合文章

如今,由於網絡應用的飛速發展、多媒體數據的日益增長、視頻音頻等內容的豐富、更長時間段數據的存儲需求等因素,企業需要進行管理的數據正在以指數級速度增長。分析人員發現,公司收集、存儲和分析的有關客戶、財務、產品和運營的數據,其增長率達 125% 之多。面對海量的信息,企業不得不為了保存大量在線數據以及數據膨脹而在存儲硬件上大量投資,令總成本不斷上升;同時,持續的數據庫管理維護也令企業面臨人力、時間等資源過度使用的挑戰。數字爆炸的現實促使企業在迫切尋找降低成本提高性能的持續發展之路。

致力於信息管理和信息移動技術的企業級軟件公司Sybase在第36屆“世界環保日”來臨之際,秉承綠色環保的理念,率先推出“綠色數據庫”的全新概念。Sybase IQ堅決反對在數據倉庫等分析型應用的開發中,對硬盤、CPU、內存、人力、時間等資源的過度使用,而提倡以更低的成本和資源獲取更高的性能和績效,保證企業生態的可持續發展。

這是軟件行業內第一次提出綠色概念,它不僅彰顯了Sybase以領先科技為企業營造健康成長環境的理念,還體現了革命性創新產品Sybase IQ低成本和高性能的卓越本質。

綠色數據指標SPoT

同綠色環保一樣,在信息環境中,我們必須尋找更合適的方法去合理利用資源。只有在使用更少的物質資源(包括更少的硬件、CPU、內存等),更少的人力資源,更少的時間資源,來完成一個系統的同時,依然保持系統的高性能和可擴展能力,才能給企業帶來可持續發展的綠色效應。

相應的,在一個數據倉庫解決方案中,客戶也會非常關注:企業所采用的目標解決方案 (Resource of Target Solution)使用多少資源,在多少信息源的基礎上 Source Data) ,獲得怎樣的性能 Performance) 。

因此,作為衡量企業綠色信息環境的標准,Sybase提出綠色數據指標——SPoT:

SPoT=S*P/T,每單位資源所能處理的源數據及其相關性能指數。

(S代表源數據大小;P代表數據庫性能指數;T代表目標數據庫所使用的資源)

比如綜合查詢性能,我們可以在1TB的源數據下,使用同樣的CPU,內存資源,通過數10條不同的查詢來測試不同數據庫所用的查詢時間,查詢時間越短,性能指數越高,P越大。

按照該公式,在P相同的情況下,S/T越大代表綠色指數越高。在S相同的情況下,P/T越高,代表綠色指數越高。一般而言,因用戶在選用數據庫產品時,都是在追求一定的性能要求,例如查詢性能、加載性能等。因此,在比較不同數據庫綠色指數時,我們通常看作用戶需求的P是一致的。而S/T將有效的反映出數據庫在被加載後節省資源的情況。對於當資源T中的服務器、CPU、內存等資源相同時,僅以數據庫所需的存儲空間代表資源,則S/T代表數據庫的壓縮比。

綠色數據庫Sybase IQ

總體上,傳統數據庫的SPoT值均小於1, 而Sybase IQ有別於所有同類數據庫產品Oracle、DB2、SQL Server),SPoT值大於1。Sybase IQ 關系型數據庫,專為數據倉庫等分析型應用而設計,以眾多革命性的創新技術,如列存儲、數據壓縮、豐富的索引、Multiplex(多叢架構)等等,為企業減少數據存儲成本達3-10倍、提高查詢速度10-100倍、縮短部署周期數倍、提供接近無限的可擴展能力。

如今,任何企業都面臨著業務和IT投入的壓力,系統的性能/價格比尤其是ROI(投資回報率)也越來越受重視。企業因為保存大量在線數據以及數據膨脹而需要在存儲硬件上大量投資,雖然存儲設備的成本在下降,但存儲的總體成本卻在不斷增加,並且正在成為最大的一筆 IT 開支之一。例如2005年Wintercorp曾做過的全球十大數據倉庫比較:從原始數據上看,Sybase IQ的最大實施者Nielsen Media Research的初始數據量是17.9T,而Yahoo是17.0T,Nielsen Media比Yahoo的原始數據還要多近一個T。然而Yahoo的數據倉庫大小約為100T, Nielsen Media Research則只有17.6T,在原始數據多一個T的情況下,NIElsen Media的數據倉庫顯著縮小,而Yahoo的數據倉庫卻膨脹了大概6倍。有數據表明,每節省1TB的存儲,可節省約30萬元人民幣的成本。試問,對於一個數據應用規模較大的企業,在獲得相同性能的情況下,是願意花17T的成本,還是100T的成本呢?(據稱,目前Yahoo的數據倉庫容量已高達250TB,按照6倍的膨脹比例計算,約200TB的存儲空間合計約6000萬人民幣是完全可以通過Sybase IQ節約下來的成本。)由此可見,在Sybase IQ獨特的列式存儲、數據壓縮等技術的支持下,SPoT大於1,則表明ROI更高,恰恰實現了幫助企業利用有限的成本來達到更高系統性能的目的。截至目前,Sybase IQ已經擁有全球電信、金融、政府、零售、媒體、教育等行業的超過1000家客戶,在中國市場更是連續兩年保持著100%的增長。

那麼,Sybase IQ是如何實現以上的綠色效應呢?我們從以下幾個方面來了解其獨到之處:

列存儲——有別於傳統的關系型數據庫,Sybase IQ是按照數據表中的列來存儲與訪問數據的。基於列來讀取數據,即使在數據不斷膨脹的情況下,你也只需讀出你想要了解的數據,避免了重復的全面掃描,顯著提供查詢速度,進而提升了性能指數P;同時,由於同一列中的所有數據域有相同的數據類型,因此,每一列都可以以更優化的效率和檢索進行壓縮,從而降低了占用的資源T。

數據壓縮——正是由於數據按列存儲,相鄰的字段值具有相同的數據類型,所以壓縮更容易,通常能得到大於50%的壓縮。在海量數據下,隨著數據的大幅壓縮,所占用的空間等資源成本會顯著減少。因此,更大的壓縮比,加上大頁面,使得Sybase IQ在獲得優良查詢性能的同時,減少了對存儲空間的需求,因此占用的資源T也大大降低了。

豐富的索引——傳統的關系型數據庫引擎只能一對一的解決問題,在數據爆炸的今天,如此“大海撈針”似的查詢會令反應速度非常遲緩。而Sybase IQ針對數據倉庫應用有多種不同的索引技術,並且這些技術中的每一個都與數據倉庫的查詢問題相吻合,從而顯著減少給定查詢或更新的工作量,加快查詢速度,自然帶動性能P的提升。

Multiplex可擴展能力——Sybase IQ的Multiplex組件增加了在單一的Sybase IQ環境中支持多個SMP機器節點的功能,顯著的減輕了進程與內存負擔。因此,在信息飛速增長的商業社會,它允許數據倉庫從基礎開始擴展,從很小的規模擴展到非常巨大的規模,擁有卓越的可擴展能力,避免了數據爆炸帶來的更新和不便。

總之,正是憑借以上引領未來的核心科技,Sybase IQ 在保證數據壓縮的目標下,能夠同時提高查詢性能。因此,不論以S/T即數據庫壓縮比),P/T,還是從整體SPoT公式來看,Sybase IQ 都擁有更高的綠色數據指標,是“綠色數據庫”的完美體現。

信息飛速膨脹的時代呼喚有效利用資源的綠色科技。綠色數據庫Sybase IQ是對傳統商業智能軟件的挑戰,引領了未來關系型數據庫的發展方向,其低成本、高效能的綠色效應必將促進企業健康持久成長,營造和諧持續發展的綠色信息環境。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved