IBM、Oracle、Sybase、CA、NCR、Informix、Microsoft、和SAS等有實力的公司相繼(通過收購或研發的途徑)推出了自己的數據倉庫解決方案,BO和Brio等專業軟件公司也在前端在線分析處理工具市場上占有一席之地。下面針對這些數據倉庫解決方案的性能和特點做分析和比較。
IBM公司提供了一套基於可視數據倉庫的商業智能(BI)解決方案,包括:Visual Warehouse(VW)、Essbase/DB2 OLAP Server 5.0、IBM DB2 UDB,以及來自第三方的前端數據展現工具(如BO)和數據挖掘工具(如SAS)。其中,VW是一個功能很強的集成環境,既可用於數據倉庫建模和元數據管理,又可用於數據抽取、轉換、裝載和調度。Essbase/DB2 OLAP Server支持“維”的定義和數據裝載。Essbase/DB2 OLAP Server不是ROLAP(Relational OLAP)服務器,而是一個(ROLAP和MOLAP)混合的HOLAP服務器,在Essbase完成數據裝載後,數據存放在系統指定的DB2 UDB數據庫中。嚴格說來,IBM自己並沒有提供完整的數據倉庫解決方案,該公司采取的是合作伙伴戰略。例如,它的前端數據展現工具可以是Business Objects的BO、Lotus的Approach、Cognos的Impromptu或IBM的Query Management Facility;多維分析工具支持Arbor Software的Essbase和IBM(與Arbor聯合開發)的DB2 OLAP服務器;統計分析工具采用SAS系統。
Oracle數據倉庫解決方案主要包括Oracle Express和Oracle Discoverer兩個部分。Oracle Express由四個工具組成:Oracle Express Server是一個MOLAP (多維OLAP)服務器,它利用多維模型,存儲和管理多維數據庫或多維高速緩存,同時也能夠訪問多種關系數據庫;Oracle Express Web Agent通過CGI或Web插件支持基於Web的動態多維數據展現;Oracle Express Objects前端數據分析工具(目前僅支持Windows平台)提供了圖形化建模和假設分析功能,支持可視化開發和事件驅動編程技術,提供了兼容 Visual Basic語法的語言,支持OCX和OLE;Oracle Express Analyzer是通用的、面向最終用戶的報告和分析工具(目前僅支持Windows平台)。Oracle Discoverer即席查詢工具是專門為最終用戶設計的,分為最終用戶版和管理員版。在Oracle數據倉庫解決方案實施過程中,通常把匯總數據存儲在Express多維數據庫中,而將詳細數據存儲在Oracle關系數據庫中,當需要詳細數據時,Express Server通過構造SQL語句訪問關系數據庫。但目前的Express還不夠靈活,數據倉庫設計的一個變化往往導致數據庫的重構。另外,目前的 Oracle 8i和Express 之間集成度還不夠高,Oracle 8i和Express之間需要復制元數據,如果Oracle Discoverer(或BO)需要訪問匯總數據,則需要將匯總數據同時存放在Oracle和Express中,系統維護比較困難。值得注意的是,剛剛問世的Oracle 9i把OLAP和數據挖掘作為重要特點。
Sybase提供的數據倉庫解決方案稱為Warehouse Studio,包括數據倉庫的建模、數據抽取與轉換、數據存儲與管理、元數據管理以及可視化數據分析等工具。其中,Warehouse Architect是PowerDesigner中的一個設計模塊,它支持星形模型、雪花模型和ER模型;數據抽取與轉換工具包括PowerStage、 Replication Server、Carleton PASSPORT,PowerStage是Sybase提供的可視化數據遷移工具。 Adaptive Server Enterprise是Sybase企業級關系數據庫,Adaptive Server IQ是Sybase公司專為數據倉庫設計的關系數據庫,它為高性能決策支持系統和數據倉庫的建立作了優化處理,Sybase IQ支持各種流行的前端展現工具(如Cognos Impromptu、Business Objects、Brio Query等);數據分析與展現工具包括PowerDimensions、EnglishWizard、InfoMaker、PowerDynamo等, PowerDimensions是圖形化的OLAP分析工具,它支持SMP和多維緩存技術,能夠集成異構的關系型數據倉庫和分布式數據集市,從而形成單一的、新型的多維模式;數據倉庫的維護與管理工具包括Warehouse Control Center、Sybase Central、Distribution Director,其中Warehouse Control Center是為數據倉庫開發人員提供的元數據管理工具。 Sybase提供了完整的數據倉庫解決方案Quick Start DataMart,具有良好的性能,並支持第三方數據展現工具。從Quick Start DataMart的名稱不難看出,它尤其適合於數據集市應用。另外,Sybase可以提供面向電信、金融、保險、醫療保健這4個行業的客戶關系管理(CRM)產品,在這4個產品中,有80%的功能是共性的,有20%的功能需要Sybase與合作伙伴針對不同需求共同開發。
Informix於1998和1999年相繼收購了國際上享有盛譽的數據倉庫供應商Red Brick System和數據管理軟件供應商Ardent,並提供了完整、集成的數據倉庫解決方案。該解決方案還包括一個“快速啟動”咨詢服務,能夠幫助用戶快速完成數據倉庫或數據集市的開發。Informix產品能夠集成Microsoft IIS或Netscape Enterprise/FastTrack服務器,從而支持基於Web的數據倉庫應用。 Informix沒有提供自己的報表和數據挖掘工具,但他們與Brio和SAS公司建立了戰略聯盟,並推出了“Informix商務智能聯盟計劃”。該計劃以Informix為主,結合Brio的前端數據分析和報表功能,以及SAS的數據挖掘功能,形成了一個“BI中心”打包方案。(今年4月Informix Software已被IBM公司收購,此舉將給IBM公司數據庫及數據倉庫產品,從技術和市場占有率上帶來極大的提升。)
CA於1999年收購了Platinum Technology公司後,得到了完整的數據倉庫解決方案,包括:Erwin數據倉庫設計工具、InfoPump數據轉換與抽取工具、 InfoBeacon ROLAP服務器、Forest&Trees前端數據展現工具、Provision系統監視與作業調度工具和DecisionBase元數據管理工具等。與Informix 解決方案相似,CA解決方案也提供了數據倉庫建模、元數據管理、數據抽取與轉換、基於關系數據庫的在線分析服務器、系統監視與作業調度、前端數據展現等功能,同時還支持Web應用。不同之處是Informix提供了專門為數據倉庫設計的高性能目標數據庫(Red Birck),而CA解決方案則提供ODBC接口,並將數據存儲在第三方關系數據庫(如Oracle、Sybase、SQL Server、Informix和IBM DB2等)中,其性能要打一些折扣,但開放性要好些。另外,CA的OLAP服務器目前只能與Microsoft的IIS Web服務器集成。
NCR Teradata是高端數據倉庫市場最有力的競爭者,主要運行在NCR WorldMark SMP硬件的Unix操作系統平台上。1998年,該公司也提供了基於Windows NT的Teradata,試圖開拓數據集市(Data Mart)市場。總的來看,NCR的產品性能很好,Teradata數據倉庫在100GB、300GB、1TB和3TB級的TPCD指標測試中均創世界紀錄。但是,NCR產品的價格相對較高,中小企業用戶難以接受。
Microsoft將OLAP功能集成到Microsoft SQL Server 7.0中,提供可擴充的基於COM的OLAP接口。它通過一系列服務程序支持數據倉庫應用。數據傳輸服務DTS(Data Transformation Services)提供數據輸入/輸出和自動調度功能,在數據傳輸過程中可以完成數據的驗證、清洗和轉換等操作,通過與Microsoft Repository集成,共享有關的元數據;Microsoft Repository存儲包括元數據在內的所有中間數據;SQL Server OLAP Services支持在線分析處理;PivotTable Services提供客戶端OLAP數據訪問功能,通過這一服務,開發人員可以用VB或其他語言開發用戶前端數據展現程序,PivotTable Services還允許在本地客戶機上存儲數據;MMC(Microsoft Management Console)提供日程安排、存儲管理、性能監測、報警和通知的核心管理服務;Microsoft Office 2000套件中的Access和Excel可以作為數據展現工具,另外SQL Server還支持第三方數據展現工具。
SAS公司在20世紀70年代以“統計分析”和“線性數學模型”而享譽業界,90年代以後,SAS公司也加入了數據倉庫市場的競爭,並提供了特點鮮明的數據倉庫解決方案,包括30多個專用模塊。其中,SAS/WA(Warehouse Administrator)是建立數據倉庫的集成管理工具,包括定義主題、數據轉換與匯總、更新匯總數據、元數據管理、數據集市的實現等; SAS/MDDB是SAS用於在線分析的多維數據庫服務器;SAS/AF提供了屏幕設計功能和用於開發的SCL(屏幕控制語言);SAS/ITSV(IT Service Vision)是IT服務的性能評估和管理的軟件,這些IT服務包括計算機系統、網絡系統、Web服務器和電話系統等。SAS系統的優點是功能強、性能高、特長突出,缺點是系統比較復雜。
Business Objects(BO)是集查詢、報表和OLAP技術為一身的智能決策支持系統。它使用獨特的“語義層”技術和“動態微立方”技術來表示數據庫中的多維數據,具有較好的查詢和報表功能,提供鑽取(Drill)等多維分析技術,支持多種數據庫,同時它還支持基於Web浏覽器的查詢、報表和分析決策。雖然BO 在不斷增加新的功能,但從嚴格意義上說,BO只能算是一個前端工具。也許正因為如此,幾乎所有的數據倉庫解決方案都把BO作為可選的數據展現工具。雖然國內有很多大學和研究機構從事數據倉庫技術的研究,但到目前為止,國內基本上沒有成熟的數據倉庫解決方案。