什麼是數據倉庫?
數據庫應用程序有兩種主要類型:在線事務處理(online transactional processing,OLTP)和數據倉庫,數據倉庫包括在線分析處理(online analytical processing,OLAP)和數據挖掘應用程序。DB2 9 同時適用於這兩種應用程序。OLTP 系統與業務智能(Business Intelligence,BI)數據倉庫系統的區別是什麼?區別在於訪問數據的典型查詢。
OLTP 系統可能是一個 Web 訂購系統,可以通過 Web 執行交易(比如購買產品)。這些應用程序的特征是進行細粒度的單行查詢,可能更新少量的記錄。與之相反,BI 類型的查詢執行大型的表掃描,因為它們嘗試在大量數據中尋找數據模式。如果要求您匯總西部地區的所有銷售,這就是倉庫查詢。
簡單地說,OLTP 是簡短的查詢,而 BI 是對大量數據進行搜索和匯總以便進行報告。當然,實際情況不只如此,但是現在您知道這麼多就夠了。
包含操作性數據 (運行企業的日常交易的數據)的系統是 OLTP 系統。但是,這些系統包含企業分析師用來了解企業運營情況的信息。例如,他們可以查看某一時間段內在某個地區銷售出了哪些產品。這有助於識別異常情況或對未來的銷售進行規劃。
但是,如果分析師直接訪問操作性(OLTP)數據來進行報告和其他 BI 活動,就會有幾個問題:
但是,在過去幾年裡,報告性數據存儲已經傾向於變得具有偽操作性和及時性。這種存儲稱為操作數據存儲(ODS)或活躍數據 倉庫。例如,考慮電信行業的情況。ODS 在這些電信運營公司中很流行,因為他們需要盡可能快地識別出惡意欠費的情況。DB2 是少數幾種同時適合操作性和報告性工作負載的數據庫。
數據倉庫 解決了這些問題。在數據倉庫中可以存儲信息性數據 —— 這些數據是從操作性數據中提取出來的,然後為幫助最終用戶決策進行了轉換和清理。例如,數據倉庫工具可能會復制操作性數據庫中的所有銷售數據,執行計算來匯總數據,並將匯總的數據寫入一個與操作性數據庫分開的數據庫中。最終用戶可以查詢這個獨立的數據庫(倉庫),而不會影響 OLTP 數據庫。
用於數據倉庫的 DB2 產品
DB2 是為幫助實現業務智能化而設計的。DB2 不但是世界上可伸縮性最好的數據庫,它還有一套健壯的業務智能化功能。DB2 有兩個 Data Warehouse Editions(DB2 DWE),以低廉的價格提供一整套數據倉庫工具。這些工具的一部分可以在 DB2 DWE 之外單獨購買,其他工具只能通過 DB2 DWE 包獲得。DB2 DWE 分為 Base 和 Enterprise 兩個版本。
DB2 DWE 是在強大的 DB2 Enterprise 9 產品上構建的並擴展了它的功能,提高了數據倉庫和分析特性的性能和易用性,幫助進行實時探察和決策的用戶獲得需要的信息。DB2 DWE 特性包括用於倉庫管理、分析應用程序開發、OLAP、數據挖掘以及超大型數據庫(VLDB)查詢和資源管理的工具。
DB2 DW Enterprise Edition 中包含的產品有:
DB2 Enterprise
DB2 Data Partitioning 特性
這個特性允許在單一服務器上或者跨服務器集群對數據庫進行分區。DB2 Data Partitioning 為企業提供了支持超大型數據庫(這是數據倉庫環境中的常見情況)所需的可伸縮性,並可以處理涉及復雜工作負載和高並行性的管理任務。這個特性可以在 DB2 DWE 產品之外單獨購買。
DB2 Data Warehouse Edition Design Studio
DWE Design Studio 是通過包含和擴展一些基於 Eclipse 的 Rational Data Architect(RDA)建模功能形成的,這是一個針對 BI 解決方案的開發環境。Design Studio 將以下任務集成在一個統一的圖形化環境中:物理數據建模(RDA)、DB2 基於 sql 的倉庫構造、OLAP 多維數據集建模和數據挖掘建模。
這個設計工具使設計人員能夠連接源數據庫和目標數據庫、對物理數據模型進行反向工程、構建 DB2 基於 sql 的數據流和挖掘流、設置 OLAP 多維數據集以及准備將應用程序部署到運行時系統上。因為它是基於 Eclipse 框架的,這個工具看起來與 DB2 Developer Workbench 相似。
sql Warehousing Tool
為了支持端到端業務智能化解決方案,DB2 DWE 提供了用於倉庫構建和維護的基礎設施,包括用於應用程序設計、部署、執行和管理的工具。
sql Warehousing Tool 解決了 DB2 數據倉庫環境中的數據集成問題。用戶可以對高層操作的邏輯流進行建模,這會產生組織在執行計劃中的代碼單元。這個工具提供一個元數據系統和 IDE 來創建、編輯和管理這些流,還提供一個能夠理解源圖並將它轉換為優化的
adzoneid=892989" target="_blank">sql 代碼的代碼生成系統。當流的開發完成時,這個系統的第二個部分就要發揮作用了:將生成的代碼以及相關聯的工件打包成一個數據倉庫應用程序,這個應用程序可以部署在各種目標運行時系統中。數據倉庫應用程序開發人員和架構師可以使用 Design Studio 來創建:
可以使用 DB2 Data Warehouse Edition 作為運行引擎,使用 ibm WebSphere® Application server 軟件提供控制和調度功能,從而執行和管理控制流。WebSphere Application server 為數據倉庫應用程序提供運行時部署環境。管理員可以從 Web 客戶計算機運行基於浏覽器的 Data Warehouse Edition Administration Console 來訪問 WebSphere。
DB2 Data Warehouse Edition Administration Console
DB2 DWE Administration Console 是一個用於管理和監視 BI 應用程序的基於 Web 的應用程序。安裝在 WebSphere Application server 上之後,DWE Administration Console 使用 Web 客戶機訪問和部署在 DWE 中建模和設計的數據倉庫應用程序。這個控制台使用 WebSphere 安全模型,使用戶能夠以管理員、經理和操作員的角色從統一的控制台頁面執行各種管理任務。這個控制台支持 5 類功能:
DB2 Data Warehouse Edition OLAP Acceleration
以前稱為 DB2 Cube VIEws。通過使用 DWE Design Studio 和 Administration Console 中的 OLAP 功能,用戶可以創建、操作、優化、部署、導入或導出多維數據集模型、多維數據集和在 OLAP 分析中使用的其他元數據對象。DWE Design Studio 提供了容易使用的向導和窗口來幫助用戶處理 OLAP 元數據。
DB2 Data Warehouse Edition Data Mining
通過使用 DB2 DWE 數據挖掘特性,可以發現數據中隱藏的關系,而不需要將數據導出到特殊的數據挖掘計算機上或者借助於少量數據樣本。DB2 DWE 為一些建模操作提供了 DB2 擴展:市場籃分析、市場分割、分析等等。
DB2 Data Warehouse Edition Data Visualization Feature
用來顯示創建的挖掘模型。
DB2 Alphablox analytics
DB2 Alphablox 提供了快速創建基於 Web 的定制應用程序的能力,使應用程序能夠適應公司的基礎設施並能夠為公司防火牆內外的用戶服務。用 DB2 Alphablox 構建的應用程序在標准 Web 浏覽器中運行,允許從客戶計算機執行實時的高度可定制的多維分析。DB2 Alphablox 與 DWE Cube Views 緊密集成,DWE Cube VIEws 提供常用的元數據並為 Alphablox 多維分析進行數據庫優化。
DB2 Data Warehouse Edition Query Workload Management Feature
DB2 Query Patroller 是 DWE 的查詢工作負載管理特性。這個產品也可以在 DB2 DWE 包之外單獨購買。DB2 Query Patroller 是一個強大的查詢管理系統,可以使用它以下面的方式前瞻性地動態控制 DB2 數據庫的查詢流:
DB2 Query Patroller 的特性使您能夠控制數據庫的查詢負載,讓小型查詢和高優先級的查詢可以快速運行,並讓系統資源得到高效利用。
還可以收集和分析關於已經完成的查詢的信息,從而判斷查詢、高負載用戶以及常用表和索引中的趨勢。管理員可以使用 DB2 Query Patroller: