轉換OLTP數據使其在OLAP系統中提供可接受的性能,這種轉換需要執行下列過程:
合並數據
必須能夠將特定項目(產品、顧客、職員)的全部相關信息從多個OLTP系統合並到一個OLAP系統。合並過程必須解決不同OLTP系統間的編碼差別問題。例如,一個系統可能為每個職員指派一個ID,而其它系統沒有職員ID。合並過程必須能夠匹配兩個系統中的常用職員數據,這多半可通過比較職員姓名和地址實現。合並過程還必須能夠將各OLTP系統中使用不同數據類型存儲的數據轉換成在某個OLAP系統中使用的單一數據類型。您也必須選擇OLTP系統中的哪些列與OLAP系統無關,並將這些列排除在合並過程外。
為 OLAP 系統提供輸入數據的系統並不局限於傳統的、位於中央位置的OLTP系統。重要的信息可以存儲在多個遺留位置上,有些情況下甚至可以在文件共享上存儲相對較小的數據源,如 Microsoft Excel 電子表格。
清理數據
將 OLTP 數據合並到數據倉庫中後,便提供了一個清理數據的機會。您可能會發現不同的OLTP系統以不同的方式拼寫項目,或者合並過程可能沒有覆蓋以前不知道的拼寫錯誤。還可能發現其它的不一致,例如同一商店、職員或顧客的地址不同。在可以將數據裝載到數據倉庫中供OLAP系統使用之前,必須找出這些不一致。
聚合數據
OLTP數據記錄所有的事務詳細信息。OLAP查詢通常需要匯總數據或是已以某種方式聚合的數據。例如,如果數據庫只包含顯示每種產品每天或每小時銷售額的匯總行,則查詢只用檢索過去一年中每種產品的月銷售總額,這比必須掃描過去一年中每個事務的詳細記錄要快得多。
對數據倉庫內數據的聚合程度取決於許多設計因素,如 OLAP 查詢的速度要求和分析所要求的粒度級。例如,如果將銷售額詳細信息匯總到每日匯總中,而不是每小時匯總中,OLAP查詢將會運行得更快,但是只有當不需要分析每小時的銷售額時才可以這麼做。
將數據組織到多維數據集中
關系OLTP數據的組織方式增加了分析處理的難度且很耗時。當將OLTP數據移入數據倉庫時,必須對其結構進行轉換,使之能夠更好地支持決策支持分析。生成數據倉庫的過程涉及將存儲在關系表中的OLTP數據重組為存儲在多維數據集中的數據。
轉換階段和數據倉庫組件
通過OLAP應用程序使數據可用的過程一般經過下列三個階段:
將數據從OLTP或遺留數據源析取到中間存儲區域中。
將數據轉換為更適合在OLAP系統中使用的格式。這涉及數據清理和聚合等操作。
將數據裝載到數據倉庫或數據集市中。
從OLTP和遺留數據源中析取數據並將其轉換到倉庫服務器中的過程稱為 ETL 過程,通常定期運行,如每周一次或每月一次。
一旦將數據裝載到數據倉庫中,OLAP系統的一個重要職能便是為決策者提供在數據倉庫和數據集市中訪問和分析數據的便利。
數據源
OLTP 數據庫和其它遺留數據源,其內包含的數據必須轉換為數據倉庫和數據集市中的OLAP數據。
中間數據存儲
組合的數據存儲區和對OLTP數據進行存儲、清理並轉換為有用的OLAP數據的過程。
倉庫服務器
倉庫服務器是運行包含數據倉庫和數據集市數據的關系數據庫的計算機,以及運行管理OLAP數據的服務器的計算機。
業務智能
用於查詢 OLAP 數據並向企業決策者提供報表和信息的成套工具和應用程序。
元數據
不同OLAP組件中的數據和應用程序的結構模型。元數據描述OLTP數據庫中的表、數據倉庫和數據集市中的多維數據集這類對象,還記錄哪些應用程序引用不同的記錄塊。