隨著市場競爭的加劇和信息社會需求的發展,從大量數據中提取(檢索、查詢等)
制定市場策略的信息就顯得越來越重要了。這種需求既要求聯機服務,又涉及大量用
於決策的數據,而傳統的數據庫系統已無法滿足這種需求。其具體體現在三個方面:
歷史數據量很大。
輔助決策信息涉及許多部門的數據,而不同系統的數據難以集成。
由於訪問數據的能力不足,它對大量數據的訪問性能明顯下降。
隨著C/S技術的成熟和並行數據庫的發展,信息處理技術的發展趨勢是從大量的
事務型數據庫中抽取數據,並將其清理、轉換為新的存儲格式,即為決策目標把數據
聚合在一種特殊的格式中。隨著此過程的發展和完善,這種支持決策的、特殊的數據
存儲即被稱為數據倉庫(Data Warehouse, DW)。
W。H。Inmon對數據倉庫的定義為數據倉庫是支持管理決策過程的、面向主題的、集成
的、穩定的、不同時間的數據集合。
主題是數據歸類的標准,每個主題對應一個客觀分析領域,如客戶、商店等,它可為
輔助決策集成多個部門不同系統的大量數據。數據倉庫包含了大量的歷史數據,經集
成後進入數據倉庫的數據是極少更新的。數據倉庫內的數據時限為5年至10年,主要
用於進行時間趨勢分析。數據倉庫的數據量很大,一般為10GB左右。它是一般數據庫
(100MB)數據量的100倍,大型數據倉庫達到TB級。
數據倉庫主要應用在兩個方面:
使用浏覽分析工具在DW中尋找有用的信息。
數據倉庫系統支持在DW上的應用,形成決策支持系統(DSS)。