【導讀】本文介紹如何在SQL Server中構建簡單的數據倉庫,並分析相關的問題。
基本概念:
1.多維數據集:多維數據集是聯機分析處理 (OLAP) 中的主要對象,是一項可對數據倉庫中的數據進行快速訪問的技術。多維數據集是一個數據集合,通常從數據倉庫的子集構造,並組織和匯總成一個由一組維度和度量值定義的多維結構。
2.維度:是多維數據集的結構性特性。它們是事實數據表中用來描述數據的分類的有組織層次結構(級別)。這些分類和級別描述了一些相似的成員集合,用戶將基於這些成員集合進行分析。
3.度量值:在多維數據集中,度量值是一組值,這些值基於多維數據集的事實數據表中的一列,而且通常為數字。此外,度量值是所分析的多維數據集的中心值。即,度量值是最終用戶浏覽多維數據集時重點查看的數字數據。您所選擇的度量值取決於最終用戶所請求的信息類型。一些常見的度量值有 sales、cost、expenditures 和 production count 等。
4.元數據:不同 OLAP 組件中的數據和應用程序的結構模型。元數據描述 OLTP 數據庫中的表、數據倉庫和數據集市中的多維數據集這類對象,還記錄哪些應用程序引用不同的記錄塊。
5.級別:級別是維度層次結構的一個元素。級別描述了數據的層次結構,從數據的最高(匯總程度最大)級別直到最低(最詳細)級別。
6.數據挖掘:數據挖掘使您得以定義包含分組和預測規則的模型,以便應用於關系數據庫或多維 OLAP 數據集中的數據。之後,這些預測模型便可用於自動執行復雜的數據分析,以找出幫助識別新機會並選擇有獲勝把握的機會的趨勢。
7.多維 OLAP (MOLAP):MOLAP 存儲模式使得分區的聚合和其源數據的復本以多維結構存儲在分析服務器計算機上。根據分區聚合的百分比和設計,MOLAP 存儲模式為達到最快查詢響應時間提供了潛在可能性。總而言之,MOLAP 更加適合於頻繁使用的多維數據集中的分區和對快速查詢響應的需要。