這份白皮書提供了一個關於分析服務(Analysis Services)設計和在Project REAL中的最佳實踐的技術討論。它深入的討論了每一類對象的細節,例如數據源、數據源視圖、維度、層次、屬性、度量組、分割表等等。並指出如何在關系型數據庫分割表的基礎上創建一個能自動創建度量組分割表的SQL Server 2005集成服務程序包。
關於Project Real
Project Real是微軟為創建商業智能應用程序提供最佳實踐而所做的努力。這些程序都是在Microsoft® SQL Server™ 2005基礎上,在真實的客戶背景上構建實施的。這就意味著真實客戶數據是可以代入系統內部,並且可以應對客戶在開發過程中將會遇到的同樣的問題。這些問題包括:
◆模式設計- 關系型模式和分析服務型模式
◆數據抽取、數據轉換、數據加載(ETL)過程的實現
◆客戶端系統的設計與開發,包括數據報表和交互式的分析
◆產品系統的分級
◆運營系統的管理和維護,包括數據資料的不斷更新
通過在這種真實部署環境中的工作經歷,我們獲得了如何使用這些工具的完整理解。我們的目標是全方位的關注大公司在他們自己實際部署過程中所遇到的所有問題。
這份白皮書提供了一個關於分析服務(Analysis Services)設計和在Project REAL中的最佳實踐的技術討論。我們深入的討論了每一類對象的細節,例如數據源、數據源視圖、維度、層次、屬性、度量組、分割表等等。並指出了我們在前進過程中遇到的重要問題。
若要查看Rroject REAL的概述信息,可查看 Project REAL: Technical Overview 白皮書。有相當大一部分的資料、工具、和例子,都是在Project REAL的生命周期中產生的。為了找到最新的信息,可以到Project REAL Web site這個連接來察看相關的信息(http://www.microsoft.com/sql/bi/ProjectReal/)。
備注:這篇文章僅僅是一個草案,它包括了一些建設性的實踐方法,這些方法都是基於我們早先在SQL Server 2005的Community Technology Preview (CTP)工作中獲得的經驗。到產品發布之前,白皮書中所描述的都是准確的。文檔中描述的產品功能性可能會有所變化。在將來,可能會提供更好的實踐方案。SQL Server 2005是在我們對這些好的練習例程中用的開發工具。
緒論
這篇文章回顧了關於Project REAL分析服務的技術性設計,並且討論了各種影響設計的問題。我們假定讀者已經比較熟悉分析服務設計,並且實踐過Project REAL所采用的模式。例如,我們假定讀者已經知道多對多廠商維度的存在。我們的討論主要關注為什麼它會存在(以及我們在對設計進行定案之前所考慮的可供選擇的辦法)。
在本文中,我們檢驗了在多維度設計中應用到的各種類型的分析服務對象。從物理模式對象入手,例如數據源和數據源視圖。接下來我們討論在邏輯對象,例如維度,用戶自定義的層次關系、屬性層次、和度量組等等。接下來深入到度量組特征,例如分割、集合(aggregate)設計、以及前攝緩存(proactive caching)。這部分內容最後討論了其它的邏輯設計,包括計算、關鍵性能指示器(KPIs)、活動、透視、定制程序集、用戶自定義函數(UDFs)和MDX腳本等等。
最後一個章節中,我們詳細討論了在分析服務模式設計階段,兩種可選的、合理的設計方案。我們提供了目標,也是我們考慮要做的事情,也正是我們所實現的。
本篇以介紹服務端設置來結束,主要討論了我們為什麼要改變這些配置。
Project REAL設計強烈依賴於分割(partitioning),在所有的度量組中,定義了幾百個這樣的分割表,在附錄A中,我們將展示我們是如何解決我們在各種數據庫中創建和管理分割表帶來的管理問題。