程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> SqlServer數據庫 >> 關於SqlServer >> Microsoft SQL Server 7.0 數據倉庫框架

Microsoft SQL Server 7.0 數據倉庫框架

編輯:關於SqlServer
本文中包含的信息代表了微軟公司在發布之日對所討論的一些問題的當前觀點。由於微軟公司必須對變化的市場條件作出反應,所以不應將本文解釋為微軟公司的一個承諾,而且微軟公司不能保證自發布之日後出現的任何信息的准確性。

  本文檔只用於資料用途。在本文檔中,微軟不做任何擔保,無論明示還是暗示。

  1998 微軟公司。保留所有權利。

  簡介

  以更快的速度做出更好的商業決策是在當今充滿競爭的市場中取得成功的關鍵。組織機構尋求提高決策能力的努力被來自眾多運營和生產系統的大量、復雜的數據所淹沒。對於當今的信息技術專業人員來講,確保數據的可訪問性是最具挑戰性的任務之一。

  為應付這一挑戰,許多組織機構選擇建立數據倉庫來挖掘隱藏於OLTP系統中的有用信息。數據倉庫對那些來自作為決策支持和數據分析基礎的各系統所擁有的信息進行集中存儲。雖然基於不同的設計方法和學術理念,存在多種類型的數據倉庫,但它們都有下列共同的特性:

   · 圍繞公司考慮的主要問題(如客戶、產品、銷售或供貨商)來組織信息,這反映了數據驅動的設計思想。

   · 從非集成運行的和傳統的應用軟件中收集原始數據,經過篩選、綜合後以某種有意義的方式提交給最終用戶。

   · 基於最終用戶的反饋意見和在數據倉庫中的發現,數據倉庫的體系結構將隨時間而不斷變化,這反映了該處理過程所具有的反復性。

  因此數據倉庫過程本質上來講是復雜、昂貴且耗時的。在過去的幾年中,微軟公司一直致力於與其他軟件公司一起以創建由組件技術和先進產品組成的數據倉庫平台,這些技術和產品能用來降低費用、提高數據倉庫創建、管理和使用的有效性。同時微軟公司也一直致力於開發大量的產品和工具,如Microsoft? SQL Server? 7.0版,以很好地配合數據倉庫過程(data warehousing process)。通過與那些能與微軟數據倉庫框架集成使用的第三方產品相結合,客戶就能從大量的可互用的、最佳的產品中選擇適應自己數據倉庫所需的產品。

  SQL Server 7.0提供了廣泛的功能以支持數據倉庫過程。微軟公司並為數據倉庫發行了一個平台與Data Warehousing Framework結合起來使用,以降低費用和復雜性,並提高數據倉庫工作的效率。


  數據倉庫過程(Data Warehousing Process)

  從信息技術的觀點來看,數據倉庫關心的是在一個組織機構中將適當的信息傳送到適當的個人手中。這是一個正在進行的過程,而不是以前的解決方案,並且需要不同的方法以滿足面向事務系統開發工作的需求。

  數據倉庫是數據的集合,以對那些面向主題的、集成的、時間不同的、非易失性的決策的管理工作給以支持。數據倉庫關注的是概念(如銷售),而不是過程(如提供FP)。它包括從多種處理系統收集到的有關某一概念的所有相關信息。信息進行定期收集和存儲,並且是相對穩定的。

  通過一致命名約定、測量、物理屬性和語義,數據倉庫對操作數據進行集成。在數據倉庫物理設計的第一步是確定應包括哪些主題領域,並開發一套意見一致的定義集。這需要約見最終用戶、分析員、高級管理人員,以了解所需信息的范圍,並給出相應文檔。在將邏輯處理轉化成物理數據倉庫之前,必須對相關問題有徹底的了解。

  在物理設計之後,是在運作系統基礎上產生數據倉庫。因為運作系統和數據倉庫包含不同的數據類型,所以將數據載入數據倉庫需要進行數據的轉換:匯總、轉換、解碼、去除非法數據等等。這些過程需能自動完成以便在變化的基礎上也能完成:經常需要對源數據進行抽取、轉換和移動以滿足數據倉庫的商業需求。

  在運作系統中,當存取數據時,數據應有具有數值,並且數據是精確的。.例如,一個訂單輸入系統總是為手頭存有的每一產品提供當前價格。這樣僅僅是時間稍有差別的兩個查詢所獲得的價格就有可能不同。在數據倉庫中,數據表示在很長一段時期收集到的信息,作為某一特定時間點來講是精確的。因此,數據倉庫包含有關商業關鍵領域的一系列"快照" (snapshot)。

  最後,信息用於浏覽、分析和報告。有許多有助於分析的工具(從簡單的用於寫報表的程序到高級的用於數據挖掘的程序)。最後,分析程序使數據倉庫過程的最終結果和數據倉庫設計的修改都能適應新的要求,並提高系統性能或允許進行其它新類型的分析。由於這些變化,處理過程會重新開始,並延伸到數據倉庫的整個生命周期。


  數據倉庫體系結構

  目前已提出了許多方法,來簡化在變化的基礎上支持數據倉庫過程所需的信息技術。這引發了哪一種體系結構是在組織機構中部署數據倉庫的最佳體系結構的爭論。

  數據倉庫有兩種基本類型:企業級數據倉庫和數據集市(data marts)。

  企業數據倉庫包括企業范圍的信息,這些用於集中地進行數據分析的信息來自多個業務業務系統源數據。典型地,這些信息包括幾個主題領域,如客戶、產品和銷售,並用於制定企業戰術上和戰略上的決策。

企業數據倉庫包括詳細的某一時間點數據和經過概括總結的信息,數據大小從50GB到超過1TB。企業數據倉庫可能是非常昂貴的,並且在安裝和管理方面是很耗時間的。通常由集中式信息服務組織自上而下地創建。

  數據集市包含企業范圍數據的一個子集,這個子集是為組織機構的個別部門或公司使用而創建的。 數據集市與企業數據倉庫不同,它是由為特殊決策支持軟件或用戶組使用的部門資源自上而下建立的。數據集市包含經過匯總的和有關某一主題領域的詳細數據。數據集市的信息可能是企業數據倉庫的子集(依賴性的數據集市)或可能直接來自業務系統源數據(獨立的數據集市)。

  企業數據倉庫和數據集市是結構化的,並在前面所述的處理過程中保持不變。並且,兩種方法共享一套相似的技術組件。

  數據倉庫組件

  數據倉庫包括許多組件,如:

   · 業務系統源數據

   · 設計/開發工具

   · 數據析取和轉換工具

   · 數據庫管理系統(DBMS)

   · 數據存取和分析工具

   · 系統管理工具

  幾年前,微軟公司認識到集成這些組件的一套技術的需求。這就導致了微軟數據倉庫框架的誕生,它不僅是諸如SQL Server 7.0等微軟產品開發的路標,而且是與其他軟件商的產品技術集成所需的路標。


  微軟數據倉庫框架(MicrosoftData Warehousing Framework)

  微軟數據倉庫框架的目標是簡化數據倉庫解決方案的設計、實現和管理。該框架用來提供::

   · 易於與第三方供貨商集成和易於由第三方供貨商擴展的開放式體系結構。

   · 異類數據導入、導出、確認和帶可選數據類型的清理服務。

   · 集成的元數據用於數據倉庫的設計、數據析取/轉換、服務器管理和最終用戶分析工具。

   · 用於日程安排、存儲管理、性能監測、報警/事件和通知的核心管理服務。

  Data Warehousing Framework (數據倉庫框架)從底層向上設計,為微軟產品用戶和第三方企業提供行業標准技術,就能很容易擴展的開放式體系結構。這就使組織機構能選擇同類中最好的組件並仍能確保集成。

  易用性是客戶和獨立軟件供貨商(ISV)選擇Data Warehousing Framework的主要原因。微軟公司提供了一套面向對象的組件,這些組件用於管理分布式環境中的信息。微軟公司還提供了同類中最好的產品和定制的產品,來用於數據倉庫過程中的多個步驟。

  Data Warehousing Framework (數據倉庫框架)組件

  創建數據倉庫需要一套用於描述數據源的邏輯設計和物理設計的組件,以及在企業數據倉庫或數據集市中的目的文件。

  為了在設計階段與設置的定義保持一致,操作數據在放置到企業數據倉庫或數據集市之前,必須通過淨化和轉換階段。該數據處理階段可能包括很多級,特別是在企業數據倉庫體系結構中,但在本圖例中進行了必要的簡化。


  最終用戶工具,包括桌面生產力工具、專用的分析產品和定制程序,用來獲取對數據倉庫中信息的訪問。理想情況下,用戶訪問是通過目錄工具實現的,該目錄工具使最終用戶能搜尋適當的有關的數據來解決問題,並且在最終用戶和數據倉庫系統之間設置安全層。

  最後,很多種組件能用於管理數據倉庫環境,如重復性日程安排工作和管理多服務器網絡。

  數據倉庫框架描述了在組裝、使用和管理數據倉庫中用到的多種組件之間的關系。數據倉庫框架的核心由兩種技術構成: 集成的元數據庫和數據傳輸層(OLE DB)。這些技術使得在數據倉庫中涉及到的產品和組件的互用性成為可能。

  OLE DB對多種數據提供了標准化的、高性能的訪問,並允許集成多種數據類型。

 


您正在看的SQLserver教程是:Microsoft SQL Server 7.0 數據倉庫框架。 Microsoft Repository提供了綜合的元數據庫,這些元數據庫可以在數據倉庫過程中,由多種組件共享。共享的元數據允許為多種供貨商提供的多種產品進行透明的集成,而無需在產品之間設置特殊的接口。


  OLE DB: 信息交換標准

  訪問多種可能的數據源需要異類數據庫之間的連接性和互用性,這是實現數據倉庫最困難的技術問題之一。微軟 數據倉庫框架依賴於微軟公司已創建的數據傳輸標准、Universal Data Access (UDA:統一數據訪問)體系結構和OLE DB接口。UDA 是平台、軟件和工具,它定義、提供了標准和技術。UDA是微軟公司軟件開發基礎中的關鍵要素:Microsoft Windows?分布式網際應用(DNA:Distributed interNet Applications)體系結構。

  UDA提供了對多種平台上的大量數據和信息進行高性能存取的功能,並提供了能與許多工具和語言一起工作的易於使用的編程接口,這大大增加了開發人員已有的技術技能。

支持UDA的技術,允許組織機構創建易於維護的解決方案,也允許使用選擇的客戶端、中間層和服務器上的最佳工具、應用軟件和數據源。

  利用COM對UDA建模

  UDA體系結構的一大長處在於,它是通過一套公共的現代的、面向對象的接口實現的,這些接口是基於組件對象模型(COM)的。COM是開發人員的最佳選擇,因為它能提供:

   · 豐富的綜合服務,包括事務、安全性、消息隊列和數據存取,以支持最廣泛的應用情況。

   · 多家供貨商使用多種開發語言開發的大量工具。

   · 定制應用軟件和可重用組件的廣泛用戶基礎。

   · 可靠的互用性,利用用戶和開發人員的現有投資。

  利用COM提供的一致性和互用性,使得UDA體系結構成為開放式結構,並能與任何工具和編程語言一起工作。同時,COM也允許UDA在現代軟件體系結構的各層中提供一種一致性數據訪問模型。

  UDA使用基於COM的接口,針對低級和高級軟件開發進行優化:

   · OLE DB

   · Microsoft ActiveX? Data Objects (ADO)

  OLE DB的定義

  OLE DB是微軟公司的戰略性系統級編程接口,它能管理整個組織機構的數據。OLE DB是一種建立在ODBC成功基礎上的開放的規范,它為存取各種數據類型提供了一種開放的標准。ODBC是為訪問關系數據庫而創建的,而 OLE DB用來存取關系型和非關系型信息源,包括:

   · 大型機索引順序存取方法/虛擬存儲存取方法(ISAM/VSAM)和層次數據庫

   · 電子郵件和文件系統倉庫.

   · 文本、圖形和地理數據

   · 定制的商業對象

  OLE DB定義了一個COM接口的集合,它封裝了各種數據庫管理系統服務。這些接口允許創建實現這些服務的軟件組件。OLE DB組件包括數據提供者(它們存儲和發布數據)、數據用戶(它們使用數據)和服務組件(它們處理和傳輸數據)。

  OLE DB 接口用來平滑地集成組件,以便供貨商能迅速地將高質量的OLE DB組件推向市場。另外, OLE DB包括連接ODBC的橋梁,這使得對現在大量的ODBC關系數據庫提供持續支持成為可能。

  定義ActiveX數據對象

  Microsoft ADO 是戰略性應用軟件級數據和信息的編程接口。ADO 為數據提供一致的、高性能的存取,並支持開發工作的許多需求,包括創建前端數據庫客戶和中間層商業對象、使用應用軟件、工具、語言或Internet 浏覽器。ADO被設計成一對多、客戶/服務器和基於Web解決方案開發的數據接口。


  ADO為OLE DB提供了一個易於使用的應用級接口,它依次提供對數據的潛在存取。ADO的實現在關鍵場合中具有體積(footprint )小、網絡通信量最少,並且在前端和數據源之間的層次最少的優點。結果是獲得一個輕型的、高性能的接口。通過COM自動接口調用ADO,為先進的快速應用開發(RAD)、數據庫工具和語言提供了熟悉的環境。並且因為ADO被設計成遠程數據對象(RDO)和數據訪問對象(DAO)最佳特性的結合並最終取代它們.。ADO使用帶簡化語義的類似約定,這使得它成為今天開發人員自然的下一個步驟。


  Microsoft Repository: 數據倉庫的黏合劑

  實現過程中最大的困難之一是集成設計、轉換、存儲和管理數據倉庫所需的所有的工具。共享和重用元數據的能力減少了建立、使用和管理數據倉庫的費用和復雜度。許多數據倉庫產品包含一個私有的元數據庫,這個庫不能被數據倉庫中的其它組件使用。每一種工具都必須能夠訪問、創建或提高由其它任何工具創建的元數據,同時也能擴展元數據模型以滿足對工具的特殊需要。

  考慮這樣一個例子:具有共享元數據的數據倉庫。來自運作系統的元數據被設計和數據轉換工具存儲在庫中。轉換產品使用物理和邏輯模型來抽象、確認和清空原來加載在數據庫中的數據。數據庫管理系統可以是關系型的、多維的或是兩者結合的。數據存取和數據分析工具提供了訪問數據倉庫中信息的能力。信息目錄集成了技術元數據和商業元數據,這就使查找和裝入已有的查詢、報告和數據倉庫應用變得容易了。

  微軟數據倉庫框架關注在Microsoft Repository中的共享的元數據,Microsoft Repository是Microsoft SQL Server 7.0的一個組件。Microsoft Repository是存儲關於軟件組件和組件間關系的描述信息的數據庫。它由一個開放式信息模型(OIM)和一套已發布的COM接口組成。

  OIM是信息特殊類型的對象模型,它具有足夠的靈活性以支持新的數據類型,並且也具有足夠的可擴展性以適應特殊用戶或供貨商的需要。微軟公司與軟件業合作開發了OIM,用於數據庫設計、數據轉換和聯機分析處理(OLAP)。

未來的模型可能會包括復制、任務安排、語義模型和結合商業元數據和技術元數據的信息目錄。

  Meta Data Coalition,致力於制定交換元數據標准的53家供貨商所組成的行業協會,宣布支持Microsoft Repository,並且Microsoft Repository OIM已得到第三方的廣泛支持。要了解更多信息,請在www.MDCinfo.com上查看Meta Data Coalition主頁。

  數據倉庫的設計

  數據倉庫過程的開發階段經常是從創建描述重要基准的空間模型,以及創建基於用戶需求的選擇的主題域范圍開始的。與聯機事務處理(OLTP)系統以高度規格化方式組織數據不同,數據倉庫中的數據以高度規格化方式進行組織,這樣當數據存儲在關系數據庫管理系統中,能提高查詢性能。

  關系數據庫通常使用星型或雪片型模式來為復雜的查詢提供最快的反應時間。星型模式包括主題域的非規格化中心事實表(fact table)和有關主題范圍描述信息的多維屬性表(dimension table)。事實表能包含上百萬行。通用的可訪問的信息是經過預聚集和概括總結以進一步提高性能。


  星型模式通常被看作是數據庫管理員用來提高性能、簡化數據倉庫設計的工具,而且它也以對最終用戶更友好的方式展示數據倉庫的信息。


  數據倉庫的數據庫

  數據倉庫的關鍵是數據庫。在能滿足組織機構目前和將來需要的高性能數據庫引擎上建立數據倉庫是至關重要的。關系型數據庫管理系統(RDBMS)為存儲在數據倉庫中的大量信息提供了最普通的存儲系統。目前關系系統正受到能提供更高導航能力和對復雜查詢有更佳性能的多維OLAP(MOLAP)的挑戰。從中央數據倉庫將數據可靠地復制到獨立的數據集市中,並確保地理上分布的鏡像數據集市的數據是一致的,這種能力也是相當重要的。

  可擴縮的和健壯的RDBMS

  Microsoft SQL Server 7.0包含許多特性以確保它是企業數據倉庫和數據集市優秀的RDBMS。這些特性包括:

   · 支持容量達TB(terabyte)的數據庫,以管理最大型的數據倉庫

   · 為大型數據庫提供可擴縮性,並為部門服務器和膝上型電腦提供與台式機版本100%編碼兼容的可擴縮性,同時提供訪問中央數據源的能力和無與倫比的靈活性。

   · . 先進的查詢處理,支持在數據倉庫應用(包括星型模式)中典型的復雜查詢的優化和執行。

   · 查詢間並行性(Intraquery parallelism)通過將一個復雜的單一查詢分解成組件部分,然後將工作量分布到多個


您正在看的SQLserver教程是:Microsoft SQL Server 7.0 數據倉庫框架。處理器(包括遠程聯接的服務器中) 提供了更快的性能。

   · 高性能的工具以提供性能調節、數據加載和索引構造。

   · 異類連接能力可確保來自任何OLE DB源數據的檢索和合作。

  SQL Server 7.0可以適合幾乎所有大小和復雜的數據倉庫。但是,實現數據倉庫通常需要一個以上的中央數據庫。實際上,組織機構會用附加的分析工具和分布式信息體系結構來實現決策支持系統。SQL Server 7.0中有管理這些附加任務的基本工具。

  綜合的OLAP分析能力

  OLAP是目前日益流行的技術,它能顯著提高商業分析的能力。歷史上,OLAP曾被描述成一種昂貴的工具、難以實現,並且也不能靈活部署。Microsoft SQL Server OLAP 服務(OLAP Services) 是一種新型的、具有OLAP全部特性的服務,將作為SQL Server 7.0的一個組件提供給用戶。OLAP服務包括中間層服務,這使得用戶能對具有異常結果的大量數據進行復雜的分析。OLAP服務還包括客戶端高速緩存和被稱為Microsoft PivotTable? Service (微軟數據透視表服務)的計算引擎,這有助於提高性能、減少網絡通信量。數據透視表服務使得最終用戶在與網絡斷開時也能對分析工作進行管理。

  OLAP 服務是OLAP服務器的中間層,可以簡化用戶導航,並有助於提高對數據倉庫信息進行查詢的性能。


  OLAP是數據倉庫的關鍵組件,並且OLAP Services為從生成報表到先進的決策支持等大量的應用提供了必要的功能。根據計劃,SQL Server 7.0將包含OLAP功能,這將使多維分析更易承受,並使OLAP的好處為更多用戶所使用(包括從小型組織到大型公司的小組和個人)。通過Microsoft OLE DB for OLAP與大量支持OLAP應用軟件的工具和軟件相結合,OLAP服務將有助於增加有權使用復雜分析工具的組織機構數目,並有助於減少數據倉庫的費用。

  如需了解有關Microsoft SQL Server OLAP 服務的更多信息,請參閱"Microsoft SQL Server 7.0 OLAP Services(Microsoft SQL Server 7.0 OLAP服務)"(產品編號 098-80705)。



  復制

  從中央數據倉庫中創建分布式、依賴性的數據集市或復制一個獨立數據集市的內容,都需要具有可靠的復制信息的能力。SQL Server 7.0具有從一個中央數據倉庫可靠地將信息分布到多個部門的數據集市的能力。信息可能按時間、地理位置等進行劃分以作為復制處理的一部分。

  SQL Server 7.0將提供大量的復制技術以適應軟件的特殊需要。每一復制技術在不同的方面產生不同的好處和約束:

   · 事務一致性

   · 站點自治

   · 數據分割

  從一個分布式應用到另一個分布式應用,這三方面的需求是不同的。

  在大多數決策支持應用中,個別站點的數據將不能更新。信息在中心籌備域經過預先准備,然後送給分布式數據庫服務器以供遠程訪問之用。因此,"快照"( snapshot)復制對於分布式數據經常使用。

  就象名稱一樣,快照復制是對某一時刻數據庫中的數據進行拍照或快照。不再復制INSERT,、UPDATE和 DELETE語句(事務復制的特征)或數據修改(合並復制的特征),而是用數據集的完全刷新來更新訂戶。因此,快照復制向訂戶發送所有數據而不是只發送那些修改過的數據。如果信息過於龐大,可能需要堅固的網絡資源進行傳送。在確定快照復制是否適合你時,你必須綜合考慮全部數據集的大小和數據的易變性。

  快照復制是復制中最簡單的一種,它可以確保在發行商和訂戶之間潛在的一致性。如果訂戶沒有更新數據,它也提供高度自治能力。快照復制對於那些不需要最新數據的只讀訂戶來講是一種良好的解決方案,它能在不進行更新時,與網絡完全斷開。但是,SQL Server提供了根據應用環境選擇不同復制方法的能力。

  如需有關SQL Server 7.0復制能力的更多信息,請參閱"Replication for Microsoft SQL Server 7.0"(產品號098-80829)。


  導入、導出和轉換數據

  在數據被加載到數據倉庫之前,必須被轉換成一種集成的和一致的格式。轉換是運行程序的結果,在存儲於特定目的地之前,它用於表示數據源信息。Microsoft Data Transformation Services (DTS)是Microsoft SQL Server 7.0中的新工具,它可以支持多種類型的轉換,例如,簡單的列映射、計算一個以上源域的新值、將一個單一域分解成多個目標列等等。

  DTS 的目標

  DTS用來:

   · 通過使用OLE DB,為異類數據提供更好的輸入、輸出和轉換。

   · 為ISV、客戶和咨詢者提供一個可擴展的體系結構。

   · 通過與Microsoft Repository集成,共享豐富的有關源、目標、轉換、和體系的元數據。

  通過100%基於OLE DB的體系結構,DTS允許用戶從多種數據源中導入、導出和轉換數據,同樣,也允許用戶將數據導入、導出和轉換到多種數據源中。OLE DB數據源不僅包括數據庫系統,還包括桌面應用軟件如Microsoft Excel等。微軟公司為SQL Server 和Oracle 提供OLE DB接口。另外,微軟公司已開發了能與已有ODBC驅動相結合的OLE DB包裝程序(wrapper)以訪問其它相關源。同時還支持分隔符和固定字段文本文件。

  DTS 的體系結構

  DTS轉換定義被存儲在Microsoft Repository 、SQL Server 或COM結構的存儲文件中。通過OLE DB可訪問相關的和無關的數據源。數據泵(data pump)從數據源中打開一個行集合並將每一行從數據源中抽取到數據泵中。數據泵運行Microsoft ActiveX 腳本編輯功能(Microsoft Visual Basic?、Scripting Edition、 JScript?開發軟件和PerlScript)來拷貝、確認或將數據從數據源轉換到目的地。對於先進的數據淨化可創建定制轉換對象。為目的單元格所賦的新值返回到泵中,並通過被稱為高速數據傳輸器發送到目的地。.目的地可以是OLE DB、 ODBC、 ASCII 固定字段、 ASCII 分隔符文件和 Html。

  在DTS體系結構中,數據可以用OLE DB數據泵從數據源中抽取,並可在發送到OLE DB目的地之前選擇是否轉換格式。


  復雜的轉換和數據確認邏輯可由ActiveX腳本完成。這些腳本可以調用從任何OLE對象到修改或確認列值中的方法。高級開發人員可以創建可重用的COM轉換對象以提供高級的淨化功能。可以通過FTP或運行外部程序創建傳輸文件的定制任務。

  通過OLE DB接口,ISV和咨詢者可以創建新的數據源和目的文件。數據泵可以為任何供貨商查詢OLE DB接口以確定是否支持高速數據加載,如果不支持的話,可以使用標准的加載機制。

  雖然象標准SQL-92已經提高了關系型數據庫引擎之間的互用性,但在市場上,供貨商還是通過為SQL-92添加有用的但專有的擴展以區分它們。

SQL Server提供了名為Transact-SQL的簡單的編程語言,該語言提供基本條件處理和簡單的循環控制。Oracle公司、Informix Software公司和其它供貨商提供類似的SQL擴展。

  DTS事務引擎(DTS Transformation Engine)傳遞SQL體系結構(pass-through SQL architecture)能確保源與目標所具有的功能對用戶來講大部分是可用的。這就使用戶能充分利用他們已經開發和測試過的腳本和程序-只需從DTS 事務引擎中調用即可。.因為DTS沒有修改或解釋執行的SQL語句,所以傳遞體系結構能顯著地簡化開發和測試工作。任何能通過DBMS接口工作的語句在轉換期間也能同樣准確地工作。

  DTS將記錄儲存庫中的轉變過程進行並形成文檔,於是用戶就能知道數據來自何處。 數據的轉變過程能在表級和行級進行跟蹤。這就為數據倉庫中的信息提供了完全的審計跟蹤功能。在供貨商產品間,可以共享數據的轉換過程。DTS包和數據的轉換過程可以集中存儲在Microsoft Repository 中。這包括轉換定義、Visual Basic 腳本、Java腳本和包的運行記錄。與Microsoft Repository 的集成使第三方能在DTS 事務引擎提供的基礎結構上建立DTS。DTS包可以通過綜合的日歷為運行做出安排,然後交互地執行或響應系統事件。


  DTS 包

  DTS包是對作為


您正在看的SQLserver教程是:Microsoft SQL Server 7.0 數據倉庫框架。轉換程序一部分所有工作的詳細描述。每一個包定義了一個或多個將在並行隊列中執行的任務。可以通過使用圖形用戶界面或支持OLE 自動化的任何語言交互地創建DTS包。DTS包可以存儲在Microsoft Repository中、SQL Server中或作為COM結構的存儲文件保存。一旦從儲存庫中或結構化存儲文件中恢復,包可以以與交互式創建DTS包相同的方式運行。

  DTS包可以包含多種任務,並且每一任務可以是表對表映射中沒有涉及到的或象調用內部數據清空過程一樣復雜。


  任務定義了可以作為轉換程序一部分運行的某一工作。通過DTS數據泵,任務可以將異類數據從OLE DB源移動或轉換到OLE DB目的地,並且任務可以運行ActiveX 腳本或運行外部程序。Step對象可以運行任務。

  Step對象調整控制流,並執行DTS包中的任務。某些任務必須按某一確定順序執行。例如,創建數據庫(任務A)必須在創建表(任務B)之前完成。這是在任務A和任務B之間"完成-開始"關系的一個例子;因此任務B對任務A有優先約束。

  當滿足所有優先約束後,就可以執行任務了。任務可以基於運行條件有條件地執行。可以並行執行多項任務以提高性能。例如,包可以同時從Oracle 和DB2中將數據加載到分離表中。Step對象也對任務的優先權進行控制。Step的優先權決定運行任務的Win32? API線程的優先權。

  DTS 數據泵是OLE DB服務供貨商提供的在異類數據存儲間導入、導出和轉換數據的基礎結構。OLE DB的戰略性數據訪問接口提供了存取范圍最廣泛的相關和無關數據的能力。DTS 數據泵是高速的運行中的COM服務器,能轉移和轉換OLE DB行集合。

  轉換是一系列過程操作,在被存儲在所希望的目的地之前,必須用在源行集合中。DTS 數據泵提供了一個可擴展的、基於COM的體系結構,該體系結構在數據從源轉移到目的地時,可以進行復雜的數據確認和轉換。 DTS 數據泵可以在DTS包中充分使用ActiveX腳本的功能,使得復雜過程邏輯可以用簡單的、可重用的ActiveX腳本來表示。當列值通過DTS數據泵從源轉移到目的地時,這些腳本可以通過所選擇的腳本語言來確認、反轉和轉換列值。在源行集中的一列或多列的新值可以很容易地計算。源列可以把一個單一域分解成多個目的地列。ActiveX腳本可以調用和使用任何支持自動化COM對象的服務。

  DTS包

  可以用導入/導出向導、DTS Package Designer (包設計器)或COM接口來創建DTS包。導入/導出向導為將數據移到數據倉庫中,或將數據從數據倉庫移出提供了最簡便的機制。但轉換的復雜性受向導范圍的限制。例如,在向導中只能有單一源和單一目的地。

  DTS Package Designer通過易用、虛擬接口公布了DTS的所有功能。在DTS Package Designer中,用戶能定義優先關系、復雜查詢、控制流並訪問多種異類源。

  DTS Package Designer為描述數據流和包的執行提供了圖形化環境。


  最後,軟件能通過COM接口定義和執行DTS包程序設計。這種方法首先由希望利用DTS特性的ISV使用,而無需用戶分別對包進行定義。


  分析、提交數據

  微軟公司提供了眾多機制用於查詢數據倉庫中的信息。Microsoft Office 套裝生產力工具,Microsoft Access 和 Microsoft Excel都為查詢和分析數據倉庫中的信息提供了必要的工具。

在Microsoft SQL Server 7.0 中包括稱為Microsoft English Query的組件,它允許用戶使用自然的英語語句來查詢數據庫。另外,通過Data Warehousing Framework,許多兼容產品可用來進行復雜的觀測和數據分析。

  Microsoft Office

  通常用來存取和控制決策支持數據的兩種最常用的工具是Microsoft Access 和 Microsoft Excel。隨著Microsoft Office 2000的發行,用戶能使用多種工具來分析和提交數據倉庫中的信息。

  Excel 2000通過OLE DB的OLAP接口能用表格和圖形方式來提交OLAP數據源。同時,已有的數據透視表(PivotTable)動態視圖功能將被更高級的OLAP功能所取代,這種功能是基於Microsoft SQL Server、OLAP服務的數據透視表服務(PivotTable Service)組件的。

  除已有的Access 數據庫功能外,Access 2000將為SQL Server數據庫提供透明的支持。對於用戶來講,這些新功能允許使用他們所擁有的類似桌面工具來進行日益復雜的數據分析。

  Microsoft Office 2000包含許多組件,通過預先創建的控件來簡化基於Web的應用的構造。這些將控件供訪問關系數據庫和OLAP數據庫的能力,並能廣泛查看數據倉庫中的信息。

  Microsoft English Query

  English Query 是SQL Server 7.0的一個組件,它允許應用程序編譯器創建數據倉庫應用,它允許用戶使用英語而不是使用象SQL那樣的正式查詢語言從SQL Server 數據庫中檢索信息。例如,你可以問:"How many widgets were sold in Washington last year?"而不是使用下列SQL語句:

SELECT sum(Orders.Quantity) from Orders, Parts
WHERE Orders.State='WA'
and Datepart(Orders.Purchase_Date,'Year')='1996'
and Parts.PartName='widget'
and Orders.Part_ID=Parts.Part_ID
  English Query接受自然的英語命令、語句和提問作為輸入,並確定它們的含義。然後它編寫和執行SQL中的數據庫查詢並將答案格式化。如果不能解釋某一問題時,English Query也需要從用戶那裡獲得輔助信息。

  English Query 包含對語言句法和使用的深刻了解,但軟件開發人員必須創建用戶所用數據的信息域。在English Query中,域是所有信息的集合,這裡信息是指English Query應用中的對象。信息包括特殊的數據庫對象(如表、域和連接)、語義對象(如實體、實體間的關系和附加的字典條目)和全局域的確省選項。

  .建立English Query 軟件的第一步是建立數據倉庫語義模型。開發人員將英語實體(名詞)和關聯(動詞、形容詞、特點和子集)映射成數據庫中的表、域和連接。通過權威工具在軟件外進行域測試來完成這一切。


  .一旦為用戶測試和訪問的域模型成功建立,開發人員通過基於Visual Basic的軟件或基於Web的應用(通過使用Active Server Pages (ASP)實現)來訪問English Query 應用。.隨著傳送到數據倉庫的基於intranet的信息日益增加,English Query成為無需昂貴的查詢工具和培訓就能提供訪問的優秀工具。

  在運行時,English Query軟件的最終用戶能通過Microsoft Internet Explorer 軟件(或其它Web浏覽器)連接到Web網頁並進入某一問題。然後Microsoft Internet Explorer將問題傳遞給Windows NT? Server的內置Web服務器、Internet Information Services (IIS),通過ASP的URL來執行Visual Basic腳本。

  腳本將問題傳遞給English Query以將其翻譯成SQL語句。English Query 使用有關目標數據庫的域知識(以English Query 應用的形式)來解析問題,並將它翻譯成SQL語句。然後腳本取回SQL語句,執行該語句(使用ASP數據庫控件),將結果表示為Html格式,並將結果返回給用戶。

  English Query包括ASP示例,這些示例可用於生成快速原型,或經定制後適應已有Web軟件的外觀和行為。

  第三方產品

  數據倉庫框架的基本原則是向第三方組件開放解決方案。通過ODBC和OLE DB數據庫接口標准,大量的產品能訪問和控制存儲在SQL Server 或其它關系數據庫中的信息。同樣,OLE DB for OLAP的多維數據庫接口使OLAP Services和其它OLAP 數據存儲的信息可用。

由這兩個訪問標准,組織機構能選擇最恰當的分析工具以滿足他們的需求。ISV費用的減少應歸於標准化,同時意味著獲得同類中最佳產品的費用也將減少。


  系統管理
您正在看的SQLserver教程是:Microsoft SQL Server 7.0 數據倉庫框架。>
  實現數據倉庫最具隱蔽性的費用之一是系統的維護和管理。傳統技術中,需要特殊的技能來管理關系型數據庫、OLAP 服務器、設計與轉換技術。這就意味著需要許多經過特殊培訓的人來完成全局性、相關性任務。Microsoft Data Warehousing Framework提供了綜合的管理層,數據倉庫過程中能通過組件共享該層。

  微軟公司為微軟的系列產品提供了一個控制台,該控制台能簡化任務之間甚至各產品之間的轉換工作。Microsoft Management Console (MMC:微軟管理控制台)可由客戶、咨詢者和ISV擴展功能,它為特殊環境提供了一個高度定制的接口。發行的軟件要能與控制台相配合,可以是由ISV開發的封裝好的用戶接口或各自開發的定制接口,但應具有諸如SQL Server 基本產品的能力。象Microsoft BackOffice?家族的眾多產品一樣,SQL Server 7.0是作為到MMC的一個咬接交付的。

  Microsoft Management Console(微軟管理控制台)

  MMC 為獲得微軟服務器產品的功能提供了一個統一的常用的界面。MMC用戶界面與Windows Explorer 環境類似,具有垂直切分工作窗口,該窗口包含目錄的console tree (控制台目錄)。窗口的左側有與某一特定服務器相關的對象;窗口的右側是所選定項目的details pane(細節窗格)。Details pane中的詳細信息可以各種方式顯示,包括Html文檔。

  MMC為那些剛負責數據庫管理工作不久的管理員提供了很多具有高級功能的工具。.添加的工具之一 是任務簿(taskspads),它將多方面的活動如建立數據庫、建立用戶安全性、監測SQL Server 數據庫等分組管理。任務簿將指南信息、指導活動、向導結合在一起。

  向導

  SQL Server 7.0包含超過25個用於簡化經常性任務的向導:

   · 創建數據庫、視圖、索引和存儲過程

   · 備份或恢復數據庫

   · 為復制配置發布和分布服務器,並為數據廣播復制創建一個發布者

   · 管理SQL Server數據庫的安全性

   · 創建一個能定時運行的維護文件

   · 在SQL Server基於字符的列中定義全文本索引

   · .創建一個Web任務,該任務能創建HTML頁、從Html輸入數據或運行一個已有的Web任務

  向導有助於減少數據庫管理員成為SQL Server專家所需的學習過程。在數據倉庫環境中,數據庫管理員經常要支持處理過程的多個步驟,在處理過程中會涉及到多種產品,減少學習過程也就意味著時間和費用的節省。


  可視化的數據庫圖表結構

  因為數據倉庫應用比OLTP系統要更易反復,所以數據庫結構和模式經常改變。可視化的數據庫圖表結構為SQL Server數據庫管理員提供了一種物理數據模型工具,以簡化定義和修改周期。


  通過SQL Server 7.0 Enterprise Manager,可視化的數據庫圖表結構被存儲在數據庫服務器上。在數據庫或圖表上進行的修改都會反映在另一個數據庫或圖表中。

  提供一個向導使得對已有數據庫中表的選取和布局自動化。數據庫中的實體(表和表之間的關系)可以在圖表工具中完全定義。可視化的數據庫圖表結構顯示了表及表之間的關系,並且允許修改個別表的結構和連接該表的約束條件。

  SQL Server Profiler

  .對關系數據庫的正確調節需要有關如何在常規基礎上使用數據庫的知識。Microsoft SQL Server 7.0 Profiler是一圖形工具,它使得系統管理員通過實時捕捉有關服務器活動的連續記錄來監測SQL Server 中的引擎事件。SQL Server Profiler 監測發生在SQL Server 上的事件,刪除基於用戶指定基准的事件,並指導是將跟蹤結果輸出到屏幕上、文件中,還是輸出到表中。SQL Server Profiler允許數據庫管理員重復先前捕捉到的跟蹤結果,以測試數據庫結構的變化、識別降低系統性能的查詢、排除故障或恢復原有設置。

  可被監測的引擎事件包括:

   · 登錄連接、登錄失敗和脫線

   · SELECT、 INSERT、 UPDATE和 DELETE 語句.

   · 將錯誤寫入到SQL Server錯誤日志

   · 鎖定獲得的或釋放的數據庫對象

  每一事件獲得的數據可以被捕捉到並被保存在文件中或SQL Server表中,以供日後分析。

可以通過創建跟蹤來收集有關引擎事件的數據,這些數據包括有關SQL語句和語句執行的結果、執行語句的用戶和計算機、事件的起始時間和終結時間等各種信息。

  可以過濾事件數據,只收集事件數據的某一部分。這樣數據庫管理員可以只收集他們感興趣的事件數據。.例如,只收集影響某一特定數據庫或用戶的事件;而其它事件都將被忽略。類似地,可以只收集那些執行時間要比指定時間長的查詢的數據。

  SQL Server Profiler將為可直接使用的擴展了的存儲程序提供一個圖形化用戶界面。所以你可以創建自己的應用來監測使用了SQL Server Profiler中擴展了的存儲程序 的SQL Server。

  SQL Server Query Analyzer

  Microsoft SQL Server 7.0 Query Analyzer 是特別地、交互執行Transact-SQL 語句和腳本的出色工具。因為用戶必須了解Transact-SQL以使用Query Analyzer ,這主要適用於數據庫管理員和權限用戶。用戶能在一純文本窗口輸入Transact-SQL 語句,運行這些語句並在文本窗口或表格式輸出中查看運行結果。用戶也能打開包含Transact-SQL語句的文本文件,執行這些語句並在結果窗口中查看運行結果。

  Query Analyzer為確定SQL Server 如何解釋並執行Transact-SQL 語句提供出色的工具。用戶可以:

   · 顯示為語句生成的執行設計圖的圖形表示

   · 運行Index Tuning Wizard確定哪些基本表格的索引能被定義,以對語句的性能進行優化。

   · 顯示有關語句性能的統計數據。

  Query Analyzer 闡明了復雜查詢是如何解決的。下面的示例中,查詢的各部分並行執行以提高性能。


  Index Tuning Wizard(索引調整向導)

  在關系數據庫的管理工作中,最耗時間且不精確的過程之一就是創建索引以優化用戶查詢的性能。SQL Server 7.0 Index Tuning Wizard是一新型工具,它使得數據庫管理員在無需對數據庫的結構、硬件平台、組件及最終用戶的應用如何與關系引擎交互式作用等有太多的了解就能創建並實現索引。Index Tuning Wizard分析數據庫的工作量並提出針對SQL Server數據庫的優化索引配置建議。

  Index Tuning Wizard 能:

   · 使用Graphical Showplan代價公式比較、對比和選擇索引的最佳混合。

   · 為數據庫的工作量(跟蹤文件或SQL腳本)推薦索引的最佳混合。

   · 提供索引、工作量、表格效用和查詢代價分析。

   · 允許數據庫管理員針對小型問題查詢集合調整數據庫而無需修改索引配置。

   · 允許數據庫管理員針對不同的磁盤空間限制建立索引配置建議原型。

  Index Tuning Wizard 能分析SQL腳本或SQL Server Profiler 跟蹤結果的輸出,並根據SQL腳本或跟蹤文件提及的當前索引的效率來制定建議。建議有SQL語句組成,執行這些語句可以刪除已有的索引並創建新的更有效的索引。建議由向導給出,然後保存在SQL腳本中,建議可以立刻運行,或稍後由用戶手工運行,或通過創建一個運行SQL腳本的SQL Server任務為稍後的運行自動確定時間。

  如果Index Tuning Wizard不能分析已有的SQL腳本或跟蹤文件,向導將通過SQL Server Profiler立即創建一個或安排一個SQL腳本或跟蹤文件。一旦數據庫管理員確定某一跟蹤文件捕捉了被監測數據庫正常工作量的代表性采樣,向導能對捕捉的數據進行分析並推薦索引配置以提高數據庫的性能。

  SQL Server 代理服務

  數據倉庫管理員能從日常性工作如數據庫備份的自動化中獲益。使用SQL Server 代理服務,管理任務可以由


您正在看的SQLserver教程是:Microsoft SQL Server 7.0 數據倉庫框架。設定定時執行哪些任務而實現自動化,並且管理任務可以由定義工作和警告集而實現程序化管理。自動化管理包括單一服務器環境和多服務器環境。

  自動化管理的關鍵組件是工作、操作員和報警。工作定義為一次管理任務,所以它可以執行一次或多次,並且每次執行時都要監測是成功還是失敗。工作可以在一台本地服務器或多個遠程服務器上執行;根據一個或多個時間表執行工作;由一個或多個警報引發執行工作;工作由一個或多個工作步組成。工作步可以是可執行程序、Windows NT?指令、Transact-SQL語句、ActiveX腳本或復制代理。

  操作員是負責維護一台或多台運行SQL Server的服務器的人員。在某些企業中,操作員的工作被指派給某個人。在有多台服務器的大型企業中,由多人共同承擔操作員的工作。通過電子郵件、網頁或網絡通信來通知操作員。



  警報被定義為當事件應該發生時,引發一個或多個SQL Server事件和響應。一般情況下,數據庫管理員不能控制事件的發生,但他們能控制對帶警報的事件的響應。警報可以被定義為對SQL Server的響應-通知一個或多個操作員、向另一台服務器傳送該事件、增加其它軟件工具可視的錯誤限制。

  通過結合通知和可由SQL Server 代理服務自動完成的動作,管理員能為他們日復一日的操作任務構造一個健壯的、自管理的環境。這樣管理員就能有時間去管理那些不能自動管理的復雜任務。

  總結

  通過Microsoft Data Warehousing Framework所含的技術及Microsoft SQL Server 7.0取得的明顯進步,微軟公司現致力於降低復雜程度、提高集成度,並減少與數據倉庫有關的費用。微軟公司確信對基於微軟平台的數據倉庫技術進行投資的客戶正在創建有最佳經濟回報的應用件,同時保持他們系統的可擴縮性和可靠性。.

  如需更多有關Microsoft SQL Server的信息,請訪問SQL Server的Web站點:http://www.microsoft.com/sql/或中文網站:http://www.microsoft.com/china/sql。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved