如今,企業迫切希望 DBA(數據庫管理員)和開發人員能夠集成公司數據,以便協助管理信息、挖掘客戶數據庫或滿足日常要求。Sybase 正借助一種稱為 Sybase 數據集成 (DI) 套件的新產品來滿足這種需求。此項新技術的主要功能包括:
_ 訪問多個不同數據源,且能夠創建單一、集成的數據視圖
_ 訪問各種異構數據源,包括大型機數據源
_ 捕獲數據源中的實時事件,並將其傳播到應用程序中
_ 使用上下文搜索對結構化和非結構化數據中的信息進行搜索和查詢
_ 使用 Sybase WorkSpace 開發應用程序
_ 使用通用的系統管理控制台管理 DI 套件組件
_ 通用的安裝程序,它使用腳本驅動的實用程序來執行交互式和後台安裝
有關數據集成的內容將分成兩部分來介紹,在第一部分中,我們將詳細介紹 Sybase 數據集成套件的所有功能,並著重介紹數據聯邦和企業信息集成 (EII) 范例。在第二部分中,我們將深入介紹復制、搜索、實時事件以及 ETL(數據提取、轉換和裝載)。
注意:目前,ETL 是在數據集成套件之外獨立提供的。
Sybase 數據集成套件的組件
DI 套件包含集成數據的所有常用技術(聯邦、復制和 ETL)以及實時和搜索功能。圖 1 說明了數據集成套件的各種組件。
什麼是企業信息集成?
由 Sybase 最近兼並的 Avaki 公司提供的 Sybase 數據聯邦是 DI 套件的一個關鍵組件。它基於日益成為主流的企業信息集成 (EII) 概念,企業信息集成與以 ETL 為導向的數據倉庫不同,因為它只訪問數據而不移動信息。ETL 本身就是一個負責將數據移動到支持商業智能報告的中心存儲庫或數據集市的,由很多步驟組成的過程。
圖 1:Sybase 數據集成套件
然而,盡管 EII 使用虛擬化來顯示統一的信息資源,但事實上它是調用來自多個資源的“聯邦”數據而不是進行拷貝。隨著數據庫數量不斷增加,聯邦數據方式在訪問分布式數據方面變得越來越來重要。Avaki EII 為用戶提供了 EII 技術的許多核心功能,並增加了網格功能、數據高速緩存、獨立地跨防火牆和管理域移動數據的功能以及共享文件的功能。
數據聯邦
如上所述,聯邦簡化了集成來自多個分布式來源的數據的過程,且能夠訪問集成的企業數據。用戶可以通過它:
_ 獲取來自多個不同來源的數據的單一虛擬視圖,這些來源包括支持 JDBC/ODBC 訪問的關系數據庫、應用程序(通過 JCA 或者 Web 服務)、Web 服務、XML 文檔或文件。“聯邦”方法意味著,數據是從原始數據源中提取出來的,而不是從數據副本或數據集市中提取出來的。
_ 將聯邦數據以 Web 服務、SQL 視圖(使用 JDBC/ODBC 訪問)或者平面文件的形式提供給需要使用這些數據的應用程序。因此,現在應用程序無需創建聯邦查詢或者直接訪問源數據庫,但可以訪問數據聯邦服務器以執行其查詢。
_ 利用基於 GUI 的工具定義數據源和查詢,並在目錄中存儲這些查詢以便於由應用程序執行或者搜索和重用。它還支持即時查詢。
_ 更改數據源的模式或者將數據庫移動到其它服務器中,且不破壞應用程序。只需對應用程序正在使用的 Web 服務或者 SQL 視圖進行修改即可。
_ 依靠用戶身份驗證的安全支持以及在 EII 層中定義的與查詢相關的常用企業驗證模式和精細的訪問控制。
_ 利用基本的監視功能查看哪些服務器處於正常運行狀態,管理和添加用戶,管理服務器,並審核日志以便了解訪問模式和確定哪些用戶登錄了服務器及他們運行了什麼樣的查詢。
_ 為面向服務的應用程序構建數據服務層,使得數據層和業務邏輯分離。
DI 套件還包含了提供 EII 功能和工具的數據聯邦服務器。用戶分別使用套件安裝程序來安裝 EII 功能,使用 Sybase WorkSpace 來安裝工具。
復制
復制組件是 DI 套件的數據分發和數據同步組件,它包含了 Sybase 復制服務器的所有組件。它具有以下功能:
_ 支持異構數據庫(包括 ASE、Oracle、IBM DB2 和 Microsoft SQL Server)中事務數據的移動和同步。
_ 提供讀取上述任意數據庫的功能,並將變化傳播到相同的或不同的目標數據庫中。
_ 性能極高,由於采用從日志文件讀取數據庫變化,而非基於觸發器的方法時,所以不會影響數據庫的正常運行。
_ 以事務處理的方式實時地將事務從源數據庫傳播到目標數據庫(即不向目標數據庫提交在源數據庫上回滾的事務)。此外,復制在事務級別上維護數據完整性,從而確保只向目標數據庫提交完整事務。
_ 在分布式異構系統間啟用雙向復制。
_ 根據需要允許轉換正在使用的數據。
_ 准許將源數據庫中的模式變化傳播到目標數據庫中。
_ 復制是非常靈活的,它允許客戶指定是復制整個數據庫、整個表格還是僅復制表中指定的列。