SQL Server 2005帶來了一個全新的企業級數據整合平台。此平台具有出色的ETL和整合能力,使得組織機構能更加容易地管理來自於不同的關系型和非關系型數據源的數據。通過SQL Server Integration Services(SSIS),組織機構能以整體的視角去考察它們的商業運營情況,從而能夠更加具有競爭優勢。
企業級數據整合平台
SQL Server Integration Services替代了SQL Server 2000中一個非常受歡迎的功能模塊——數據轉換服務(DTS)。但SSIS並不是DTS的簡單升級,它是SQL Server 2005中的一個全新的組件,它提供了構建企業級數據整合應用程序所需的功能和性能。無論是在輕量級的32位系統中還是在高端的64位架構中,它的轉換引擎的性能優勢都是非常明顯的。
- 開發環境。用於快速開發SSIS包的、非常直觀的開發界面被集成在Business Intelligence Development Studio中。在這個Studio中,你還可以構建與分析服務、報表服務共享的解決方案,包括源控制、元數據整合等。同時,這個Studio還是一個完整的商業智能應用程序的開發環境,在其中,你可以設計、測試、部署和維護端到端的商業智能應用程序。
- 可視化調試。有了可視化調試的功能,開發人員的工作效率能夠達到一個更高的水准。在Data VIEwers中,設計人員能夠非常清楚地看到數據管道的工作狀況,它通過圖表的形式來可視化數據的傳輸,同時,斷點、變量和調用堆棧提供了非常強大的調試功能。
- 數據連接。整合不同的數據源和數據目標變得非常容易。除了那些常見的數據源,例如文本文件、OLEDB和ADO.NET(包括針對.Net的ODBC),在SSIS中還簡化了訪問SAP中數據的方式。內置的對XML和Web Services的支持使得與面向服務的架構以及其他非標准數據源的整合變得非常輕松。用於數據裝載的SQL Server數據目標經過了優化,甚至SQL Server Mobile數據庫也能被直接定位。由於具有整合元數據的能力和可共享的解決方案,報表服務的報表或者分析服務的多維數據集都能通過SSIS管道直接讀取。
- 高效率轉換。在SQL Server Integration Services中包含了許多非常有效的組件,例如數據和字符相互轉化、計算列、用於分區和篩選的條件操作符、查找、排序、聚集以及合並。高級組件簡化了其他復雜的操作,例如緩慢變化維度的裝載等。對於某些自定義的需求,我們可以使用靈活和快速的VisualBasic.Net腳本來實現,同時,開發人員可以毫不費力地編寫和分發他們自創的可重用組件。
圖文
一個使用了Fuzzy Lookup的數據清洗的簡單例子。
- 數據質量和數據挖掘。針對於數據的質量,Fuzzy Lookup和Fuzzy Grouping組件提供了不精確匹配和消除重復數據的功能。數據挖掘功能通過訓練已整合的數據得到模型,從而為數據整合流程帶來新的能力。