當我們建立一個數據庫時,並且想將分散在各處的不同類型的數據庫分類匯總在這個新建的數據庫中時,尤其是在進行數據檢驗、淨化和轉換時,將會面臨很大的挑戰。幸好SQL Server為我們提供了強大、豐富的數據導入導出功能,並且在導入導出的同時可以對數據進行靈活的處理。
在SQL Server中主要有三種方式導入導出數據:使用Transact-SQL對數據進行處理;調用命令行工具bcp處理數據;使用數據轉換服務(DTS)對數據進行處理。這三種方法各有其特點,下面就它們的主要特點進行比較。
一、使用方式的比較
1. 使用Transact-SQL進行數據導入導出
我們很容易看出,Transact-SQL方法就是通過SQL語句方式將相同或不同類型的數據庫中的數據互相導入導出或者匯集在一處的方法。如果是在不同的SQL Server數據庫之間進行數據導入導出,那將是非常容易做到的。一般可使用SELECT INTO FROM和INSERT INTO。使用 SELECT INTO FROM時INTO後跟的表必須存在,也就是說它的功能是在導數據之前先建立一個空表,然後再將源表中的數據導入到新建的空表中,這就相當於表的復制(並不會復制表的索引等信息)。而INSERT INTO的功能是將源數據插入到已經存在的表中,可以使用它進行數據合並,如果要更新已經存在的記錄,可以使用UPDATE。
SELECT * INTO table2 FROM table1 --table1和table2的表結構相同
INSERT INTO table2 SELECT * FROM table3 --table2和table3的表結構相同
當在異構數據庫之間的進行數據導入導出時,情況會變得復雜得多。首先要解決的是如何打開非SQL Server數據庫的問題。
在SQL Server中提供了兩個函數可以根據各種類型數據庫的OLE DB Provider打開並操作這些數據庫,這兩個函數是OPENDATASOURCE和OPENROWSET。它們的功能基本上相同,不同之處主要有兩點。
(1) 調用方式不同。
OPENDATASOURCE的參數有兩個,分別是OLE DB Provider和連接字符串。使用OPENDATASOURCE只相當於引用數據庫或者是服務(對於SQL Server、Oracle等數據庫來說)。要想引用其中的數據表或視圖,必須在OPENDATASOURCE(...)後進行引用。
在SQL Server中通過OPENDATASOURCE查詢Access數據庫abc.mdb中的table1表:
SELECT * FROM OPENDATASOURCE('Microsoft.Jet.OLEDB.4.0',
'Provider=Microsoft.Jet.OLEDB.4.0;
Data Source=abc.mdb;Persist Security
Info=False')...
table1
OPENROWSET相當於一個記錄集,可以將直接當成一個表或視圖使用。
在SQL Server中通過OPENROWSETE查詢Access數據庫abc.mdb中的table1表:
SELECT * FROM OPENROWSET
('Microsoft.Jet.OLEDB.4.0', 'abc.mdb';
'admin';'','SELECT * FROM table1')
(2) 靈活度不同。
OPENDATASOURCE只能打開相應數據庫中的表或視圖,如果需要過濾的話,只能在SQL Server中進行處理。而OPENROWSET可以在打開數據庫的同時對其進行過濾,如上面的例子,在OPENROWSET中可以使用SELECT * FROM table1對abc.mdb中的數據表進行查詢,而OPENDATASOURCE只能引用table1,而無法查詢table1。因此,OPENROWSET比較OPENDATASOURCE更加靈活。