隨著傳統的數據庫、計算機網絡和數字通信技術的飛速發展,以數據分布存儲和分布處理為主要特征的分布式數據庫系統的研究和開發越來越受到人們的關注。但由於其開發較為復雜,在一定程度上制約了它的發展。基於此,本文提出了在.Net環境下使用一種新的開發語言C#結合ADO.Net數據訪問模型來開發分布式數據庫系統,大大簡化了開發過程。
1 分布式數據庫系統
就其本質而言,分布式數據庫系統的數據在邏輯上是統一的,而在物理上卻是分散的。與集中式數據庫相比它有如下主要優點:
· 解決組織機構分散而數據需要相互聯系的問題。
· 均衡負載。負載在各處理機間分擔,可避免臨界瓶頸。
· 可靠性高。數據分布在不同場地,且存有多個副本,即使個別場地發生故障,不致引起整個系統的癱瘓。
· 可擴充性好。當需要增加新的相對自主的組織單位時,可在對當前機構影響最小的情況下進行擴充。
分布式數據庫系統雖然有諸多優點,但它同時也帶來了許多新問題。如:數據一致性問題、數據遠程傳遞的實現、通信開銷的降低等,這使得分布式數據庫系統的開發變得較為復雜。幸運的是,微軟的.Net開發環境為我們提供了C#開發語言和ADO.Net數據訪問模型,結合兩者來開發分布式數據庫系統能夠大大簡化開發工作。
2 遠程處理框架和ADO.Net
開發分布式數據庫系統需要解決的兩個重要問題是:各場地間的數據通信以及對數據庫的操作及管理。使用C#結合ADO.Net能夠高效、可靠地解決這兩方面的問題。具體表現為,在C#中通過使用.Net遠程處理框架能夠方便地解決數據、命令遠程傳遞問題;C#通過ADO.Net對數據庫進行操作,使分布式數據庫系統中對數據庫的各種操作變得高效、可靠,同時易於解決數據一致性問題。
2.1 .Net遠程處理框架
實現數據和命令的遠程傳遞有三種方式。第一種是使用報文或消息的方式,把要傳送的數據轉化為流格式,再通過套接字編程用報文的形式發送到遠程主機。此種方法麻煩,不易實現。第二種是使用Web Service,即各遠程主機提供一個數據庫查詢服務的Web Service。這種方式只能對單個場地進行查詢,無法實現多場地的聯合查詢。第三種是使用.Net遠程處理框架(.Net Remoting Framework)技術,它將遠程調用的技術細節隱藏起來,服務程序只需通過簡單的設置就可以把本地對象變成為遠程提供服務的遠程對象,客戶端可以像訪問本地對象一樣透明地訪問遠程對象,所有的消息、報文等都交給.Net Remoting對象處理,大大簡化了開發。遠程處理的一般過程如圖1所示:
圖1 遠程處理過程
首先,服務器端創建一個服務器類的實例,遠程處理系統創建一個表示該類的代理對象,並向客戶端對象返回一個對該代理的引用。當客戶端調用方法時,遠程處理基礎結構連接檢查類型信息,並通過信道將該調用發送到服務器進程。偵聽信道獲得該請求並將其轉發給服務器遠程處理系統,服務器遠程處理系統查找(或在必要時創建)並調用被請求的對象。然後,此過程將反向進行,服務器遠程處理系統將響應捆綁成消息並由服務器信道發送到客戶端信道。最後,客戶端遠程處理系統通過代理將調用的結果返回給客戶端對象。
2.2 ADO.Net
ADO.Net以XML為核心,是.Net數據庫應用程序的解決方案。它使用離線數據結構,數據源中的數據被緩存到數據集(DataSet)對象中,用戶無須鎖定數據源,數據以XML格式保存。
2.2.1 ADO.Net管理數據一致性
在分布式數據庫系統中,很可能出現多個用戶同時訪問和修改數據的情況,因此,對於分布式數據庫系統,數據一致性是不可或缺的。ADO.Net通過使用樂觀一致性方案來控制數據一致性(實際上DataSet對象被設計成支持使用樂觀一致性控制機制),即數據行只有在數據庫中真正被更新時才會被鎖定,而在悲觀一致性方案中,數據行在從被提取出來到在數據庫中更新這段時間內一直被鎖定。因此,使用ADO.Net能夠在更少的時間內響應數量巨大的用戶。
另外,在分布式數據庫系統中,還會經常遇到當用戶修改自從提取出來以來已經被修改的行時,違反一致性原則。對此問題ADO.Net也作了很好地解決,即使用DataSet對象為每一條修改過的記錄維護兩個版本:原始版本和更新版本,在更新的記錄被寫回數據庫之前,先要把數據集中記錄的原始版本與數據庫中的當前版本進行比較,如果兩個版本匹配,就在數據庫中更新記錄;否則,就會出現違反一致性原則的錯誤。
3 實例開發
一個家用電器連鎖店設有一個總部和許多分店,總部和分店以及各分店之間經常需要進行各種信息的查詢(如:商品當日價目表、各店銷售狀況和庫存信息等),對此組織機構建立分布式數據庫查詢系統,可實現總部和各店信息的共享,便於統一管理。
3.1 系統設計
3.1.1系統結構圖
系統結構如圖2所示:
圖2 系統結構圖
總部和各分店都配置了一台具有固定IP的服務器,其它電腦通過集線器與服務器相連,總部和各分店的服務器通過通信網絡聯接起來。
3.1.2 系統實現步驟
系統實現分為三個主要步驟。首先,為總部和各分店設計數據庫。由於數據量較大,故采用SQL Server為每個分店創建銷售和庫存數據庫,同時為總部創建員工數據庫、整個連鎖店的存貨數據庫、信用卡客戶數據庫以及供應商信息數據庫等。其次,需要建立一個提供數據庫服務(DbServer)的動態鏈接庫(dll),將查詢時所要用到的一些服務(如:遠程對象的發布和獲取等)和函數(如:本地異地數據表的查詢、數據表的遠程創建和刪除、表間的連接和合並等)置入該dll中,各分店都需要使用這個dll,以便查詢時對一些服務和函數進行調用。最後,根據實際需要開發客戶端查詢界面。
3.2系統實現的關鍵技術
3.2.1 遠程對象的發布與獲取
系統運行後所要做的第一個工作是發布本地的遠程對象並獲取其它各店所發布的遠程對象。發布遠程對象時,首先要設置一個網絡端口號,然後創建並注冊一個通道,最後發布該服務器端的激活對象。其它場地的服務器根據IP地址和網絡端口號即可方便地獲取所發布的遠程對象。實現遠程對象發布和獲取的關鍵代碼如下:
遠程對象的發布:
//創建一個通道實例,port為指定的網絡端口號遠程對象的獲取:
//根據IP地址和端口號獲取相應的遠程對象3.2.2數據庫的訪問
通過ADO.Net訪問數據庫,可以方便地連接數據庫,將數據源中的數據導入DataSet對象中,在DataSet對象中可對數據表進行各種操作,而且DataSet對象本身也可遠程傳遞。這為開發分布式數據庫系統帶來極大方便。實現數據庫訪問的關鍵代碼如下所示:
//建立數據庫的連接3.2.3 查詢
分布式數據庫系統中的查詢一般分為三類:本地查詢、遠程查詢和聯合查詢。本地查詢和集中式數據庫的查詢沒什麼區別;對於遠程查詢,只要獲取遠程對象後,調用查詢函數,即可方便地實現;最復雜的是聯合查詢,涉及到多場地之間數據的查詢、表的遠程創建、傳遞、連接、合並等技術。下面以實例介紹聯合查詢的實現。
第二連鎖店要查詢離其較近的第三、第四連鎖店中所有北京的供應商所供應的空調的庫存信息以便調貨,可通過以下步驟實現。首先,獲取總部以及第三、第四連鎖店所發布的遠程對象。接著,通過遠程對象在總部創建一臨時數據表t1,將查詢到的所有北京的供應商信息存放在t1表中(各分店只有供應商名,並不知其所在地,只有總部才有供應商的詳細信息),再將t1表保存到第三和第四連鎖店。然後讓t1表分別與兩店的庫存表作連接,找出所有北京供應商所供應的空調庫存信息(如空調名稱、型號、個數、價格等信息),並將連接結果t2和t3數據表返回到第二連鎖店。最後對t2和t3兩表進行合並,並使用DataGrid控件顯示出來。上述實現中,包含了不同場地之間數據表的復制、傳遞、連接等,所用到的一些函數(如:遠程創建數據表、表與表間的遠程連接、合並等)都放在dll中,可以方便地調用。
4 結束語
利用C#的.Net Remoting技術能夠方便地解決各場地間數據的通信問題。另外,C#通過ADO.Net訪問數據庫,使得對數據庫的操作及管理變得更加高效、可靠。這兩種技術的使用,有效地解決了開發分布式數據庫系統的主要問題,大大減輕了系統開發工作量,並且提高了系統的可靠性和安全性。