對於Web程序,使用一台服務器的時候,客戶端上傳的文件一般也都是存儲在這台服務器上。但在集群環境中就行不通了,如果每個服務器都存儲自己接受到的文件,就亂套了,數據庫中明明有這個附件的記錄,卻找不到這個文件。於是,文件需要進行統一集中管理,並向集群中的服務器提供統一的路徑。
Network File System 簡稱NFS,用人話說叫共享文件夾,可以實現分布式存儲文件。只需要在文件服務器上共享文件夾,並指定相應賬號的權限,並給Web服務器設置可以訪問共享文件夾的賬號和密碼,web服務器就可以像操作本地文件一樣操作文件服務器上的文件了。NFS下的文件訪問路徑有固定的格式,稱為UNC(Universal Naming Convention),以“\\”開頭。
要以UNC的方式訪問NFS下的文件,需要用到windows提供的兩個API:WNetAddConnection2 和 WNetCancelConnection2。WNetAddConnection2可以使用指定的賬號和密碼創建一個UNC的連接,然後程序可以直接訪問該UNC下文件。
首先創建類FileServerConnection,用於管理連接,具體代碼如下:
public class FileServerConnection { private string uncName; private string username; private string password; /// <summary> /// 構造器 /// </summary> /// <param name="uncName">完整的UNC路徑</param> /// <param name="username">訪問共享連接的用戶名</param> /// <param name="password">訪問共享連接的密碼</param> public FileServerConnection(string uncName, string username, string password) { this.uncName = uncName; this.username = username; this.password = password; } /// <summary> /// 連接文件服務器 /// </summary> public void Connect() { var netResource = new NetResource { Scope = ResourceScope.GlobalNetwork, ResourceType = ResourceType.Disk, DisplayType = ResourceDisplayType.Share, RemoteName = this.uncName.TrimEnd('\\') }; var result = WNetAddConnection2(netResource, password, username, 0); if (result != 0) throw new Win32Exception(result); } /// <summary> /// 釋放連接 /// </summary> public void Disconnect() { WNetCancelConnection2(this.uncName, 0, true); } [DllImport("mpr.dll")] private static extern int WNetAddConnection2(NetResource netResource, string password, string username, int flags); private static extern int WNetCancelConnection2(string name, int flags, bool force); }
FileServerConnection中所用到的幾個結構體代碼如下:
[StructLayout(LayoutKind.Sequential)] public class NetResource { public ResourceScope Scope; public ResourceType ResourceType; public ResourceDisplayType DisplayType; public int Usage; public string LocalName; public string RemoteName; public string Comment; public string Provider; } public enum ResourceScope { Connected = 1, GlobalNetwork, Remembered, Recent, Context } ; public enum ResourceType { Any = 0, Disk = 1, Print = 2, Reserved = 8, } public enum ResourceDisplayType { Generic = 0x0, Domain = 0x01, Server = 0x02, Share = 0x03, File = 0x04, Group = 0x05, Network = 0x06, Root = 0x07, Shareadmin = 0x08, Directory = 0x09, Tree = 0x0a, Ndscontainer = 0x0b }
然後在Web程序啟動的時候,只需要創建一個FileServerConnection的實例,然後調用它的Connect方法。為了防止重復創建連接引發異常,可以Connect之前先DisConnect。具體調用代碼如下:
fsConnection= new FileServerConnection (storeRootPath, username, password); fsConnection.Disconnect(); fsConnection.Connect();
系統架構還行,但是---但是系統崩潰了,why?系統沒有考慮到用戶有個海量的說法,文件也有個海量的說法,用戶的相冊,圖片全部存貯在WEB服務器的一個分區上,每個用戶一個目錄,而打開性能監視器,磁盤的IO高的驚人,基本上無暇響應。眾所周知,文件系統也是一個數據庫,單獨大文件無所謂,關鍵是整個是300多個G的零碎文件,大量的讀寫操作,系統崩潰,數據丟失,文件系統的一個鏈斷了,用戶數據全部丟失!!!這是一個非常沉重的問題,系統整整停了一個月來做數據恢復(單獨文件很容易,但是海量文件目前還沒有一個軟件能組織起來軟件架構)。解決方案:修改程序架構,做分布式文件存貯(程序修改用了8天,但是文件轉移卻又用去了將近一個月),20萬用戶損失殆盡
何為分布式存貯:
與目前大量應用的集中式存貯(如文件和數據服務器以及EMC等存貯產品)方式不同,分布式存貯並不把數據存貯在企業中某一個或多個特定的節點上,而是通過網絡使用企業中每台機器(可以是桌面PC也可以是服務器)上的磁盤存貯空間,並把這些分布的存貯資源構成一個虛擬的存貯設備,數據分散地存貯在企業的各個角落。