在2005年底微軟公司正式發布了C# 2.0,與C# 1.x相比,新版本增加了很多 新特性,其中最重要的是對泛型的支持。通過泛型,我們可以定義類型安全的數 據結構,而無需使用實際的數據類型。這能顯著提高性能並得到更高質量的代碼 。泛型並不是什麼新鮮的東西,他在功能上類似於C++的模板,模板多年前就已 存在C++上了,並且在C++上有大量成熟應用。
本文討論泛型使用的一般 問題,比如為什麼要使用泛型、泛型的編寫方法、泛型中數據類型的約束、泛型 中靜態成員使用要注意的問題、泛型中方法重載的問、泛型方法等,通過這些使 我們可以大致了解泛型並掌握泛型的一般應用,編寫出更簡單、通用、高效的應 用系統。
什麼是泛型
我們在編寫程序時,經常遇到兩個模塊的功 能非常相似,只是一個是處理int數據,另一個是處理string數據,或者其他自 定義的數據類型,但我們沒有辦法,只能分別寫多個方法處理每個數據類型,因 為方法的參數類型不同。有沒有一種辦法,在方法中傳入通用的數據類型,這樣 不就可以合並代碼了嗎?泛型的出現就是專門解決這個問題的。讀完本篇文章, 你會對泛型有更深的了解。
為什麼要使用泛型
為了了解這個問題 ,我們先看下面的代碼,代碼省略了一些內容,但功能是實現一個棧,這個棧只 能處理int數據類型:
public class Stack
{
private int[] m_item;
public int Pop(){...}
public void Push(int item){...}
public Stack(int i)
{
this.m_item = new int[i];
}
}
上面代碼運行的 很好,但是,當我們需要一個棧來保存string類型時,該怎麼辦呢?很多人都會 想到把上面的代碼復制一份,把int改成string不就行了。當然,這樣做本身是 沒有任何問題的,但一個優秀的程序是不會這樣做的,因為他想到若以後再需要 long、Node類型的棧該怎樣做呢?還要再復制嗎?優秀的程序員會想到用一個通 用的數據類型object來實現這個棧:
public class Stack
{
private object[] m_item;
public object Pop(){...}
public void Push(object item){...}
public Stack(int i)
{
this.m_item = new[i];
}
}
這個 棧寫的不錯,他非常靈活,可以接收任何數據類型,可以說是一勞永逸。但全面 地講,也不是沒有缺陷的,主要表現在:
當Stack處理值類型時,會出現 裝箱、折箱操作,這將在托管堆上分配和回收大量的變量,若數據量大,則性能 損失非常嚴重。
在處理引用類型時,雖然沒有裝箱和折箱操作,但將用 到數據類型的強制轉換操作,增加處理器的負擔。
在數據類型的強制轉 換上還有更嚴重的問題(假設stack是Stack的一個實例):
Node1 x = new Node1();
stack.Push(x);
Node2 y = (Node2)stack.Pop ();
上面的代碼在編譯時是完全沒問題的,但由於Push了一個 Node1類型的數據,但在Pop時卻要求轉換為Node2類型,這將出現程序運行時的 類型轉換異常,但卻逃離了編譯器的檢查。
針對object類型棧的問題, 我們引入泛型,他可以優雅地解決這些問題。泛型用用一個通過的數據類型T來 代替object,在類實例化時指定T的類型,運行時(Runtime)自動編譯為本地代 碼,運行效率和代碼質量都有很大提高,並且保證數據類型安全。
使用泛型
下面是用泛型來重寫上面的棧,用一個通用的數據類型T來作為一個 占位符,等待在實例化時用一個實際的類型來代替。讓我們來看看泛型的威力:
public class Stack<T>
{
private T[] m_item;
public T Pop(){...}
public void Push(T item) {...}
public Stack(int i)
{
this.m_item = new T[i];
}
}
類的寫法不變,只是引入了通用數據類 型T就可以適用於任何數據類型,並且類型安全的。這個類的調用方法:
//實例化只能保存int類型的類
Stack<int> a = new Stack<int>(100);
a.Push(10);
a.Push("8888"); //這一行編譯不通過,因為類a只接收int類型的數據
int x = a.Pop ();
//實例化只能保存string類型的類
Stack<string> b = new Stack<string>(100);
b.Push(10); //這一行編譯不通過,因 為類b只接收string類型的數據
b.Push("8888");
string y = b.Pop();
這個類和object實現的類有截然不同的區別:
1. 他是類型安全的。實例化了int類型的棧,就不能處理string類型的 數據,其他數據類型也一樣。
2. 無需裝箱和折箱。這個類在實例化時, 按照所傳入的數據類型生成本地代碼,本地代碼數據類型已確定,所以無需裝箱 和折箱。
3. 無需類型轉換。
泛型類實例化的理論
C#泛型 類在編譯時,先生成中間代碼IL,通用類型T只是一個占位符。在實例化類時, 根據用戶指定的數據類型代替T並由即時編譯器(JIT)生成本地代碼,這個本地 代碼中已經使用了實際的數據類型,等同於用實際類型寫的類,所以不同的封閉 類的本地代碼是不一樣的。按照這個原理,我們可以這樣認為:
泛型類 的不同的封閉類是分別不同的數據類型。
例:Stack<int>和 Stack<string>是兩個完全沒有任何關系的類,你可以把他看成類A和類B ,這個解釋對泛型類的靜態成員的理解有很大幫助。
泛型類中數據類型 的約束
程序員在編寫泛型類時,總是會對通用數據類型T進行有意或無意 地有假想,也就是說這個T一般來說是不能適應所有類型,但怎樣限制調用者傳 入的數據類型呢?這就需要對傳入的數據類型進行約束,約束的方式是指定T的 祖先,即繼承的接口或類。因為C#的單根繼承性,所以約束可以有多個接口,但 最多只能有一個類,並且類必須在接口之前。這時就用到了C#2.0的新增關鍵字 :
public class Node<T, V> where T : Stack, IComparable
where V: Stack
{...}
以上的泛型類的 約束表明,T必須是從Stack和IComparable繼承,V必須是Stack或從Stack繼承, 否則將無法通過編譯器的類型檢查,編譯失敗。
通用類型T沒有特指,但 因為C#中所有的類都是從object繼承來,所以他在類Node的編寫中只能調用 object類的方法,這給程序的編寫造成了困難。比如你的類設計只需要支持兩種 數據類型int和string,並且在類中需要對T類型的變量比較大小,但這些卻無法 實現,因為object是沒有比較大小的方法的。 了解決這個問題,只需對T進行 IComparable約束,這時在類Node裡就可以對T的實例執行CompareTo方法了。這 個問題可以擴展到其他用戶自定義的數據類型。
如果在類Node裡需要對T 重新進行實例化該怎麼辦呢?因為類Node中不知道類T到底有哪些構造函數。為 了解決這個問題,需要用到new約束:
public class Node<T, V> where T : Stack, new()
where V: IComparable
需 要注意的是,new約束只能是無參數的,所以也要求相應的類Stack必須有一個無 參構造函數,否則編譯失敗。
C#中數據類型有兩大類:引用類型和值類 型。引用類型如所有的類,值類型一般是語言的最基本類型,如int, long, struct等,在泛型的約束中,我們也可以大范圍地限制類型T必須是引用類型或 必須是值類型,分別對應的關鍵字是class和struct:
public class Node<T, V> where T : class
where V: struct
泛型方法
泛型不僅能作用在類上,也可單獨用在 類的方法上,他可根據方法參數的類型自動適應各種參數,這樣的方法叫泛型方 法。看下面的類:
public class Stack2
{
public void Push<T>(Stack<T> s, params T[] p)
{
foreach (T t in p)
{
s.Push(t);
}
}
}
原來的類Stack一次只能Push一個數據,這個類Stack2 擴展了Stack的功能(當然也可以直接寫在Stack中),他可以一次把多個數據壓 入Stack中。其中Push是一個泛型方法,這個方法的調用示例如下:
Stack<int> x = new Stack<int>(100);
Stack2 x2 = new Stack2();
x2.Push(x, 1, 2, 3, 4, 6);
string s = "";
for (int i = 0; i < 5; i++)
{
s += x.Pop().ToString();
} //至此,s的值為 64321
泛型中的靜態成員變量
在C#1.x中,我們知道類的 靜態成員變量在不同的類實例間是共享的,並且他是通過類名訪問的。C#2.0中 由於引進了泛型,導致靜態成員變量的機制出現了一些變化:靜態成員變量在相 同封閉類間共享,不同的封閉類間不共享。
這也非常容易理解,因為不 同的封閉類雖然有相同的類名稱,但由於分別傳入了不同的數據類型,他們是完 全不同的類,比如:
Stack<int> a = new Stack<int>();
Stack<int> b = new Stack<int> ();
Stack<long> c = new Stack<long>();
類實例a和b是同一類型,他們之間共享靜態成員變量,但類實例c卻是和a、b完 全不同的類型,所以不能和a、b共享靜態成員變量。
泛型中的靜態構造函數
靜態構造函數的規則:只能有一個,且不能有參數,他只能被.NET 運行時自動調用,而不能人工調用。
泛型中的靜態構造函數的原理和非 泛型類是一樣的,只需把泛型中的不同的封閉類理解為不同的類即可。以下兩種 情況可激發靜態的構造函數:
1. 特定的封閉類第一次被實例化。
2. 特定封閉類中任一靜態成員變量被調用。
泛型類中的方法重 載
方法的重載在.Net Framework中被大量應用,他要求重載具有不同的 簽名。在泛型類中,由於通用類型T在類編寫時並不確定,所以在重載時有些注 意事項,這些事項我們通過以下的例子說明:
public class Node<T, V>
{
public T add(T a, V b) //第一個add
{
return a;
}
public T add(V a, T b) //第二 個add
{
return b;
}
public int add(int a, int b) //第三個add
{
return a + b;
}
}
上面的類很明顯,如果T和V都傳入int的話,三個add方法將具有 同樣的簽名,但這個類仍然能通過編譯,是否會引起調用混淆將在這個類實例化 和調用add方法時判斷。請看下面調用代碼:
Node<int, int> node = new Node<int, int>();
object x = node.add(2, 11);
這個Node的實例化引起了三個add具有同樣的簽名,但卻能 調用成功,因為他優先匹配了第三個add。但如果刪除了第三個add,上面的調用 代碼則無法編譯通過,提示方法產生的混淆,因為運行時無法在第一個add和第 二個add之間選擇。
Node<string, int> node = new Node<string, int>();
object x = node.add(2, "11");
這兩行調用代碼可正確編譯,因為傳入的 string和int,使三個add具有不同的簽名,當然能找到唯一匹配的add方法。
由以上示例可知,C#的泛型是在實例的方法被調用時檢查重載是否產生 混淆,而不是在泛型類本身編譯時檢查。同時還得出一個重要原則:
當 一般方法與泛型方法具有相同的簽名時,會覆蓋泛型方法。
泛型類的方 法重寫
方法重寫(override)的主要問題是方法簽名的識別規則,在這 一點上他與方法重載一樣,請參考泛型類的方法重載。
泛型的使用范圍
本文主要是在類中講述泛型,實際上,泛型還可以用在類方法、接口、 結構(struct)、委托等上面使用,使用方法大致相同,就不再講述。
小結
C# 泛型是開發工具庫中的一個無價之寶。它們可以提高性能、類型 安全和質量,減少重復性的編程任務,簡化總體編程模型,而這一切都是通過優 雅的、可讀性強的語法完成的。盡管 C# 泛型的根基是 C++ 模板,但 C# 通過 提供編譯時安全和支持將泛型提高到了一個新水平。C# 利用了兩階段編譯、元 數據以及諸如約束和一般方法之類的創新性的概念。毫無疑問,C# 的將來版本 將繼續發展泛型,以便添加新的功能,並且將泛型擴展到諸如數據訪問或本地化 之類的其他 .NET Framework 領域。