Java泛型(generics
) 是JDK 5中引入的一個新特性,允許在定義類和接口的時候使用類型參數(type parameter)。聲明的類型參數在使用時用具體的類型來替換。泛型最主要的應用是在JDK 5中的新集合類框架中。對於泛型概念的引入,開發社區的觀點是褒貶不一。從好的方面來說,泛型的引入可以解決之前的集合類框架在使用過程中通常會出現的運行時刻類型錯誤,因為編譯器可以在編譯時刻就發現很多明顯的錯誤。而從不好的地方來說,為了保證與舊有版本的兼容性,Java泛型的實現上存在著一些不夠優雅的地方。當然這也是任何有歷史的編程語言所需要承擔的歷史包袱。後續的版本更新會為早期的設計缺陷所累。
開發人員在使用泛型的時候,很容易根據自己的直覺而犯一些錯誤。比如一個方法如果接收List<Object>
作為形式參數,那麼如果嘗試將一個List<String>
的對象作為實際參數傳進去,卻發現無法通過編譯。雖然從直覺上來說,Object是String的父類,這種類型轉換應該是合理的。但是實際上這會產生隱含的類型轉換問題,因此編譯器直接就禁止這樣的行為。本文試圖對Java泛型做一個概括性的說明。
正確理解泛型概念的首要前提是理解類型擦除(type erasure
)。
Java中的泛型基本上都是在編譯器這個層次來實現的。在生成的Java字節代碼中是不包含泛型中的類型信息的。使用泛型的時候加上的類型參數,會被編譯器在編譯的時候去掉。這個過程就稱為類型擦除。如在代碼中定義的List<Object>
和List<String>
等類型,在編譯之後都會變成List。JVM看到的只是List,而由泛型附加的類型信息對JVM來說是不可見的。Java編譯器會在編譯時盡可能的發現可能出錯的地方,但是仍然無法避免在運行時刻出現類型轉換異常的情況。類型擦除也是Java的泛型實現方式與C++模板機制實現方式之間的重要區別。 很多泛型的奇怪特性都與這個類型擦除的存在有關,包括:
泛型類並沒有自己獨有的Class類對象。比如並不存在
List<String>.class
或是List<Integer>.class
,而只有List.class
。 靜態變量是被泛型類的所有實例所共享的。對於聲明為MyClass<T>
的類,訪問其中的靜態變量的方法仍然是 MyClass.myStaticVar。不管是通過new MyClass<String>;
還是new MyClass<Integer>
創建的對象,都是共享一個靜態變量。 泛型的類型參數不能用在Java異常處理的catch語句中。因為異常處理是由JVM在運行時刻來進行的。由於類型信息被擦除,JVM是無法區分兩個異常類型MyException<String>;
和MyException<Integer>
的。對於JVM來說,它們都是 MyException類型的。也就無法執行與異常對應的catch語句。
類型擦除的基本過程也比較簡單: 首先是找到用來替換類型參數的具體類。這個具體類一般是Object。如果指定了類型參數的上界的話,則使用這個上界。把代碼中的類型參數都替換成具體的類。同時去掉出現的類型聲明,即去掉<>
的內容。比如: T get()
方法聲明就變成了Object get()
; List<String>
就變成了List
。 接下來就可能需要生成一些橋接方法(bridge method)。這是由於擦除了類型之後的類可能缺少某些必須的方法。比如考慮下面的代碼:
class MyString implements Comparable<String> { public int compareTo(String str) { return 0; } }
當類型信息被擦除之後,上述類的聲明變成了class MyString implements Comparable。但是這樣的話,類MyString就會有編譯錯誤,因為沒有實現接口Comparable聲明的int compareTo(Object)方法。這個時候就由編譯器來動態生成這個方法。
了解了類型擦除機制之後,就會明白編譯器承擔了全部的類型檢查工作。編譯器禁止某些泛型的使用方式,正是為了確保類型的安全性。以上面提到的List<Object>
和List<String>
為例來具體分析:
public void inspect(List<Object> list) { for (Object obj : list) { System.out.println(obj); } list.add(1); //這個操作在當前方法的上下文是合法的。 } public void test() { List<String> strs = new ArrayList<String>(); inspect(strs); //編譯錯誤 }
這段代碼中,inspect
方法接受List<Object>
作為參數,當在test
方法中試圖傳入List<String>
的時候,會出現編譯錯誤。假設這樣的做法是允許的,那麼在inspect
方法就可以通過list.add(1)
來向集合中添加一個數字。這樣在test
方法看來,其聲明為List<String>
的集合中卻被添加了一個Integer
類型的對象。這顯然是違反類型安全的原則的,在某個時候肯定會拋出ClassCastException
。因此,編譯器禁止這樣的行為。編譯器會盡可能的檢查可能存在的類型安全問題。對於確定是違反相關原則的地方,會給出編譯錯誤。當編譯器無法判斷類型的使用是否正確的時候,會給出警告信息。
在使用泛型類的時候,既可以指定一個具體的類型,如List<String>
就聲明了具體的類型是String
;也可以用通配符?
來表示未知類型,如List<?>
就聲明了List中包含的元素類型是未知的。 通配符所代表的其實是一組類型,但具體的類型是未知的。List<?>
所聲明的就是所有類型都是可以的。但是List<?>
並不等同於List<Object>
。List<Object>
實際上確定了List
中包含的是Object
及其子類,在使用的時候都可以通過Object
來進行引用。而List<?>
則其中所包含的元素類型是不確定。其中可能包含的是String
,也可能是 Integer
。如果它包含了String
的話,往裡面添加Integer
類型的元素就是錯誤的。正因為類型未知,就不能通過new ArrayList<?>()
的方法來創建一個新的ArrayList
對象。因為編譯器無法知道具體的類型是什麼。但是對於 List<?>
中的元素確總是可以用Object
來引用的,因為雖然類型未知,但肯定是Object
及其子類。考慮下面的代碼:
public void wildcard(List<> list) { list.add(1);//編譯錯誤 }
如上所示,試圖對一個帶通配符的泛型類進行操作的時候,總是會出現編譯錯誤。其原因在於通配符所表示的類型是未知的。
因為對於List<?>
中的元素只能用Object
來引用,在有些情況下不是很方便。在這些情況下,可以使用上下界來限制未知類型的范圍。 如List<? extends Number>
說明List中可能包含的元素類型是Number
及其子類。而List<? super Number>
則說明List
中包含的是Number
及其父類。當引入了上界之後,在使用類型的時候就可以使用上界類中定義的方法。比如訪問 List<? extends Number>
的時候,就可以使用Number
類的intValue
等方法。
在Java中,大家比較熟悉的是通過繼承機制而產生的類型體系結構。比如String
繼承自Object
。根據Liskov替換原則,子類是可以替換父類的。當需要Object類的引用的時候,如果傳入一個String
對象是沒有任何問題的。但是反過來的話,即用父類的引用替換子類引用的時候,就需要進行強制類型轉換。編譯器並不能保證運行時刻這種轉換一定是合法的。這種自動的子類替換父類的類型轉換機制,對於數組也是適用的。 String[]
可以替換Object[]
。但是泛型的引入,對於這個類型系統產生了一定的影響。正如前面提到的List是不能替換掉List<Object>
的。
引入泛型之後的類型系統增加了兩個維度:一個是類型參數自身的繼承體系結構,另外一個是泛型類或接口自身的繼承體系結構。第一個指的是對於 List<String>
和List<Object>
這樣的情況,類型參數String
是繼承自Object
的。而第二種指的是 List
接口繼承自Collection
接口。對於這個類型系統,有如下的一些規則:
相同類型參數的泛型類的關系取決於泛型類自身的繼承體系結構。即
List<String>
是Collection<String>
的子類型,List<String>
可以替換Collection<String>
。這種情況也適用於帶有上下界的類型聲明。 當泛型類的類型聲明中使用了通配符的時候, 其子類型可以在兩個維度上分別展開。如對Collection<? extends Number>
來說,其子類型可以在Collection這個維度上展開,即List<? extends Number>
和Set<? extends Number>
等;也可以在Number這個層次上展開,即Collection<Double>
和Collection<Integer>
等。如此循環下去,ArrayList<Long>
和HashSet<Double>
等也都算是Collection<? extends Number>
的子類型。 如果泛型類中包含多個類型參數,則對於每個類型參數分別應用上面的規則。
理解了上面的規則之後,就可以很容易的修正實例分析中給出的代碼了。只需要把List<Object>
改成List<?>
即可。List<String>
是List<?>
的子類型,因此傳遞參數時不會發生錯誤。
泛型類與一般的Java
類基本相同,只是在類和接口定義上多出來了用<>
聲明的類型參數。一個類可以有多個類型參數,如 MyClass<X, Y, Z>
。 每個類型參數在聲明的時候可以指定上界。所聲明的類型參數在Java類中可以像一般的類型一樣作為方法的參數和返回值,或是作為域和局部變量的類型。但是由於類型擦除機制,類型參數並不能用來創建對象或是作為靜態變量的類型。考慮下面的泛型類中的正確和錯誤的用法。
class ClassTest<X extends Number, Y, Z> { private X x; private static Y y; //編譯錯誤,不能用在靜態變量中 public X getFirst() { //正確用法 return x; } public void wrong() { Z z = new Z(); //編譯錯誤,不能創建對象 } }
在使用泛型的時候可以遵循一些基本的原則,從而避免一些常見的問題。
 在代碼中避免泛型類和原始類型的混用(Effective Java中建議不要在代碼中使用原始類型)。比如List和List不應該共同使用。這樣會產生一些編譯器警告和潛在的運行時異常。當需要利用JDK 5之前開發的遺留代碼,而不得不這麼做時,也盡可能的隔離相關的代碼。 在使用帶通配符的泛型類的時候,需要明確通配符所代表的一組類型的概念。由於具體的類型是未知的,很多操作是不允許的。 泛型類最好不要同數組一塊使用。你只能創建new List<?>[10]這樣的數組,無法創建new List[10]這樣的。這限制了數組的使用能力,而且會帶來很多費解的問題。因此,當需要類似數組的功能時候,使用集合類即可。 不要忽視編譯器給出的警告信息。