尾遞歸轉換能加快應用程序的速度,但不是所有的JVM都會做這種轉換,很多算法用尾遞歸方法表示會顯得格外簡明。編譯器會自動把這種方法轉換成循環,以提高程序的性能。但在Java語言規范中,並沒有要求一定要作這種轉換,因此,並不是所有的Java虛擬機(JVM)都會做這種轉換。這就意味著在Java語言中采用尾遞歸表示可能導致巨大的內存占用,而這並不是我們期望的結果。Eric Allen在本文中闡述了動態編譯將會保持語言的語義,而靜態編譯則通常不會。他說明了為什麼這是一個重要問題,並提供了一段代碼來幫助判斷您的即時(JIT)編譯器是否會在保持語言語義的同時做尾遞歸代碼轉換。
尾遞歸及其轉換
相當多的程序包含有循環,這些循環運行的時間占了程序總運行時間的很大一部分。這些循環經常要反復更新不止一個變量,而每個變量的更新又經常依賴於其它變量的值。
如果把迭代看成是尾遞歸函數,那麼,就可以把這些變量看成是函數的參數。簡單提醒一下:如果一個調用的返回值被作為調用函數的值立即返回,那麼,這個遞歸調用就是尾遞歸;尾遞歸不必記住調用時調用函數的上下文。
由於這一特點,在尾遞歸函數和循環之間有一個很好的對應關系:可以簡單地把每個遞歸調用看作是一個循環的多次迭代。但因為所有可變的參數值都一次傳給了遞歸調用,所以比起循環來,在尾遞歸中可以更容易地得到更新值。而且,難以使用的break語句也常常為函數的簡單返回所替代。
但在Java編程中,用這種方式表示迭代將導致效率低下,因為大量的遞歸調用有導致堆棧溢出的危險。
解決方案比較簡單:因為尾遞歸函數實際上只是編寫循環的一種更簡單的方式,所以就讓編譯器把它們自動轉換成循環形式。這樣您就同時利用了這兩種形式的優點。
但是,盡管大家都熟知如何把一個尾遞歸函數自動轉換成一個簡單循環,Java規范卻不要求做這種轉換。不作這種要求的原因大概是:通常在面向對象的語言中,這種轉換不能靜態地進行。相反地,這種從尾遞歸函數到簡單循環的轉換必須由JIT編譯器動態地進行。
要理解為什麼會是這樣,考慮下面一個失敗的嘗試:在Integers集上,把Iterator中的元素相乘。
因為下面的程序中有一個錯誤,所以在運行時會拋出一個異常。但是,就象在本專欄以前的許多文章中已經論證的那樣,一個程序拋出的精確異常(跟很棒的錯誤類型標識符一樣)對於找到錯誤藏在程序的什麼地方並沒有什麼幫助,我們也不想編譯器以這種方式改變程序,以使編譯的結果代碼拋出一個不同的異常。
清單1:一個把Integer集的Iterator中的元素相乘的失敗嘗試
import Java.util.Iterator;
public class Example {
public int product(Iterator i) {
return productHelp(i, 0);
}int productHelp(Iterator i, int accumulator) {
if (i.hasNext()) {
return productHelp(i, accumulator * ((Integer)i.next()).intValue());
}
else {
return accumulator;
}
}
}
注意product方法中的錯誤。product方法通過把accumulator賦值為0調用productHelp。它的值應為1。否則,在類Example的任何實例上調用product都將產生0值,不管Iterator是什麼值。
假設這個錯誤終於被改正了,但同時,類Example的一個子類也被創建了,如清單2所示:
清單2:試圖捕捉象清單1這樣的不正確的調用
import Java.util.*;
class Example {
public int product(Iterator i) {
return productHelp(i, 1);
}int productHelp(Iterator i, int accumulator) {
if (i.hasNext()) {
return productHelp(i, accumulator * ((Integer)i.next()).intValue());
}
else {
return accumulator;
}
}
}// And, in a separate file:
import Java.util.*;
public class Example2 extends Example {
int productHelp(Iterator i, int accumulator) {
if (accumulator < 1) {
throw new RuntimeException("accumulator to productHelp must be >= 1");
}
else {
return super.productHelp(i, accumulator);
}
}public static void main(String[] args) {
LinkedList l = new LinkedList();
l.add(new Integer(0));
new Example2().product(l.listIterator());
}
}
類Example2中的被覆蓋的productHelp方法試圖通過當accumulator小於“1”時拋出運行時異常來捕捉對productHelp的不正確調用。不幸的是,這樣做將引入一個新的錯誤。如果Iterator含有任何0值的實例,都將使productHelp在自身的遞歸調用上崩潰。
現在請注意,在類Example2的main方法中,創建了Example2的一個實例並調用了它的product方法。由於傳給這個方法的Iterator包含一個0,因此程序將崩潰。
然而,您可以看到類Example的productHelp是嚴格尾遞歸的。假設一個靜態編譯器想把這個方法的正文轉換成一個循環,如清單3所示:
清單3:靜態編譯不會優化尾調用的一個示例
int productHelp(Iterator i, int accumulator) {
while (i.hasNext()) {
accumulator *= ((Integer)i.next()).intValue();
}
return accumulator;
}
於是,最初對productHelp的調用,結果成了對超類的方法的調用。超方法將通過簡單地在iterator上循環來計算其結果。不會拋出任何異常。
用兩個不同的靜態編譯器來編譯這段代碼,結果是一個會拋出異常,而另一個則不會,想想這是多麼讓人感到困惑。