上一個帖子已經介紹了基本類型和引用類型的性能差異(主要是由於內存分配方式不同導致)。為了給列位看官加深印象,今天拿一個具體的例子來實地操作一把,看看優化的效果如何。
★關於需求
首先描述一下需求,具體如下:給定一個String對象,過濾掉除數字(字符'0'- '9')以外的其它字符。要求時間開銷盡可能小。過濾函數的原型如下:String filter(String str);
針對上述需求,我寫了5個不同的過濾函數。為了敘述方便,分別稱為filter1到filter5。 其中filter1性能最差、filter5性能最好。在你接著看後續的內容之前,你先暗自思考一下,如果由你 來實現該函數,大概會寫成什麼樣?最好把你想好的函數寫下來,便於後面的對比。
★代碼實現
◇測試代碼
為了方便測試性能,先准備好一個測試代碼,具體如下:
class Test
{
public static void main(String[] args)
{
if(args.length != 1)
{
return;
}
String str = "";
long nBegin = System.currentTimeMillis();
for(int i=0; i<1024*1024; i++)
{
str = filterN(args[0]); //此處調用某個具體的過濾函數
}
long nEnd = System.currentTimeMillis();
System.out.println(nEnd- nBegin);
System.out.println(str);
}
};
在沒有想好你的實現方式之 前,先別偷看後續內容哦!另外,先注明下,我使用的Java環境是JDK 1.5.0-09,使用的測試字符串為 “D186783E36B721651E8AF96AB1C4000B”。由於機器性能不盡相同,你在自己機器上測試的 結果可能和我下面給出的數值不太一樣,但趨勢應該是差不多的。
◇版本1
先來揭曉性能 最差的filter1,代碼如下:
private static String filter1(String strOld)
{
String strNew = new String();
for(int i=0; i<strOld.length(); i++)
{
if('0'<=strOld.charAt(i) && strOld.charAt(i) <='9')
{
strNew += strOld.charAt(i);
}
}
return strNew;
}
如果你的代碼不幸和filter1雷同,那你的Java功底可就是相當糟糕了, 連字符串拼接需要用StringBuffer來優化都沒搞明白。
為了和後續對比,先記下filter1的處理 時間,大約在8.81-8.90秒之間。
◇版本2
再來看看filter2,代碼如下:
private static String filter2(String strOld)
{
StringBuffer strNew = new StringBuffer();
for(int i=0; i<strOld.length(); i++)
{
if('0'<=strOld.charAt(i) && strOld.charAt(i)<='9')
{
strNew.append(strOld.charAt(i));
}
}
return strNew.toString();
}
其實剛才在評價filter1的時候,已經洩露了filter2的天機。filter2通過使用 StringBuffer來優化連接字符串的性能。為什麼StringBuffer連接字符串的性能比String好,這個已經 是老生常談,我就不細說了。尚不清楚的同學自己上Google一查便知。我估計應該有挺多同學會寫出類 似filter2的代碼。
filter2的處理時間大約為2.14-2.18秒,提升了大約4倍。
◇版本 3
接著看看filter3,代碼如下:
private static String filter3(String strOld)
{
StringBuffer strNew = new StringBuffer();
int nLen = strOld.length();
for(int i=0; i<nLen; i++)
{
char ch = strOld.charAt(i);
if('0'<=ch && ch<='9')
{
strNew.append(ch);
}
}
return strNew.toString();
}
乍一 看filter3和filter2差不多嘛!你再仔細瞧一瞧,原來先把strOld.charAt(i)賦值給char變量,節省了 重復調用 charAt()方法的開銷;另外把strOld.length()先保存為nLen,也節省了重復調用length()的 開銷。能想到這一步的同學,估計是比較細心的。
經過此一優化,處理時間節省為1.48-1.52, 提升了約30%。由於charAt()和length()的內部實現都挺簡單的,所以提升的性能不太明顯。
◇ 版本4
然後看看filter4,代碼如下:
private static String filter4(String strOld)
{
int nLen = strOld.length();
StringBuffer strNew = new StringBuffer(nLen);
for(int i=0; i<nLen; i++)
{
char ch = strOld.charAt(i);
if('0'<=ch && ch<='9')
{
strNew.append(ch);
}
}
return strNew.toString();
}
filter4和filter3差別也很小,唯一差別就在於調用了StringBuffer帶參數的構造函數 。通過StringBuffer的構造函數設置初始的容量大小,可以有效避免append()追加字符時重新分配內存 ,從而提高性能。
filter4的處理時間大約在1.33-1.39秒。約提高10%,可惜提升的幅度有點小 :-(
◇版本5
最後來看看終極版本,性能最好的filter5。
private static String filter5(String strOld)
{
int nLen = strOld.length();
char[] chArray = new char[nLen];
int nPos = 0;
for(int i=0; i<nLen; i++)
{
char ch = strOld.charAt(i);
if('0'<=ch && ch<='9')
{
chArray[nPos] = ch;
nPos++;
}
}
return new String(chArray, 0, nPos);
}
猛一看,你可能會想:filter5 和前幾個版本的差別也忒大了吧!filter5既沒有用String也沒有用StringBuffer,而是拿字符數組進行 中間處理。
filter5的處理時間,只用了0.72-0.78秒,相對於filter4提升了將近50%。為啥捏? 是不是因為直接操作字符數組,節省了append(char)的調用?通過查看append(char)的源代碼,內部的 實現很簡單,應該不至於提升這麼多。
那是什麼原因捏?
雖然filter5有一個字符數組的 創建開銷,但是相對於filter4來說,StringBuffer的構造函數內部也會有字符數組的創建開銷。兩相抵 消。所以filter5比filter4還多節省了StringBuffer對象本省的創建開銷。所以節約了性能。
★ 對於5個版本的總結
上述5個版本,filter1和filter5的性能相差12倍。除了filter3相對於 filter2是通過消除函數重復調用來提升性能,其它的幾個版本都是通過節省內存分配,降低了時間開銷 。可見內存分配對於性能的影響有多大啊!如果你是看了上一個帖子才寫出filter4或者filter5,那說 明你已經領會了個中奧妙,我那個帖子也就沒白寫了。
★一點補充說明,關於時間和空間的平衡
另外,需要補充說明一下。版本4和版本5使用了空間換時間的手法來提升性能。假如被過濾的字 符串很大,並且數字字符的比例很低,這種方式就不太合算了。
舉個例子:被處理的字符串中, 絕大部分都只含有不到10%的數字字符,只有少數字符串包含較多的數字字符。這時候該怎麼辦捏?對於 filter4來說,可以把new StringBuffer(nLen);修改為new StringBuffer(nLen/10);來節約空間開銷。 但是filter5就沒法這麼玩了。
所以,具體該用版本4還是版本5,要看具體情況了。只有在你非 常看重時間開銷,且數字字符比例很高(至少大於50%)的情況下,用filter5才合算。否則的話,建議 用filter4。
本文原始地址:
http://program-think.blogspot.com/2009/03/java- performance-tuning-2-string.html