我們都知道C++排序方法中,有四種常用方法插入排序、希爾排序、交換排序以及選擇排序。上一篇文章,我們介紹了插入排序,今天我們介紹另一種排序方法——希爾排序。本系列文章統一 測試程序)
希爾排序
前面的算法的平均效率都不怎麼好,但我們注意到直插排序在關鍵碼基本有序的情況下,效率是最好的,並且,在關鍵碼的數量很少的時候,n和n2的差距也不是那麼的明顯。基於以上的事實,D.L.Shell在1959年(老古董了)提出了縮小增量排序,基本思想是:取一個間隔(gap),將序列分成若干的子序列,對每個子序列進行直插排序;然後逐漸縮小間隔,重復以上過程,直到間隔為1。在開始的時候,每個子序列裡關鍵碼很少,直插的效率很高;隨著間隔的縮小,子序列的關鍵碼越來越多,但是在前面的排序基礎上,關鍵碼已經基本有序,直插的效率依然很高。
希爾排序的時間復雜度不好估量,gap的選取也沒有定論,gap=[gap/2]的程序是最好寫的,至於為什麼,寫寫就知道了。
- template <class T>
- void ShellSort(T a[], int N, int& KCN, int& RMN)
- {
- KCN = 0; RMN = 0;
- for (int gap = N/2; gap; gap = gap/2)
- for (int i = gap; i < N; i++)
- {
- T temp = a[i]; RMN++;
- for (int j = i; j >= gap && ++KCN && temp < a[j - gap]; j -= gap)
- { a[j] = a[j - gap]; RMN++; }
- a[j] = temp; RMN++;
- }
- }
測試結果:
- Sort ascending N=10000 TimeSpared: 0ms
- KCN=120005 KCN/N=12.0005 KCN/N^2=0.00120005 KCN/NlogN=0.903128
- RMN=240010 RMN/N=24.001 RMN/N^2=0.0024001 RMN/NlogN=1.80626
- Sort randomness N=10000 TimeSpared: 10ms
- KCN=258935 KCN/N=25.8935 KCN/N^2=0.00258935 KCN/NlogN=1.94868
- RMN=383849 RMN/N=38.3849 RMN/N^2=0.00383849 RMN/NlogN=2.88875
- Sort descending N=10000 TimeSpared: 10ms
- KCN=172578 KCN/N=17.2578 KCN/N^2=0.00172578 KCN/NlogN=1.29878
- RMN=302570 RMN/N=30.257 RMN/N^2=0.0030257 RMN/NlogN=2.27707
注意到這時的測試結果很不准確了,10000個整數的排序已經測試不出什麼來了(估計新機器都是0ms,我這裡也有個別的時候全是0)。因此,下面用100000個整數的排序重新測試了一次:
- Sort ascending N=100000 TimeSpared: 140ms
- KCN=1500006 KCN/N=15.0001 KCN/N^2=0.000150001KCN/NlogN=0.903094
- RMN=3000012 RMN/N=30.0001 RMN/N^2=0.000300001RMN/NlogN=1.80619
- Sort randomness N=100000 TimeSpared: 230ms
- KCN=4041917 KCN/N=40.4192 KCN/N^2=0.000404192KCN/NlogN=2.43348
- RMN=5598883 RMN/N=55.9888 RMN/N^2=0.000559888RMN/NlogN=3.37086
- Sort descending N=100000 TimeSpared: 151ms
- KCN=2244585 KCN/N=22.4459 KCN/N^2=0.000224459KCN/NlogN=1.35137
- RMN=3844572 RMN/N=38.4457 RMN/N^2=0.000384457RMN/NlogN=2.31466
這個結果表明,希爾排序幾乎沒有最壞情況,無論是正序、逆序、亂序,所用時間都不是很多,附加儲存是O(1),的確非常不錯。在沒搞清楚快速排序、堆排序之前,它的確是個很好的選擇,我當年一直用它。