問題:有一個大小為n的數組A[0,1,2,…,n-1],求其中第k大的數。
該問題是一個經典的問題,在《算法導論》中被作為單獨的一節提出,而且其解決方法很好的利用了分治的思想,將時間復雜度控制在了O(n),這多少出乎我們的意料,此處暫且不表。
該問題還可以變形為:有一個大小為 n的數組A[0,1,2,…,n-1],求其中前k大的數。
一字之差,原問題是“第k大”,變形的問題是“前k大”,但是平均時間復雜度卻都可以控制在O(n),這不由得讓人暗暗稱奇。
我們先分析原問題:有一個大小為 n的數組A[0,1,2,…,n-1],求其中第k大的數。
我們先取特例,令k=1,那麼就是取最大的數,只要掃描一遍數組就可以確定該值,如果k=2,則掃描兩邊數組就可以確定第二大的數,依此類推下去,時間復雜度是O(k*n),如果k跟n是一個數量級,那麼時間復雜度就是O(n*n)了,顯然不是最優的解法。
考慮分治法,難點在於如何將該問題分解為兩個子問題。
快速排序最基礎的一步:
隨機取某一個數x,將其與數組末尾元素交換,然後將比其小的數交換至前,比其大的數交換至後。
這一步使某一數組的快速排序問題分解成兩個子數組的排序問題,現在我們就依此來解決取第k大的數這個問題。
設數組下表從0開始,至n-1結束。
1、 隨機取某個數,將其與數組末尾元素交換。
a) idx=rand(0,n-1);生成[0,n-1]間的隨機數。
b) Swap(array[idx], array[n-1]);
2、 用末尾元素x,將比x小的數交換至前,比x大的數交換至後,並返回此時x在數組中的位置mid。
3、 如果mid==n-k,那麼返回該值,這就是第k大的數。
如果mid>n-k,那麼第k大的數在左半數組,且在左半數組中是第k-(n-mid)大的數。
如果mid<n-k,那麼第k大的數在右半數組,而且仍然是第k的數。
代碼如下:
#include "iostream"
using namespace std;
int random_partion(int *p, int n)
{
int idx=rand()%n;
swap(p[idx], p[n-1]);
int i=-1; //i表示最後一個小於p[n-1]的元素的位置
int j=0; //j用來掃描數組
for(j=0; j<n; j++)
{
//將小於p[n-1]的數交換到前半部分
if(p[j]<p[n-1])
{
swap(p[++i], p[j]);
}
}
swap(p[++i], p[n-1]);
return i;
}
int getMaxK(int *p, int n, int k)
{
int mid;
if(k<=0)
return -1;
if(n<k)
return -1;
mid=random_partion(p, n); //對原數組進行一次劃分
if(mid == n-k) //如果mid==n-k,那麼返回該值,這就是第k大的數
return p[mid];
else if(mid<n-k)
return getMaxK(p+mid+1, n-mid-1, k); //如果mid<n-k,那麼第k大的數在右半數組,而且仍然是第k大數
else
return getMaxK(p, mid, k-(n-mid)); //如果mid>n-k,那麼第k大的數在左半數組,且在左半數組中是第k-(n-mid)大的數
}
int main(void)
{
int num,a[] = {12012, 3, 945, 965, 66, 232, 65, 7, 8, 898, 56, 878, 170, 13, 5};
num=getMaxK(a, 15, 4);
printf("%d\n",num);
system("pause");
return 0;
}