程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> C語言 >> C++ >> C++入門知識 >> leetcode之 median of two sorted arrays

leetcode之 median of two sorted arrays

編輯:C++入門知識

這是我做的第二個leetcode題目,一開始以為和第一個一樣很簡單,但是做的過程中才發現這個題目非常難,給人一種“剛上戰場就踩上地雷掛掉了”的感覺。後來搜了一下leetcode的難度分布表(leetcode難度及面試頻率)才發現,該問題是難度為5的問題,真是小看了它!網上搜了很多答案,但是鮮見簡明正確的解答,唯有一種尋找第k小值的方法非常好,在此整理一下。          首先對leetcode的編譯運行吐槽一下:貌似沒有超時判斷,而且small和large的數據集相差很小。此題一開始我采用最笨的方法去實現,利用排序將兩個數組合並成一個數組,然後返回中位數:    

class Solution {  
public:  
    double findMedianSortedArrays(int A[], int m, int B[], int n) {  
        // Start typing your C/C++ solution below  
        // DO NOT write int main() function  
        int *a=new int[m+n];  
          
        memcpy(a,A,sizeof(int)*m);  
        memcpy(a+m,B,sizeof(int)*n);  
          
        sort(a,a+n+m);  
          
        double median=(double) ((n+m)%2? a[(n+m)>>1]:(a[(n+m-1)>>1]+a[(n+m)>>1])/2.0);  
          
        delete a;  
          
        return median;  
    }  
};  

 

  該方法居然也通過測試,但是其復雜度最壞情況為O(nlogn),這說明leetcode只對算法的正確性有要求,時間要求其實不嚴格。   另一種方法即是利用類似merge的操作找到中位數,利用兩個分別指向A和B數組頭的指針去遍歷數組,然後統計元素個數,直到找到中位數,此時算法復雜度為O(n)。之後還嘗試了根據算法導論中的習題(9.3-8)擴展的方法,但是該方法會存在無窮多的邊界細節問題,而且擴展也不見得正確,這個可從各網頁的評論看出,非常不建議大家走這條路。   最後從medianof two sorted arrays中看到了一種非常好的方法。原文用英文進行解釋,在此我們將其翻譯成漢語。該方法的核心是將原問題轉變成一個尋找第k小數的問題(假設兩個原序列升序排列),這樣中位數實際上是第(m+n)/2小的數。所以只要解決了第k小數的問題,原問題也得以解決。   首先假設數組A和B的元素個數都大於k/2,我們比較A[k/2-1]和B[k/2-1]兩個元素,這兩個元素分別表示A的第k/2小的元素和B的第k/2小的元素。這兩個元素比較共有三種情況:>、<和=。如果A[k/2-1]<B[k/2-1],這表示A[0]到A[k/2-1]的元素都在A和B合並之後的前k小的元素中。換句話說,A[k/2-1]不可能大於兩數組合並之後的第k小值,所以我們可以將其拋棄。   證明也很簡單,可以采用反證法。假設A[k/2-1]大於合並之後的第k小值,我們不妨假定其為第(k+1)小值。由於A[k/2-1]小於B[k/2-1],所以B[k/2-1]至少是第(k+2)小值。但實際上,在A中至多存在k/2-1個元素小於A[k/2-1],B中也至多存在k/2-1個元素小於A[k/2-1],所以小於A[k/2-1]的元素個數至多有k/2+ k/2-2,小於k,這與A[k/2-1]是第(k+1)的數矛盾。   當A[k/2-1]>B[k/2-1]時存在類似的結論。   當A[k/2-1]=B[k/2-1]時,我們已經找到了第k小的數,也即這個相等的元素,我們將其記為m。由於在A和B中分別有k/2-1個元素小於m,所以m即是第k小的數。   通過上面的分析,我們即可以采用遞歸的方式實現尋找第k小的數。此外我們還需要考慮幾個邊界條件:   如果A或者B為空,則直接返回B[k-1]或者A[k-1]; 如果k為1,我們只需要返回A[0]和B[0]中的較小值; 如果A[k/2-1]=B[k/2-1],返回其中一個; 最終實現的代碼為:    
double findKth(int a[], int m, int b[], int n, int k)  
{  
    //always assume that m is equal or smaller than n  
    if (m > n)  
        return findKth(b, n, a, m, k);  
    if (m == 0)  
        return b[k - 1];  
    if (k == 1)  
        return min(a[0], b[0]);  
    //divide k into two parts  
    int pa = min(k / 2, m), pb = k - pa;  
    if (a[pa - 1] < b[pb - 1])  
        return findKth(a + pa, m - pa, b, n, k - pa);  
    else if (a[pa - 1] > b[pb - 1])  
        return findKth(a, m, b + pb, n - pb, k - pb);  
    else  
        return a[pa - 1];  
}  
  
class Solution  
{  
public:  
    double findMedianSortedArrays(int A[], int m, int B[], int n)  
    {  
        int total = m + n;  
        if (total & 0x1)  
            return findKth(A, m, B, n, total / 2 + 1);  
        else  
            return (findKth(A, m, B, n, total / 2)  
                    + findKth(A, m, B, n, total / 2 + 1)) / 2;  
    }  
};  

 

  我們可以看出,代碼非常簡潔,而且效率也很高。在最好情況下,每次都有k一半的元素被刪除,所以算法復雜度為logk,由於求中位數時k為(m+n)/2,所以算法復雜度為log(m+n)。  

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved