程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> C語言 >> C++ >> C++入門知識 >> 後綴數組實現的倍增算法和DC3算法

後綴數組實現的倍增算法和DC3算法

編輯:C++入門知識

[cpp]   /************************************************  數據結構:後綴數組(Suffix_Array);    子串:  字符串S的子串r[i..j],i≤j,表示r串中從i到j這一段,  也就是順次排列r[i],r[i+1],...,r[j]形成的字符串;  後綴:  後綴是指從某個位置i開始到整個串末尾結束的一個特殊子串;  字符串r的從第i個字符開始的後綴表示為Suffix(i),也就是Suffix(i)=r[i...len(r)];    後綴數組SA:  後綴數組保存的是一個字符串的所有後綴的排序結果;  其中SA[i]保存的是字符串所有的後綴中第i小的後綴的開頭位置;  名次數組Rank:  名次數組Rank[i]保存的是後綴i在所有後綴中從小到大排列的“名次”;  後綴數組是"排第幾的是誰",名次數組是"排第幾",即後綴數組和名次數組為互逆運算;    (1)倍增算法:  用倍增的方法對每個字符開始的長度為2^k的子字符串進行排序,求出排名,即rank值。  k從0開始,每次加1,當2^k大於n以後,每個字符開始的長度為2^k的子字符串便相當於所有的後綴。  並且這些子字符串都一定已經比較出大小,即rank值中沒有相同的值,那麼此時的rank值就是最後的結果。  每一次排序都利用上次長度為2^k-1的字符串的rank值,  那麼長度為2^k的字符串就可以用兩個長度為2^k-1的字符串的排名作為關鍵字表示,  然後進行基數排序,便得出了長度為2^k的字符串的rank值。    (2)DC3算法:  ①先將後綴分成兩部分,然後對第一部分的後綴排序;  ②利用①的結果,對第二部分的後綴排序;  ③將①和②的結果合並,即完成對所有後綴排序;    時間復雜度:  倍增算法的時間復雜度為O(nlogn),DC3算法的時間復雜度為O(n);  從常數上看,DC3算法的常數要比倍增算法大;    空間復雜度:  倍增算法和DC3算法的空間復雜度都是O(n);  倍增算法所需數組總大小為6n,DC3算法所需數組總大小為10n;    RMQ(Range Minimum/Maximum Query)問題:  對於長度為n的數列A,回答若干詢問RMQ(A,i,j)(i,j<=n),  返回數列A中下標在i,j裡的最小(大)值,  也就是說,RMQ問題是指求區間最值的問題。    LCA(Least Common Ancestors)最近公共祖先問題:  對於有根樹T的兩個結點u、v,  最近公共祖先LCA(T,u,v)表示一個結點x,  滿足x是u、v的祖先且x的深度盡可能大。  另一種理解方式是把T理解為一個無向無環圖,  而LCA(T,u,v)即u到v的最短路上深度最小的點。    RMQ標准算法:  先規約成LCA(Lowest Common Ancestor),再規約成約束RMQ,O(n)-O(q);  首先根據原數列,建立笛卡爾樹,  從而將問題在線性時間內規約為LCA問題;  LCA問題可以在線性時間內規約為約束RMQ,  也就是數列中任意兩個相鄰的數的差都是+1或-1的RMQ問題;  約束RMQ有O(n)-O(1)的在線解法,故整個算法的時間復雜度為O(n)-O(1);    height數組:  定義height[i]=suffix(sa[i-1])和suffix(sa[i])的最長公共前綴,  也就是排名相鄰的兩個後綴的最長公共前綴;    那麼對於j和k,不妨設rank[j]<rank[k],則有以下性質:  suffix(j)和suffix(k)的最長公共前綴為:  height[rank[j]+1],height[rank[j]+2],height[rank[j]+3],…,height[rank[k]]中的最小值;  *************************************************/      #include<iostream>   #include<cstring>   #include<cstdlib>   #include<cstdio>   #include<climits>   #include<algorithm>   using namespace std;      const int N=100010;      /**************倍增算法**************************    int wa[N],wb[N],wv[N],__ws[N];    int cmp(int *r,int a,int b,int l)  {      return r[a]==r[b]&&r[a+l]==r[b+l];  }    void da(int *r,int *sa,int n,int m)  {      int *x=wa,*y=wb,*t;      for(int i=0; i<m; i++)          __ws[i]=0;      for(int i=0; i<n; i++)          __ws[x[i]=r[i]]++;      for(int i=1; i<m; i++)          __ws[i]+=__ws[i-1];      for(int i=n-1; i>=0; i--)          sa[--__ws[x[i]]]=i;      for(int j=1,p=1; p<n; j*=2,m=p)      {          p=0;          for(int i=n-j; i<n; i++)              y[p++]=i;          for(int i=0; i<n; i++)          {              if(sa[i]>=j)                  y[p++]=sa[i]-j;          }          for(int i=0; i<n; i++)              wv[i]=x[y[i]];          for(int i=0; i<m; i++)              __ws[i]=0;          for(int i=0; i<n; i++)              __ws[wv[i]]++;          for(int i=1; i<m; i++)              __ws[i]+=__ws[i-1];          for(int i=n-1; i>=0; i--)              sa[--__ws[wv[i]]]=y[i];          t=x,x=y,y=t,p=1,x[sa[0]]=0;          for(int i=1; i<n; i++)          {              x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;          }      }      return;  }  **************倍增算法**************************/         /***************DC3算法**************************/      #define F(x) ((x)/3+((x)%3==1?0:tb))   #define G(x) ((x)<tb?(x)*3+1:((x)-tb)*3+2)      int wa[N],wb[N],wv[N],_ws[N];      int c0(int *r,int a,int b)   {       return r[a]==r[b]&&r[a+1]==r[b+1]&&r[a+2]==r[b+2];   }      int c12(int k,int *r,int a,int b)   {       if(k==2)           return r[a]<r[b]||r[a]==r[b]&&c12(1,r,a+1,b+1);       else           return r[a]<r[b]||r[a]==r[b]&&wv[a+1]<wv[b+1];   }      void sort(int *r,int *a,int *b,int n,int m)   {       for(int i=0; i<n; i++)           wv[i]=r[a[i]];       for(int i=0; i<m; i++)           _ws[i]=0;       for(int i=0; i<n; i++)           _ws[wv[i]]++;       for(int i=1; i<m; i++)           _ws[i]+=_ws[i-1];       for(int i=n-1; i>=0; i--)           b[--_ws[wv[i]]]=a[i];       return;   }      void dc3(int *r,int *sa,int n,int m)   {       int *rn=r+n,*san=sa+n,ta=0,tb=(n+1)/3,tbc=0,p;       r[n]=r[n+1]=0;       for(int i=0; i<n; i++)       {           if(i%3!=0)               wa[tbc++]=i;       }       sort(r+2,wa,wb,tbc,m);       sort(r+1,wb,wa,tbc,m);       sort(r,wa,wb,tbc,m);       p=1,rn[F(wb[0])]=0;       for(int i=1; i<tbc; i++)       {           rn[F(wb[i])]=c0(r,wb[i-1],wb[i])?p-1:p++;       }       if(p<tbc)           dc3(rn,san,tbc,p);       else           for(int i=0; i<tbc; i++)               san[rn[i]]=i;       for(int i=0; i<tbc; i++)       {           if(san[i]<tb)               wb[ta++]=san[i]*3;       }       if(n%3==1)           wb[ta++]=n-1;       sort(r,wb,wa,ta,m);       for(int i=0; i<tbc; i++)           wv[wb[i]=G(san[i])]=i;       int i,j;       for(i=0,j=0,p=0; i<ta && j<tbc; p++)       {           sa[p]=c12(wb[j]%3,r,wa[i],wb[j])?wa[i++]:wb[j++];       }       for(; i<ta; p++)           sa[p]=wa[i++];       for(; j<tbc; p++)           sa[p]=wb[j++];       return;   }   /***************DC3算法**************************/         int rank[N],height[N];      void calheight(int *r,int *sa,int n)   {       int i,j,k=0;       for(int i=1; i<=n; i++)           rank[sa[i]]=i;       for(int i=0; i<n; height[rank[i++]]=k)       {           for(k?k--:0,j=sa[rank[i]-1]; r[i+k]==r[j+k]; k++);       }       return;   }      int RMQ[N];   int mm[N];   int best[20][N];      void initRMQ(int n)   {       int i,j,a,b;       for(mm[0]=-1,i=1; i<=n; i++)           mm[i]=((i&(i-1))==0)?mm[i-1]+1:mm[i-1];       for(i=1; i<=n; i++) best[0][i]=i;       for(i=1; i<=mm[n]; i++)           for(j=1; j<=n+1-(1<<i); j++)           {               a=best[i-1][j];               b=best[i-1][j+(1<<(i-1))];               if(RMQ[a]<RMQ[b]) best[i][j]=a;               else best[i][j]=b;           }       return;   }      int askRMQ(int a,int b)   {       int t;       t=mm[b-a+1];       b-=(1<<t)-1;       a=best[t][a];       b=best[t][b];       return RMQ[a]<RMQ[b]?a:b;   }      int lcp(int a,int b)   {       int t;       a=rank[a];       b=rank[b];       if(a>b)       {           t=a;           a=b;           b=t;       }       return(height[askRMQ(a+1,b)]);   }  

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved