[cpp] /************************************************ 數據結構:後綴數組(Suffix_Array); 子串: 字符串S的子串r[i..j],i≤j,表示r串中從i到j這一段, 也就是順次排列r[i],r[i+1],...,r[j]形成的字符串; 後綴: 後綴是指從某個位置i開始到整個串末尾結束的一個特殊子串; 字符串r的從第i個字符開始的後綴表示為Suffix(i),也就是Suffix(i)=r[i...len(r)]; 後綴數組SA: 後綴數組保存的是一個字符串的所有後綴的排序結果; 其中SA[i]保存的是字符串所有的後綴中第i小的後綴的開頭位置; 名次數組Rank: 名次數組Rank[i]保存的是後綴i在所有後綴中從小到大排列的“名次”; 後綴數組是"排第幾的是誰",名次數組是"排第幾",即後綴數組和名次數組為互逆運算; (1)倍增算法: 用倍增的方法對每個字符開始的長度為2^k的子字符串進行排序,求出排名,即rank值。 k從0開始,每次加1,當2^k大於n以後,每個字符開始的長度為2^k的子字符串便相當於所有的後綴。 並且這些子字符串都一定已經比較出大小,即rank值中沒有相同的值,那麼此時的rank值就是最後的結果。 每一次排序都利用上次長度為2^k-1的字符串的rank值, 那麼長度為2^k的字符串就可以用兩個長度為2^k-1的字符串的排名作為關鍵字表示, 然後進行基數排序,便得出了長度為2^k的字符串的rank值。 (2)DC3算法: ①先將後綴分成兩部分,然後對第一部分的後綴排序; ②利用①的結果,對第二部分的後綴排序; ③將①和②的結果合並,即完成對所有後綴排序; 時間復雜度: 倍增算法的時間復雜度為O(nlogn),DC3算法的時間復雜度為O(n); 從常數上看,DC3算法的常數要比倍增算法大; 空間復雜度: 倍增算法和DC3算法的空間復雜度都是O(n); 倍增算法所需數組總大小為6n,DC3算法所需數組總大小為10n; RMQ(Range Minimum/Maximum Query)問題: 對於長度為n的數列A,回答若干詢問RMQ(A,i,j)(i,j<=n), 返回數列A中下標在i,j裡的最小(大)值, 也就是說,RMQ問題是指求區間最值的問題。 LCA(Least Common Ancestors)最近公共祖先問題: 對於有根樹T的兩個結點u、v, 最近公共祖先LCA(T,u,v)表示一個結點x, 滿足x是u、v的祖先且x的深度盡可能大。 另一種理解方式是把T理解為一個無向無環圖, 而LCA(T,u,v)即u到v的最短路上深度最小的點。 RMQ標准算法: 先規約成LCA(Lowest Common Ancestor),再規約成約束RMQ,O(n)-O(q); 首先根據原數列,建立笛卡爾樹, 從而將問題在線性時間內規約為LCA問題; LCA問題可以在線性時間內規約為約束RMQ, 也就是數列中任意兩個相鄰的數的差都是+1或-1的RMQ問題; 約束RMQ有O(n)-O(1)的在線解法,故整個算法的時間復雜度為O(n)-O(1); height數組: 定義height[i]=suffix(sa[i-1])和suffix(sa[i])的最長公共前綴, 也就是排名相鄰的兩個後綴的最長公共前綴; 那麼對於j和k,不妨設rank[j]<rank[k],則有以下性質: suffix(j)和suffix(k)的最長公共前綴為: height[rank[j]+1],height[rank[j]+2],height[rank[j]+3],…,height[rank[k]]中的最小值; *************************************************/ #include<iostream> #include<cstring> #include<cstdlib> #include<cstdio> #include<climits> #include<algorithm> using namespace std; const int N=100010; /**************倍增算法************************** int wa[N],wb[N],wv[N],__ws[N]; int cmp(int *r,int a,int b,int l) { return r[a]==r[b]&&r[a+l]==r[b+l]; } void da(int *r,int *sa,int n,int m) { int *x=wa,*y=wb,*t; for(int i=0; i<m; i++) __ws[i]=0; for(int i=0; i<n; i++) __ws[x[i]=r[i]]++; for(int i=1; i<m; i++) __ws[i]+=__ws[i-1]; for(int i=n-1; i>=0; i--) sa[--__ws[x[i]]]=i; for(int j=1,p=1; p<n; j*=2,m=p) { p=0; for(int i=n-j; i<n; i++) y[p++]=i; for(int i=0; i<n; i++) { if(sa[i]>=j) y[p++]=sa[i]-j; } for(int i=0; i<n; i++) wv[i]=x[y[i]]; for(int i=0; i<m; i++) __ws[i]=0; for(int i=0; i<n; i++) __ws[wv[i]]++; for(int i=1; i<m; i++) __ws[i]+=__ws[i-1]; for(int i=n-1; i>=0; i--) sa[--__ws[wv[i]]]=y[i]; t=x,x=y,y=t,p=1,x[sa[0]]=0; for(int i=1; i<n; i++) { x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; } } return; } **************倍增算法**************************/ /***************DC3算法**************************/ #define F(x) ((x)/3+((x)%3==1?0:tb)) #define G(x) ((x)<tb?(x)*3+1:((x)-tb)*3+2) int wa[N],wb[N],wv[N],_ws[N]; int c0(int *r,int a,int b) { return r[a]==r[b]&&r[a+1]==r[b+1]&&r[a+2]==r[b+2]; } int c12(int k,int *r,int a,int b) { if(k==2) return r[a]<r[b]||r[a]==r[b]&&c12(1,r,a+1,b+1); else return r[a]<r[b]||r[a]==r[b]&&wv[a+1]<wv[b+1]; } void sort(int *r,int *a,int *b,int n,int m) { for(int i=0; i<n; i++) wv[i]=r[a[i]]; for(int i=0; i<m; i++) _ws[i]=0; for(int i=0; i<n; i++) _ws[wv[i]]++; for(int i=1; i<m; i++) _ws[i]+=_ws[i-1]; for(int i=n-1; i>=0; i--) b[--_ws[wv[i]]]=a[i]; return; } void dc3(int *r,int *sa,int n,int m) { int *rn=r+n,*san=sa+n,ta=0,tb=(n+1)/3,tbc=0,p; r[n]=r[n+1]=0; for(int i=0; i<n; i++) { if(i%3!=0) wa[tbc++]=i; } sort(r+2,wa,wb,tbc,m); sort(r+1,wb,wa,tbc,m); sort(r,wa,wb,tbc,m); p=1,rn[F(wb[0])]=0; for(int i=1; i<tbc; i++) { rn[F(wb[i])]=c0(r,wb[i-1],wb[i])?p-1:p++; } if(p<tbc) dc3(rn,san,tbc,p); else for(int i=0; i<tbc; i++) san[rn[i]]=i; for(int i=0; i<tbc; i++) { if(san[i]<tb) wb[ta++]=san[i]*3; } if(n%3==1) wb[ta++]=n-1; sort(r,wb,wa,ta,m); for(int i=0; i<tbc; i++) wv[wb[i]=G(san[i])]=i; int i,j; for(i=0,j=0,p=0; i<ta && j<tbc; p++) { sa[p]=c12(wb[j]%3,r,wa[i],wb[j])?wa[i++]:wb[j++]; } for(; i<ta; p++) sa[p]=wa[i++]; for(; j<tbc; p++) sa[p]=wb[j++]; return; } /***************DC3算法**************************/ int rank[N],height[N]; void calheight(int *r,int *sa,int n) { int i,j,k=0; for(int i=1; i<=n; i++) rank[sa[i]]=i; for(int i=0; i<n; height[rank[i++]]=k) { for(k?k--:0,j=sa[rank[i]-1]; r[i+k]==r[j+k]; k++); } return; } int RMQ[N]; int mm[N]; int best[20][N]; void initRMQ(int n) { int i,j,a,b; for(mm[0]=-1,i=1; i<=n; i++) mm[i]=((i&(i-1))==0)?mm[i-1]+1:mm[i-1]; for(i=1; i<=n; i++) best[0][i]=i; for(i=1; i<=mm[n]; i++) for(j=1; j<=n+1-(1<<i); j++) { a=best[i-1][j]; b=best[i-1][j+(1<<(i-1))]; if(RMQ[a]<RMQ[b]) best[i][j]=a; else best[i][j]=b; } return; } int askRMQ(int a,int b) { int t; t=mm[b-a+1]; b-=(1<<t)-1; a=best[t][a]; b=best[t][b]; return RMQ[a]<RMQ[b]?a:b; } int lcp(int a,int b) { int t; a=rank[a]; b=rank[b]; if(a>b) { t=a; a=b; b=t; } return(height[askRMQ(a+1,b)]); }