樹狀數組(Fenwick tree,又名binary indexed tree),是一種很實用的數據結構。它通過用節點i,記錄數組下標在[ i –2^k + 1, i]這段區間的所有數的信息(其中,k為i的二進制表示中末尾0的個數,設lowbit(i) = 2^k),實現在O(lg n) 時間內對數組數據的查找和更新。
樹狀數組的傳統解釋圖,不能很直觀的看出其所能進行的更新和查詢操作。其最主要的操作函數lowbit(k)與數的二進制表示相關,本質上仍是一種二分。因而可以通過二叉樹,對其進行分析。事實上,從二叉樹圖,我們對它所能進行的操作和不能進行的操作一目了然。
和前面提到的點樹類似,先畫一棵二叉樹,然後對節點中序遍歷(點樹是采用廣度優先),每個節點仍然只記錄左子樹信息,見圖:
由於采用的是中序遍歷,從節點1到節點k時,剛好有k個葉子被統計。
可以證明:
葉子k,一定在節點k的左子樹下。
以節點k為根的樹,其左子樹共有葉子lowbit(k)
節點k的父節點是:k + lowbit(k) 或 k - lowbit(k)
節點k + lowbit(k) 是節點k的最近父節點,且節點k在它的左子樹下。
節點k - lowbit(k) 是節點k的最近父節點,且節點k在它的右子樹下。
節點k,統計的葉子范圍為:(k - lowbit(k), k]。
節點k的左孩子是:k - lowbit(k) / 2
下面分析樹狀數組兩面主要應用:
1 更新數據x,進行區間查詢。
2 更新區間,查詢某個數。
由於,樹狀數組只統計了左子樹的信息,因而只能查詢更新區間[1, x]。只在在滿足[x,y]的信息可以由[1,x-1]和[1,y]的信息推導出時,才能進行區間[x,y]的查詢更新。這也是樹狀數組不能用於任意區間求最值的根本原因。
先定義兩個集合:
up_right(k) : 節點k所有的父節點,且節點k在它們的左子樹下。
up_left(k) : 節點k所有的父節點,且節點k在它們的右子樹下。
1 更新數據x,查詢區間[1,y]。
顯然,更新葉子x,要找出葉子x在哪些節點的左子樹下。因而節點k、所有的up_right(k)
都要更新。
查詢[1, y],實際上就是把該區間拆分成一系列小區間,並找出統計這些區間的節點。可以通過找出y在哪些節點的右子樹下,這些節點恰好不重復的統計了區間[1, y-1]。因而要訪問節點y、所有的up_left(y)。
2 更新區間[1,y],查詢數據x
這和前面的操作恰好相反。與前面的最大不同之處在於:節點保存的不再是其葉子總個數這些信息,而是該區間的所有葉子都改變了多少。也就是說:每個葉子的信息,分散到了所有對它統計的節點上。因此操作和前面相似:
更新[1,y]時,更新節點y、所有up_left(y)。
查詢x時, 訪問x、所有up_right(x)。
前面的樹狀數組,只對左子樹信息進行統計,如果從後往前讀數據初始化樹狀數組,則變成只對右子樹信息進行統計,這時更新和查詢操作,剛好和前面的相反。
一般情況下,樹狀數組比點樹省空間,對區間[1, M]只要M+1空間,查詢更新時定位節點比較快,定位父節點和左右孩子相對麻煩點(不過,一般也不用到。從上往下查找,可參考下面代碼中的erease_nth函數(刪除第n小的數))。
下面是使用樹狀數組的實現代碼(求逆序數和模擬約瑟夫環問題):
樹狀數組
//www.cnblogs.com/flyinghearts
#include<cstdio>
#include<cstring>
#include<cassert>
template<int N> struct Round2k
{ enum { down = Round2k<N / 2u>::down * 2}; };
template<> struct Round2k<1> { enum { down = 1}; };
template <int Total, typename T = int> //區間[1, Total]
class BIT {
enum { Min2k = Round2k<Total>::down};
T info[Total + 1];
T sz; //可以用info[0]儲存總大小
public:
BIT() { clear(); }
void clear() { memset(this, 0, sizeof(*this));}
int size() { return sz; }
int lowbit(int idx) { return idx & -idx;}
//尋找最近的父節點,left_up/right_up 分別使得idx在其右/左子樹下
void left_up(int& idx) { idx -= lowbit(idx); }
void right_up(int& idx) { idx += lowbit(idx); }
void update(int idx ,const int val = 1) { //葉子idx 改變val個
assert(idx > 0);
sz += val;
for (; idx <= Total; right_up(idx)) info[idx] += val;
}
void init(int arr[], int n) { // arr[i]為葉子i+1的個數
assert(n <= Total);
sz = n;
// for (int i = 0; i < n; ) {
// info[i + 1] = arr[i];
// if (++i >= n) break;
// info[i + 1] = arr[i];
// ++i;
// for (int j = 1; j < lowbit(i); j *= 2u) info[i] += info[i - j];
// }
for (int i = 0; i < n; ) {
info[i + 1] = arr[i];
if (++i >= n) break;
int sum = arr[i];
int pr = ++i;
left_up(pr);
for (int j = i - 1; j > pr; left_up(j)) sum += info[j];
info[i] = sum;
}
}
int count(int idx) { //[1,idx] - [1, idx-1]
assert(idx > 0);
int sum = info[idx];
// int pr = idx; //int pr = idx - lowbit(idx);
// left_up(pr);
// for (--idx; idx > pr; left_up(idx)) sum -= info[idx]; //
// return sum;
for (int j = 1; j < lowbit(idx); j *= 2u) sum -= info[idx - j];
return sum;
}
int lteq(int idx) { //小等於
assert(idx >= 1 && idx <= Total);
int sum = 0;
for (; idx > 0; left_up(idx)) sum += info[idx];
return sum;
}
int gt(int idx) { return sz - lteq(idx); } //大於
int operator[](int n) { return erase_nth(n, 0); } //第n小
int erase_nth(int n, const bool erase_flag = true) //刪除第n小的數
{
assert(n >=1 && n <= sz);
sz -= erase_flag;
int idx = Min2k; //從上往下搜索,先定位根節點
for (int k = idx / 2u; k > 0; k /= 2u) {
int t = info[idx];
if (n <= info[idx]) { info[idx] -= erase_flag; idx -= k;} //進入左子樹
else {
n -= t;
if (Total != Min2k && Total != Min2k - 1) //若不是完全二叉樹
while (idx + k > Total)