一看就懂的主席树（不带修），逐句代码分析

xiaoxiao2023-11-03 185

俗话说，一切高深莫测的算法都是乱搞搞出来的主席树，顾名思义，就是在线段树上乱搞。主席树是用来解决区间问题的，比如说区间第k小···

先举一个用线段树来做的栗子：

题意：给定一个长度为n的序列，输入每一个数 a[i] 后都有一个询问，询问从第一位到第 i 位第 ki 小的数；样例： 5 3 1 2 2 1 2 4 4 2 3

这里讲讲线段树的做法。

首先，先对数据进行离散化操作我们要建一个空树，其中存储着每一区间中的数出现的次数。就像这样：

在输入每一个数的时候，我们要把这个数插到树中。即所对应区间出现次数+1；这里给出在输入第五个数之后的树，就是这个样子的：

（以第五个数据为例）现在开始查找第3小的数，我们从根节点开始查找，如果左儿子的值大于等于k，我们就往左搜，因为第k小的数肯定在左儿子对应的区间里，如果左儿子的值要小于k，我们就往右搜，因为第k小的数肯定不在左儿子对应的区间里。以此类推，直到找到第k小的数为止。

接下来我们开始真正的主席树了——

题意：给定一个长度为n的序列，有q次询问，询问从第 l 位到第 r 位第 k 小的数；样例： 5 5 3 2 1 4 2 2 2 1 3 4 1 4 5 1 1 2 2 4 4 1 分析：这里与上个问题不同的是引入了区间这一问题，这就使得线段树无法解决问题了。

该怎么办呢？可以在线段树上乱搞啊！这便是接下来要讲的主席树做法。

让我们来梳理一下思路我们先建一棵跟空树没什么区别的树，这棵树跟上面问题的空树是一样的，存储着每一区间中的数出现的次数。还是这样：建树代码如下（很简单的）

int build(int l,int r)//其实只是建一个空树 { int now=++cnt; if(l<r) { int mid=(l+r)>>1; p[now].l=build(l,mid); p[now].r=build(mid+1,r); } return now; }

我们进行的是离线操作首先，排序+去重，通过unique来快速实现。某大佬的unique详解，不懂戳这然后再插入序列中每一个数时，通过lower_bound来找到这个数应该在的位置某巨佬的lower_bound详解，不懂戳这这两步的目的是离散化，方便建树。离散化代码：

n=read(),q=read(); for(int i=1;i<=n;i++)a[i]=read(),b[i]=a[i]; sort(b+1,b+1+n); m=unique(b+1,b+1+n)-b-1;//去重 build(1,m);//建空树 for(int i=1;i<=n;i++) { int num=lower_bound(b+1,b+1+m,a[i])-b;//说白了就是按照大小顺序给该点编个号 build_new(i,num);//改链，下面马上讲 }

插入一个数后，该数对应区间的值都+1，从图上来看，这个位置影响了一条链；所以我们应该把整条链给改了，但在改链的同时要保留前面的旧树，因为这是主席树操作的需要。改链就像这样，我们以样例第一个数来说

在这里我们建立了三个新点：10号、11号和12号，要注意图中虽然把1、2、5划掉了，但程序中并不是删掉，也没有改值。新建成的点将拥有插入第一个数之后的值。

改链后形成了一棵新的树。

不过这棵新的树和旧树共用一部分节点。把这些节点放在一起看根本不是一棵树，因为这就是一堆树组合起来的了。这些树在空间上是相连的，但在关系上是独立的。我们很容易就可以发现，每一个根节点都可以在一定程度上代表一棵树，因为从每一个根节点向下遍历，得到的都是在插入该根节点后得到的新树（这个地方可以画图理解一下）。在更改一条链的过程中，首先建一个新点，作为新树的根节点；知道要插入的数的值了，就看他影响左儿子还是在右儿子。如果影响右儿子（即该点数值在右儿子对应的区间里），就建立一个新点，作为新树上一节点的右儿子，然后把父节点和影响不到的左儿子连接起来，我们就不用管这个点左边的东西了；如果影响左儿子，一样，建一个新点表示左儿子，连右边的节点；然后我们再用sum数组记录一下每个节点所对应区间已经插入的数的个数，即该点的值；这样就建立了n棵互不相同但是空间相似度很大的树；我们用tree数组来记录每一棵树的根节点，在某种程度上可以代表一棵树，因为从每一个根节点递归遍历下来都可以得到一棵树，这棵树就是在插入该树根节点后得到的新树；

代码如下：

//cnt：要插入的节点的编号 //tree[i]：第i个“线段树”根节点编号、 //p[i]: i号点的左右儿子 //sum[i]: i号点的值，即i号点对应区间中数的个数 void change(int l,int r,int now,int past,int num) void build_new(int mark,int num) { //mark：当前建树的编号 //num：该插入的数的值 tree[mark]=++cnt; sum[cnt]=sum[tree[mark-1]]+1; change(1,m,cnt,tree[mark-1],num); } void change(int l,int r,int now,int past,int num) { //l，r：左右区间 //now:新树当前节点编号 //past：上一棵树的当前节点编号, if(!p[past].l&&!p[past].r)return; int mid=(l+r)>>1; if(num>mid) //这个点属于右边，就改右边，左边不动顺着past下来就不用管左边了 { p[now].l=p[past].l; //直接连上原树的左儿子作为新树的左儿子 p[now].r=++cnt;//开新点，作为上一新点的右儿子 sum[p[now].r]=sum[p[past].r]+1; //别忘了点权+1 （当然是要加到新点上啦） change(mid+1,r,p[now].r,p[past].r,num); } else{//左边，一样道理 p[now].r=p[past].r; p[now].l=++cnt; sum[p[now].l]=sum[p[past].l]+1; change(l,mid,p[now].l,p[past].l,num); } }

改链完成后，就可以查询了假如说我们要查[3,5]（输入顺序）范围内的第k小类比于线段树查总区间第k小的方法，我们要把[3,5]区间看成一个线段树怎么看呢？总不能硬生生地建树吧这里要用到前缀思想比如说我们要求 [3,5] 中的第k小我们可以用 [1,5] 的每一个节点减去 [1,2] 的每一个节点，得到的就是 [3,5] 区间所对应的线段树的值看图易于理解（左图为 [1,2] ，右图为 [1,5]，编号略去）：两树对位相减，得到的就是 [3,5] 区间所对应的线段树的值；如下：

由此我们可以得出，[3,5] 对应的线段树上每一个节点的值，等于 [1,5] 对应的线段树与 [1,2] 对应的线段树相同位置上的节点值之差。于是我们就可以用 [1,5] 对应的线段树和 [1,2] 对应的线段树来表示 [3,5] 对应的线段树了。参照线段树求第k小值的方法，我们得到以下代码：

int search(int a,int b,int l,int r,int k) { //a，b：区间首尾两树当前节点（一定在不同数的同一个位置） //l，r：查询区间，左or右 if(l==r)return l; int lm=sum[p[b].l]-sum[p[a].l]; //两节点左儿子相减，所得的值就是所查询区间（输入顺序）内的数在对应节点数值区间的个数 int mid=(l+r)>>1; if(k<=lm)return search(p[a].l,p[b].l,l,mid,k); return search(p[a].r,p[b].r,mid+1,r,k-lm); //mid前面有lm个数都给做掉了，所以只需要在 [mid+1,r] 中找出第k-lm小的数就可以了 }

到这里就已经完成所有的关键操作了。

最后给出完整代码，变量名和意义和上面讲的一样

由于线段树要开4倍空间，我们的主席树每次要更改一条链，即log(n)个节点，所以空间复杂度为4n+qlog(n)；一般我们开1<<5倍的空间（32*n）

#include<bits/stdc++.h> using namespace std; int n,q,m,cnt,a[200005],b[200005],x,y,k; int tree[200005],sum[4000005]; struct mp{ int l,r; }p[4000005]; int read() { long long f=0,p=1;char c=getchar(); while(c<'0'||c>'9'){if(c=='-') p=-1;c=getchar();} while(c>='0'&&c<='9'){f=f*10+c-'0';c=getchar();} return p*f; } int build(int l,int r) { int now=++cnt; if(l<r) { int mid=(l+r)>>1; p[now].l=build(l,mid); p[now].r=build(mid+1,r); } return now; } void change(int l,int r,int now,int past,int num) { if(!p[past].l&&!p[past].r)return; int mid=(l+r)>>1; if(num>mid) { p[now].l=p[past].l; p[now].r=++cnt; sum[p[now].r]=sum[p[past].r]+1; change(mid+1,r,p[now].r,p[past].r,num); } else{ p[now].r=p[past].r; p[now].l=++cnt; sum[p[now].l]=sum[p[past].l]+1; change(l,mid,p[now].l,p[past].l,num); } } void build_new(int mark,int num) { tree[mark]=++cnt; sum[cnt]=sum[tree[mark-1]]+1; change(1,m,cnt,tree[mark-1],num); } int search(int a,int b,int l,int r,int k) { if(l==r)return l; int lm=sum[p[b].l]-sum[p[a].l]; int mid=(l+r)>>1; if(k<=lm)return search(p[a].l,p[b].l,l,mid,k); return search(p[a].r,p[b].r,mid+1,r,k-lm); } int main() { n=read(),q=read(); for(int i=1;i<=n;i++)a[i]=read(),b[i]=a[i]; sort(b+1,b+1+n); m=unique(b+1,b+1+n)-b-1; tree[0]=1; build(1,m); for(int i=1;i<=n;i++) { int num=lower_bound(b+1,b+1+m,a[i])-b; build_new(i,num); } for(int i=1;i<=q;i++) { x=read(),y=read(),k=read(); printf("%d\n", b[search(tree[x-1],tree[y],1,m,k)]); } }

完结撒花~

最新回复(0)