雅礼2018年7月集训总结

~~NOI前的垂死挣扎.~~

7-1

考得还不错的样子，但是还有可以完善的地方.

T1

想到了出题人想到的状压dp，然后别人想出来了一个$\mathcal O(n^3)$的dp. 其实我是看到了题目的$n\le 24$就去想状压的，如果数据范围大一点我应该也能想到？

T2

被卡常卡成60分了，主要是因为方点的情况我强行把分治FFT的做法搬过来写出了8倍常数. 事实上比赛的时候我已经注意到了方点相当于是没有度数限制的，而用在圆点上的分治FFT本来就是为了处理度数限制的问题，所以完全没有必要照搬，可以直接用一个线性的dp解决方点的情况.

T3

写完+检查完前两道题的时候已经过去4h了，写暴力又花了一些时间导致我没什么时间想这道题. 当时我已经想出了$\mathcal O(n^3)$的dp做法，其实再注意到一些细节就可以优化到$\mathcal O(n)$，但是剩下的时间连打完我想到的那个dp都很勉强. 说到底还是我思维比较迟缓，并且码力太过底下，前面debug了太长的时间，还是要多做点题.

7-2

区分度极低+极度劝退，rk8后面就是rk29. ~~很荣幸能够挤进前10.~~

T1

挺不错的一道题，链剖的做法也没有那么容易想到，不过想到了的话打起来非常舒服.

T2

没怎么卡过空间，各种会分块会主席树但是MLE……

首先询问区间中有多少种数是经典的难以合并信息的问题，询问一个区间还有分块或者主席树的做法，询问多个区间的话，没什么好的想法，就只能bitset卡一卡了.

用bitset的话第一个问题是想办法做到$\mathcal O(\frac{nm}{w})$而不是$\mathcal O(\frac{nm\log n}{w})$. 直接ST表的话会MLE. 如果可以离线，就能用莫队把每个询问区间的bitset预处理出来. 其实反正已经用了bitset这么暴力的东西了，不妨维护的时候也暴力一点，把整个区间分成$w$个块，预处理出$w^2$个块对之间的bitset，每个询问区间在整块的基础上加上$\mathcal O(\frac{n}{w})$个数. 这样子空间开不下，可以把预处理$w^2$个块对改为用ST表维护各个块，就能把空间卡进去了.

T3

差分之后按位置模$k$分类然后计算交错和什么的都很容易想到，关键是判无解非常麻烦，在左右端点需要特殊处理的情况下判无解更加麻烦，反正我在赛场上没想到优美的方法. 标解是利用hash，给每个模$k$的余数分配一个$[0,2^{64})$之间的随机权值，那么计算询问区间中的$1$的位置的异或和再进行判断就可以了. 要注意求多类位置分别的前缀交错和的和写法比较特殊，要让$f _i$表示让最后一个位置的权值为$+1$时的前缀交错和，这样区间中每类位置均出现偶数次的时候，就能拿两个前缀和做个差得到区间交错和了.

7-3

似乎基本都听过一遍？

7-4

除去std还有11个人ak~~，我是第12名~~. 后来可能还重测了几个丢了程序的人.

T1

我的做法是想象高维空间，一个$n+1$维的基础图形实际上就是由$n$维的在第$n+1$维上平移得到的. 那么平移前后，每一维成分的数量首先是翻了一倍，另外平移前和平移后对应的$j-1$维的成分构成了一个$j$维的成分. 以二维到三维为例，一个正方形向上平移，得到了$8$个点和$8$条边，设平移前正方形为$A$，平移后正方形为$B$，那么$A$和$B$的每对对应点形成一条新的边，每对对应边形成一个新的面. 设$f _{i,j}$为$i$维基础图形中$j$维的个数，即有$f _{i,j}=2f _{i-1,j}+f _{i-1,j-1}$，记$F _i(z)=\sum f _{i,j}z^j$，即有$F _{i+1}(z)=(2+z)F _i(z)$即$F _n(z)=(2+z)^n$，那么$f _{n,m}=2^{n-m}\binom{n}{m}$.

T2

跟以前见过的一道dp题比较像. 考虑从小到大决策每个元素，它的贡献依赖于前面的元素的决策，但是这个不方便表示为状态. 假设当前要加入的元素为$i$,可以把前面的元素分成跟$i$加在一起无贡献和有贡献的两部分，有贡献的部分只需要保存两边的数量就可以了，而无贡献的部分随着$i$的增大只会不断减少，所以我们可以先不决策无贡献的部分，当其中的元素变成有贡献的时候再进行决策，到最后都还是无贡献的那一部分放在哪边都不影响答案，所以最后乘一个$2^\textrm{cnt}$即可.

T3

居然没想出来真是丢人. 我想到了容斥而且会做$k=0$居然还做不出来，可能是因为我总是想着一步把式子推到位，而没有把一些关键的量记为一个符号来简化思考.

显然这道题就是要求极长同色子段恰有$n-k$个的方案数，用指数生成函数很容易算出段数不超过$i$的元次$f _i$. 其实这个时候就可以凑容斥系数了. 考虑一个实际有$i$段的方案，它只对$j\ge i$的$f _j$有贡献，且贡献的系数为$\binom{n-i}{j-i}$. 这是因为有$i$段相当于切了$i-1$刀，还有$n-i$个位置可以切，为了被算进$f _j$里面，还需要切$j-i$刀，所以共$\binom{n-i}{j-i}$种切法. 于是我们可以列出式子

$\sum _{j=i}^nc _j\binom{n-i}{j-i}=[i=n-k]$

化得好看一些

$\sum _{p=0}^{n-i}c _{i+p}\binom{n-i}{p}=[k=n-i]$

右边这个东西如果利用$[n=0]=\sum (-1)^i\binom{n}{i}$来做，反正我不会. 注意到$i\le n-k$（否则不可能有贡献，一般不会去考虑），可以启发我们展开$(z+1-1)^{n-i}$，得到

$[z^k] (z+1-1)^{n-i}=\sum 1^p(-1)^{n-i-k-p}\frac{(n-i)!}{k!p!(n-i-k-p)!}$

于是有

$c _{i+p}=\frac{(-1)^{n-i-k-p}(n-i-p)!}{k!(n-i-k-p)!}$

也就是$c _j=(-1)^{n-k-j}\binom{n-j}{k}$.

如果不想凑系数的话，也可以考虑求一个$g _i$表示恰好有$i$段的方案数. 注意到$f _i=\sum _{j\le i}g _j\binom{n-j}{i-j}$，强行反演其实就相当于上面的凑系数，或者你也可以写成$(n-i)!g _i=(n-i)!f _i-\sum _{j\lt i}(n-j)!g _j\cdot\frac{1}{(i-j)!}$，用多项式求逆的套路让$F(z)=\sum(n-i)!f _iz^i,G(z)=\sum(n-i)!g _iz^i$，就有$G(z)=F(z)-(e^z-1)G(z)$，即$G(z)=F(z)e^{-z}$.

感觉这是一道挺不错的计数题，这里面包含的几个新套路，一个是展开$(z+1-1)^{n-i}$，一个是$\binom{n-i}{j-i}$这个系数，都要记下来.

7-5

T1

题目保证给定的点都在凸包上，所以询问区间中的点一定都在这些点的凸包上，也就是说只需要计算$\sum _{i=0}^{L-1}P _i\times P _{i+1}(P _L=P _0)$，其中$L$为询问区间的长度$P _0,P _1,\ldots,P _{L-1}$为询问区间中的点按照极角排序之后的结果.

那么$\mathcal O(n\sqrt{n}\log n)$的莫队就是显然的了. 想办法继续优化，注意到插入是$\mathcal O(\log n)$的，但删除可以做到$\mathcal O(1)$，可以用删除的撤销来代替插入. 具体来讲，把询问排序的时候，右端点从小到大改为从大到小，设当前询问区间的左端点所在块的左端点为$l _0$，维护$[l _0,n)$的凸包，每次询问的时候移动端点就只需要删除了，询问结束后恢复左端点. 如果左端点所在的块变化了，就恢复右端点，然后把左边的块删掉（此次不用恢复）. 只有插入的莫队思路略有不同，挺好想的就不讲了.

只有插入或者只有删除的莫队算是个以前没见过的技巧吧，要记下来.

T2

可以用各种方法花式AC，稍微记录一下感觉比较有意思的.

这一个是我用的方法，答案保证严格大于$\frac{n}{2}$，所以中位数一定在答案里面，第一次输入把所有的数按照高$16$位分类，那么答案只可能在最中间的三类里面，第二次输入的时候把中间三类的数的低$16$位存在$3$个桶里，然后暴力就可以了.

另外有一个挺有意思的随机化的做法，因为答案超过一般，随机选择$20$个位置，那么有很大概率至少选到了一个在答案里面的数，第二次读入的时候分别钦定这$20$个数在答案里，分别算出答案取最优.

T3

这个题的构造也不知道是怎么想出来的，非构造解法晚点再研究吧.

从$m=2$入手，定义$g _0=g _1=g _2=1,g _n=g _{n-1}+g _{n-2}(n\ge 3)$，那么神仙具有敏锐洞察力的选手就可以观察到如果$g _n=\sum _{i=1}^kg _{a _i}$，这里$a _1\gt a _2\gt\cdots\gt a _k\ge 2$（容易证明一定有这样的一个划分），那么$f(n)=\sum _{i=1}^kg _{a _i-1}$.

为什么是这样呢？首先把题目里面的式子移项，得到$f(n)+f _m(n-1)=n$，又有

$\begin{aligned}n&=\sum _{i=1}^kg _{a _i}\\\\f(n)&=\sum _{i=1}^kg _{a _i-1}\\\\f _2(n)&=\sum _{i=1}^kg _{a _i-2}\end{aligned}$

后面两个式子加起来跟前一个比较，发现如果是$f(n)+f _m(n)=n$，似乎就有$g _n=g _{n-1}+g _{n-2}$了. 但是这里是$n-1$.

注意到$n-1$的分拆里面，前$k-1$个数跟$n$的分拆肯定是一样的，因而前$k-1$项仍满足上式，我们讨论$g _{a _k}$.

$g _{a _k}=1$，此时$n-1$的分拆没有最后一项，因为$1=1+0$，最后一项仍满足上式.
$g _{a _k}>1$，此时相当于$f _2(n-1)$的分拆最后一项变成了$f _2(g _{a _k}-1)$的分拆形式，由题目我们知道它等于$g _{a _k}-f(g _{a _k})=g _{a _k}-g _{a _k-1}=g _{a _k-2}$，即最后一项仍满足上式.

规定$g _0=1$而不是$g _0=0$是因为要考虑$f(1)$.

对于一般的情况，定义$g _0=g _1=\cdots=g _m=1,g _n=g _{n-1}+g _{n-m}(n\gt m)$即可.

其实这个时候你会发现如果那一项是$f _m(n)$的话反而可能会出一些问题.

7-7

网络流题好像有一个比较常见的思路是，当每个东西有多个决策的时候，先全部假定一下，然后再用网络流去调整.

7-8

挂了挂了……

T1

最小树形图的朱刘算法.

也不知道出题人是怎么想的……

T2

我的做法似乎比std更nb一些？反正std4k跑5s，我的代码2.4k跑0.5s.

定义每个软件包开始安装的时间为$S _i$，实际安装花费的时间为$a _i$，最后答案为$T$. 那么首先有$\forall(i,j)\in E,S _j-S _i\ge a _i$. 总花费不超过$w$，可以表示成$\sum c _i(t _i-a _i)\le w$. 由题显然有$0\le a _i\le t _i$. 最后答案其实相当于是对$S _i+a _i$取$\max$，可以加入$n$个约束$T\ge S _i+a _i$，然后就是要在满足上面所有这些约束的前提下最小化$T$，直接上单纯形就可以了.

考试的时候我想到了基本相同的思路，但是没有往线性规划的方向去想，强行建了一个点数极多的图，还不知道哪里写错了一点东西，最后没拿到分. 其实网络流和线性规划很多地方是有联系的，以后想网络流建图类的问题时，不妨结合线性规划一起想，毕竟有的时候网络流更简单一些，有的时候线性规划更简单一些.

出题人列出的线性规划式子要考虑每一条路径，所以约束个数可能达到指数级，要先对偶再转化成网络流来做. 我列出的式子和出题人不太一样，只有$\mathcal O(n)$个变量，$O(n+m)$个约束，直接跑单纯形就非常快了.

不过现在还遗留了一个小问题，无论是我的做法还是出题人的做法，似乎都不能保证减少之后的安装时间是整数. 我想了一想，觉得好像可以证明至多只有一个$a _i$不是整数，所以最后只需要把答案向上取整就可以了，当然有单纯形的话需要考虑一下精度问题，先减去一个eps再向上取整. 出题人的做法要二分答案，所以只需要把二分的精度限制在整数就可以了.

T3

毒瘤！

7-9

今天的题目是上交的，长得根本不像NOI模拟赛……

题目比较水，而我第二题被卡常卡掉了52分，最后只能排rk29.

T1

水题.

不过倒是学到了一个东西：线性预处理$1,2,\ldots,n$逆元的(MOD-MOD/i)*inv[MOD%i]的做法虽然看上去很炫酷，但是里面用了除法，实际上常数很大，需要卡常的时候得注意一下.

T2

第一反应是世界树那道题，我以前因为太难码放弃了，这回在考场上硬生生码了200+行代码写了出来，可是A掉了bzoj的世界树那题，模拟赛里面的这道题却被卡常卡成48分了.

事实上这道题是世界树那道题的简化版，有一个常数应该更小的做法. 这道题目只需要询问$a _1$占领了哪些点，所以可以对每个$j\in[2,k]$，求出$a _1$与$a _j$的中点$m _j$，那么$m _j$靠$a _j$的那一边肯定不会被$a _1$占领，这对应着树上的一棵子树或除了一棵子树以外的其它部分，而对每个$a _j$去掉那些部分之后，剩下的就是$a _1$可以占领的点了. 这样只需要用一棵线段树在dfs序上做区间修改，应该比虚树的做法好写很多.

T3

题目：为了锻炼你的水平，建议使用在线算法.

我：我没有水平，我离线！

于是我就写了一个按时间分治水了过去. ~~其实码力低下的我还是因为一个弱智的bug耽搁了很久.~~

考虑在线算法，如果只在一段加和删，那显然可以直接做背包，删除可以看做是插入的撤销，直接再插入的时候做一个之前时刻的备份就可以了. 如果在两端加和删，可以在两端分别用一个背包来维护，每次查询相当于是要把两个背包合并起来，直接合并是$\mathcal O(\text{MOD}^2)$的，但是因为只需要合并两个背包而不是多个，也只需要求合并后一段区间里面的最值，而不是背包的完整信息，可以枚举其中一个背包中的值，然后在另一个背包里做区间查询，复杂度降到$\mathcal O(\text{MOD}\log\text{MOD})$.

加入删除之后会出现一个问题，就是一边背包被删空了会开始删另一个背包的另一端. 一个显然的思路是暴力把另一个背包栈的开口反向，但这样的话如果左边删一个右边删一个循环的话复杂度就不对了. 解决方法也很简单，这种时候把另一个背包的一半元素分离出来，反向，另一半保持不变，均摊分析一下会发现复杂度是$\mathcal O(\text{MOD}\log m)$的.

最后，这个在线算法的复杂度为$\mathcal O(m\text{MOD}(\log\text{MOD}+\log m))$.

7-10

本来应该200分rk3的……一定要吸取教训. 我T2打了一个$\mathcal O(m\sqrt{L}\log L)$的做法，本来可以拿90分，但是数组开得比较大MLE了，但事实上是跑不满的，这也就导致用任务管理器之类的东西看内存消耗看的也远小于开的数组的大小. 可是很多评测软件看的是你开了多少而不是用了多少，所以以后还是尽量要手算空间，如果觉得跑不满又开不下，还是用vector或者别的一些方法动态开空间吧. 这个一定要记住，今天这种情况真的非常可惜.

T2

这种题对于$\gt\sqrt{L}$的情况要善于勇敢地暴力，做这道题的时候我考虑$\gt\sqrt{L}$的情况考虑了很久，最后发现单独处理这些串的时候，每个串就算是暴力枚举前缀，暴力与前面的比对，复杂度都是对的.

还是写一下做法吧怕自己忘了. 记$L=\sum|s _i|$，对于每个询问考虑$|S|\le\sqrt{L}$和$|S|\gt\sqrt{L}$两种情况.

对于第一种情况，各种套路想一遍发现按右端点排序来做的套路比较靠谱，设$f _{i,j}$代表以$i$为右端点，要使得存在长度为$j$的前缀有贡献，左端点最右的位置，这个可以根据$f _{i-1,j}$和$i$这个串长度为$j$的前缀的贡献来计算. 要计算后者，可以把所有串长度不超过$\sqrt{L}$的前缀取出来，记录一个$\text{pos} _s$表示以$s$为前缀的串的位置列表，然后在上面查就可以了. 事实上因为$f$可以存下来，这一步不需要离线.

对于第二种情况，有贡献的串至多$\sqrt{L}$个，把询问按照包含这些串的区间分类，离线下来，记第$i$个询问包含这些串的区间是$[u _i,v _i]$. 以$u$为第一关键字，$v$为第二关键字排序，这样固定$u$之后$v$增大就相当于在后面暴力加串. 加串的话，可以暴力枚举前缀，然后暴力扫一遍前面的串来统计这个前缀的出现次数，判断它有没有贡献（要事先预处理长度$\gt\sqrt{L}$的串两两之间的lcp，这个也可以暴力预处理）. 这样加串的总复杂度不超过$\sum\sqrt{L}|S|=L\sqrt{L}$，同样暴力预处理lcp的复杂度也不超过这个.

按照以上的方法就可以求出有贡献的长度的集合，要统计答案，支持加一个长度和删一个长度，随便用个数据结构就可以维护了.

但这样是$\mathcal O(m\sqrt{L}\log L)$的，跑最后一个点很悬. 如果要继续优化的话，注意到只有插入会带$\log$，删除不会，使用熟悉的套路，把插入看成删除的撤销即可. 具体来讲，$\le\sqrt{L}$的部分全程删除和全程插入是一样的，因为原来算法是把有贡献的插入，改成一开始全部插入好，利用$f$数组找出没贡献的删掉就行了，最后再恢复成删掉之前的样子来处理下一个询问. 至于$\gt\sqrt{L}$的部分，改成$u$从小到大，$v$从大到小，就变成全程都是删除了.

再讲讲我不优化算法是怎么卡常卡进去的. 首先维护的数据结构不要用set或者线段树这么大常数的东西，用zkw，顺手把删除写成$\mathcal O(1)$的，再加个读入优化，这个时候已经从12s优化到4.9s了，放到lemon上面跑的时候因为玄学原因变快了一些就过了.

T3

先坑着.

7-12

居然rk1了？

T1

先坑着.

T2

首先一个很显然的思路是链上修改单点查询转化为单点修改子树查询，然后就可以做树上的启发式合并，来得到每个点对应的trie了. 事实上trie的合并可以像线段树合并那样做，就可以少一个$\log$. 求期望的路径长度的话，每个点记一个$f _i$表示从$i$出发的期望步数，它的转移跟父亲有关，有一个经典的技巧是把$f _i$表示成$a _i+b _if _{\text{fa} _i}$的形式，这样就可以不用高斯消元，第一遍dfs先把$a,b$求出来，第二遍dfs把$f$求出来. 不过此题要算的是所有$f$的和，而且还要动态维护，所以再记一个$s _i$表示以$i$为根的子树的$f$的和，发现$s _i$也可以表示为$c _i+d _if _{\text{fa} _i}$的形式. $a,b,c,d$都可以很方便地在trie上动态维护，这样就能快速地求出答案了.

评测的时候最后两个点好像爆栈了？但是noi应该会开无限栈的吧.

T3

一开始的时候觉得多项式开根常数太大了，就写了个分治来求$f$，结果$b _i\le 10^5$的点跑了6.7s. 麦老大说开根常数再大也不会比$\mathcal O(n\log^2n)$的分治慢. 膜拜10min打完多项式板子的dalao……

假设我们已经把$f _i$求出来了，考虑一个简单一点的问题，已经知道$x,x^2,x^3,\ldots,x^n$，怎么求出$x^{n+1}$. 这个显然用脚都能求出来. 但是现在它是一堆东西加起来，所以应该使用线性的方法，换句话说可以考虑把$x^{n+1}$表示成$x,x^2,x^3,\ldots,x^n$的线性组合. 回忆一下在哪里干过类似的事，可以联想到求常系数线性递推的时候，把$M^n$表示成$I,M,M^2,\ldots,M^{n-1}$的线性组合. 当时是利用了$M$的化零多项式，容易想到现在也要构造一个多项式$p(t)$使得$f _{b _1},f _{b _2},\ldots,f _{b _n}$是它的根，显然$p(t)=\prod(t-f _{b _i})$，这个用分治fft来求就可以了.

下面考虑一下如何更高效地求出$f _i$. 我们知道$f _i$的生成函数$F(z)=\frac{1-\sqrt{1-4z^2-16z^3-16z^4}}{2z(1+2z)}$，这是一个多项式开根的经典题目，但是这里它有一个特殊性质，就是这些式子的次数都很低，不妨把它写成$\frac{A(z)-\sqrt{C(z)}}{B(z)}$的形式，先考虑怎么算$D(z)/B(z)=X(z)$，移项得到$B(z)X(z)=D(z)$，代入$B(z)=2z(1+2z)$，比较$z^n$的系数，得到$d _n=2x _{n-1}+4x _{n-2}$，即$x _n=\frac{d _{n+1}-4x _{n-1}}{2}$，这样就可以线性递推了. 接下来考虑怎么计算$\sqrt{C(z)}=Y(z)$，求导得到$Y^\prime(z)=\frac{C^\prime(z)Y(z)}{2C(z)}$，即$2C(z)Y^\prime(z)=C^\prime(z)Y(z)$. 代入再比较$z^n$的系数，得到$2((n+1)h _{n+1}-4(n-1)h _{n-1}-16(n-2)h _{n-2}-16(n-3)h _{n-3})=-8h _{n-1}-48h _{n-2}-64h _{n-3}$，把下标平移一下再化简，得到$nh _n=(4n-12)h _{n-2}+(16n-72)h _{n-3}+(16n-96)h _{n-4}$. 这样就可以线性递推了.

感觉有的时候求个导可以得到一些奇奇怪怪的但是有用的东西.