批量同步Gerrit Change的先后逻辑算法

2021-11-06 04:16:23

做某个项目，会将开发提供的一堆gerrit change同步下来后，自动编译。

但一组gerrit change可能由于dependon的问题，合理同步顺序不一定是开发的提交顺序。比如，存在提交 1 和提交 2，提交1依赖于提交2，那么，合理的下载顺序是，先下载提交2，再下载提交1。

那如果开发需要编译的提交有十几个，怎么计算？

一开始的想法，这就是一个有向图，每个提交就是一个节点，而提交之前的依赖关系就是连接。当然，有可能这几个提交互相都没有关系，那就可以虚拟一个root。然后通过深度优先遍历得到正确的顺序。

感觉以上想法，代码量有点多，同时，需求上其实并不在意同级的提交谁先谁后，只在意dependon的提交先被同步，于是，通过类似动态规划的想法，设计出如下算法：

思路：对于一组开发的提交，可以分成两组，一组a是可以认为是不安全的，另一组b认为是安全的，即同步的顺序是确定。只要不断地确定b的集合，就能得出相应的队列。

举例：开发有提交1，2， 3， 4

其中，1依赖于2和3，2依赖于4， 3依赖于4， 4不依赖任何提交

1．初始集合 seta = {1,2,3,4}

2．得出初始数组的依赖集合 setb = {2,3,4}

3． seta – setb，得出 {1}，入列表[1]

4． seta & setb = {2,3,4}，将其设为新的seta

5．得到新的setb = {4}

6． seta – setb，得出 {2,3}，入列表得到[2,3,1] （注，新的需要放在头上，当然，放成[3,2,1]也可以，因为认为2与3是等价的）

7． seta & setb = {4}，将其设为新的seta

8． setb为空

9． seta – setb，得出 {4}，入列表得到[4,2,3,1]

由于setb为空，跳出循环

实际使用中，这个算法能处理循环依赖问题，也就是如果存在seta为空的时候，就说明出现了循环依赖。同时，也能处理依赖的提交并不在用户提交的提交列表的情况，如，提交4依赖于提交5。由于采用了集合的运算，能很快将这些噪音过滤掉。

附上python代码，其中self.getdependsonarray(list(setgerrit))是获取提交的依赖提交集合，另，一开始设计的时候，想用stack来处理得到的safe提交，实现的时候，觉得用list比较方便，就用list来处理了。

代码是以前写的，存在大量对pep8规范的违反，请主动忽略

继续阅读