做某个项目,会将开发提供的一堆gerrit change同步下来后,自动编译。
但一组gerrit change可能由于dependon的问题,合理同步顺序不一定是开发的提交顺序。比如,存在提交 1 和提交 2,提交1依赖于提交2,那么,合理的下载顺序是,先下载提交2,再下载提交1。
那如果开发需要编译的提交有十几个,怎么计算?
一开始的想法,这就是一个有向图,每个提交就是一个节点,而提交之前的依赖关系就是连接。当然,有可能这几个提交互相都没有关系,那就可以虚拟一个root。然后通过深度优先遍历得到正确的顺序。
感觉以上想法,代码量有点多,同时,需求上其实并不在意同级的提交谁先谁后,只在意dependon的提交先被同步,于是,通过类似动态规划的想法,设计出如下算法:
思路:对于一组开发的提交,可以分成两组,一组a是可以认为是不安全的,另一组b认为是安全的,即同步的顺序是确定。只要不断地确定b的集合,就能得出相应的队列。
举例:开发有提交1,2, 3, 4
其中,1依赖于2和3,2依赖于4, 3依赖于4, 4不依赖任何提交
1. 初始集合 seta = {1,2,3,4}
2. 得出初始数组的依赖集合 setb = {2,3,4}
3. seta – setb,得出 {1},入列表[1]
4. seta & setb = {2,3,4},将其设为新的seta
5. 得到新的setb = {4}
6. seta – setb,得出 {2,3},入列表得到[2,3,1] (注,新的需要放在头上,当然,放成[3,2,1]也可以,因为认为2与3是等价的)
7. seta & setb = {4},将其设为新的seta
8. setb为空
9. seta – setb,得出 {4},入列表得到[4,2,3,1]
由于setb为空,跳出循环
实际使用中,这个算法能处理循环依赖问题,也就是如果存在seta为空的时候,就说明出现了循环依赖。同时,也能处理依赖的提交并不在用户提交的提交列表的情况,如,提交4依赖于提交5。由于采用了集合的运算,能很快将这些噪音过滤掉。
附上python代码,其中self.getdependsonarray(list(setgerrit))是获取提交的依赖提交集合,另,一开始设计的时候,想用stack来处理得到的safe提交,实现的时候,觉得用list比较方便,就用list来处理了。
代码是以前写的,存在大量对pep8规范的违反,请主动忽略