天天看点

《CUDA C编程权威指南》——3.5节展开循环

本节书摘来自华章社区《cuda c编程权威指南》一书中的第3章,第3.5节展开循环,作者[美] 马克斯·格罗斯曼(max grossman) ,更多章节内容可以访问云栖社区“华章社区”公众号查看

3.5 展开循环

循环展开是一个尝试通过减少分支出现的频率和循环维护指令来优化循环的技术。在循环展开中,循环主体在代码中要多次被编写,而不是只编写一次循环主体再使用另一个循环来反复执行的。任何的封闭循环可将它的迭代次数减少或完全删除。循环体的复制数量被称为循环展开因子,迭代次数就变为了原始循环迭代次数除以循环展开因子。在顺序数组中,当循环的迭代次数在循环执行之前就已经知道时,循环展开是最有效提升性能的方法。

继续阅读