本節書摘來自華章計算機《cuda c程式設計權威指南》一書中的第2章,第2.6節,作者 [美] 馬克斯·格羅斯曼(max grossman),譯 顔成鋼 殷建 李亮,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。
1.在檔案sumarraysongpu-timer.cu中,設定block.x=1 023,重新編譯并運作。與執行配置為block.x=1 024的運作結果進行比較,試着解釋其差別和原因。
2.參考檔案sumarraysongpu-timer.cu,設定block.x=256。建立一個核心,使得每個線程處理兩個元素。将此結果和其他的執行配置進行比較。
3.參考檔案summatrixongpu-2d-grid-2d-block.cu,并将它用于整數矩陣的加法運算中,擷取最佳的執行配置。
4.參考檔案summatrixongpu-2d-grid-1d-block.cu,建立一個核心,使得每個線程處理兩個元素,擷取最佳的執行配置。
5.借助程式checkdeviceinfor.cu,找到你的系統所支援的網格和塊的最大尺寸。