天天看點

《CUDA C程式設計權威指南》——2.6節習題

本節書摘來自華章社群《cuda c程式設計權威指南》一書中的第2章,第2.6節習題,作者[美] 馬克斯·格羅斯曼(max grossman) ,更多章節内容可以通路雲栖社群“華章社群”公衆号檢視

2.6 習題

1.在檔案sumarraysongpu-timer.cu中,設定block.x=1 023,重新編譯并運作。與執行配置為block.x=1 024的運作結果進行比較,試着解釋其差別和原因。

2.參考檔案sumarraysongpu-timer.cu,設定block.x=256。建立一個核心,使得每個線程處理兩個元素。将此結果和其他的執行配置進行比較。

3.參考檔案summatrixongpu-2d-grid-2d-block.cu,并将它用于整數矩陣的加法運算中,擷取最佳的執行配置。

4.參考檔案summatrixongpu-2d-grid-1d-block.cu,建立一個核心,使得每個線程處理兩個元素,擷取最佳的執行配置。

5.借助程式checkdeviceinfor.cu,找到你的系統所支援的網格和塊的最大尺寸。

繼續閱讀