天天看點

gpu數組指派各種方法性能測試

給gpu一個10000大小的數組指派,

為了測量時間,要重複計算若幹次。

備選方案:

1 先用cpu指派,再拷貝過去

2 直接用cudamemcpy逐個拷貝元素

3 啟動核函數,多線程指派

1和2的對比:

規模比較小的時候,2比較快,

規模變大的時候,1比較快。

是以如果是對一個值指派,還是用cudamemcpy比較好。

1和3的對比:

明顯是3快,至于快多少,看資料。

100000次,10000大小數組的指派。

1:main time to generate:  9410.0 ms

3:main time to generate:  20.0 ms

繼續閱讀