給gpu一個10000大小的數組指派,
為了測量時間,要重複計算若幹次。
備選方案:
1 先用cpu指派,再拷貝過去
2 直接用cudamemcpy逐個拷貝元素
3 啟動核函數,多線程指派
1和2的對比:
規模比較小的時候,2比較快,
規模變大的時候,1比較快。
是以如果是對一個值指派,還是用cudamemcpy比較好。
1和3的對比:
明顯是3快,至于快多少,看資料。
100000次,10000大小數組的指派。
1:main time to generate: 9410.0 ms
3:main time to generate: 20.0 ms