天天看點

CPU多線程處理,一種隐藏傳輸時間方法

在使用cuda進行程式設計時,遇到提速時間達不到效果時往往會用cuda自帶的visual profiler進行算法運作時間的分析;

在分析時,總會遇到資料流從向顯存傳輸時的時間在算法中多于實際你的算法處理你要解決問題的算法的時間。

如你在傳輸時花70%的時間,而你處理你的問題時隻花30%的時間,這時再提升你算法處理的問題時的速度主要集中在怎麼減少傳輸時所用的時間或者怎麼隐藏傳輸時所用的時間。

在網上找了兩種方法:

1是在gpu上進行多流處理。

2是在cpu上多線程進行異步處理。

持續更新

繼續閱讀