![](https://img.laitimes.com/img/__Qf2AjLwojIjJCLyojI0JCLicmbw5yN5IjMlFGMjZDOjZ2Y3YTOjFWZ0MTNykDZ5ETZhJzMm9CX5d2bs92Yl1iclB3bsVmdlR2LcNWaw9CXt92Yu4GZjlGbh5yYjV3Lc9CX6MHc0RHaiojIsJye.png)
實際的運算為C^T=alpha*B^T*A^T+beta*C^T
由于C^T的存儲也是按列的,是以計算結果取出來剛好等于 C,可以省去轉置的步驟。
注:
maxtrix_size.uiWB 表示,B^T 的行數、C^T的行數
maxtrix_size.uiHA 表示,A^T 的列數
maxtrix_size.uiWA 表示,B^T 的列數、A^T的行數
相關函數和參數說明:
cublasHandle_t 的申請和釋放
申請:使用cublasCreate((cublasHandle_t *handle));
釋放:使用cublasDestroy_v2 (cublasHandle_t handle);
cublasOperation_t 可能的取值:
CUBLAS_OP_N:不轉置(但是由于按列存儲,其實傳進去的矩陣還是被轉置了)
CUBLAS_OP_T:轉置
CUBLAS_OP_C:共轭轉置操作
進一步的了解 戳我