軟體優化的原理與實踐系列之一向量化計算

2018-09-19 23:50:00

向量化計算

軟體優化的原理與實踐系列之一

前言

用過MATLAB仿真語言的同學，都有這樣的經驗。要盡量多用向量化運算，而不要自己手寫循環語句，否則代碼的執行效率會相當低下。如果你熟悉python，涉及到數值計算的時候，也要盡量的調用成熟的數值計算的庫，比如numpy，而不是自己用循環去實作。一個衆所周知的理由是，别人成熟的庫已經經過了高度的優化，我們沒有必要重複造輪子。

事實上，還有另外一個根本性的原因是，向量化計算，就即使沒有經過任何優化的代碼，也會比非向量化運算要快。本篇博文将試圖解釋其根本性原因。

背景

現代計算機大都采用了分層的存儲器結構：寄存器，cache，主存，磁盤。CPU的計算單元直接和寄存器交換資訊，計算時需要把資料逐級傳遞到寄存器，計算得到的結果也要将結果逐級放回存儲器。基于這種存儲體系結構，程式員在編制軟體的時候，要盡量的減少和cache，主存，磁盤這些存儲器交換資料。我們把整個軟體的執行實行劃分為兩部分，CPU真正執行運算的時間和寄存器與存儲器交換資料的時間，即：

常見線性代數運算操作的q值

小結

把計算流程用向量，矩陣的數學語言重新描述，在此基礎上實施的計算，總是比标量計算的效率高，即使代碼沒有經過任何優化。

軟體優化的原理與實踐系列之一向量化計算

前言

背景

小結

繼續閱讀

查找算法學習之二分查找（Python版本）——BinarySearch

Java經典面試題詳解：帶你手撸紅黑樹總結

CQ V1.0分詞bates(基于雙數組tire樹)—應該是目前最快的中文分詞算法

Command Network(POJ 3164)---定根最小樹形圖模闆題題目描述輸入格式輸出格式輸入樣例輸出樣例分析源程式

開源低帶寬語音編解碼器

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

C++ 第十五周報告1--《冒泡法排序》

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

面試題解析：你接口測試是怎麼做的？

hdu7108哈希