C++數組特殊矩陣壓縮存儲

http://blog.csdn.net/lin_bei/article/details/1231836

矩陣:

矩陣是數值程式設計中經常用到的數學模型，它是由 m 行和 n 列的數值構成（m=n 時稱為方陣）。在用進階語言編制的程式中，通常用二維數組表示矩陣，它使矩陣中的每個元素都可在二維數組中找到相對應的存儲位置。然而在數值分析的計算中經常出現一些有下列特性的高階矩陣，即矩陣中有很多值相同的元或零值元，為了節省存儲空間，需要對它們進行"壓縮存儲"，即不存或少存這些值相同的元或零值元。操作：可以對矩陣作加、減、乘等運算。存儲壓縮目标：節約存儲空間壓縮的方法：零元不存儲多個值相同的隻存一個壓縮存儲的對象：稀疏矩陣特殊矩陣特殊矩陣：值相同元素或者零元素分布有一定規律的矩陣稱為特殊矩陣例:對稱矩陣、上（下）三角矩陣都是特殊矩陣

C++數組特殊矩陣壓縮存儲

特殊矩陣壓縮存儲(以對稱矩陣為例) 對稱矩陣是滿足下面條件的n 階矩陣: aij= aji 1<= i,j<= n

C++數組特殊矩陣壓縮存儲

k= 0 1 2 3 4 5 6 n(n+1)/2-1 對稱矩陣元素可以隻存儲下三角部分，共需 n(n+1)/2 個單元的空間( 三角矩陣的存儲方式類似）以一維數組sa[0..n(n+1)/2-1]作為n 階對稱矩陣A的存儲結構A中任意一進制素 aij與它的存儲位置 sa[k] 之間關系：

C++數組特殊矩陣壓縮存儲

k= 0 1 2 3 4 5 6 n(n+1)/2-1 例如：a42 在 sa[ ]中的存儲位置是： k=4*(4+1)/2+2=12 sa[12]= a42 帶狀矩陣所有非0元素都集中在以主對角線為中心的帶狀區域，半帶寬為d時, 非0元素有 (2d+1)*n-(1+d)*d個（左上角與右下角補上0後，最後必須減掉），如下圖怕示：

C++數組特殊矩陣壓縮存儲

為計算友善，認為每一行都有2d+1個非0元素，若少則0補足存放矩陣的數組sa[ ]有:n(2d+1)個元素數組，元素sa[k]與矩陣元素aij 之間有關系: k=i*(2d+1)+d+(j-i)（第一項i*(2d+1)表示前i行一共有幾個元素，d+(j-i)這一項是用來确定第i行中，第j列前有幾個元素，以i=j時，這時j-i=0，這個作為“分水嶺“，左右兩邊的元素分别加上偏移量d。）

C++數組特殊矩陣壓縮存儲

本例：d=1 K= 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

C++數組特殊矩陣壓縮存儲

（a0前以及a14處放一個0是用來表示在矩陣的左上角及右下角補上的0）稀疏矩陣：

C++數組特殊矩陣壓縮存儲

行數m = 6, 列數n = 7, 非零元素個數t = 6 稀疏矩陣(SparseMatrix)的抽象資料類型

C++數組特殊矩陣壓縮存儲

template < class Type >

C++數組特殊矩陣壓縮存儲

class SparseMatrix {

C++數組特殊矩陣壓縮存儲

int Rows, Cols, Terms; //行/列/非零元素數

C++數組特殊矩陣壓縮存儲

Trituple<Type> smArray[MaxTerms];

C++數組特殊矩陣壓縮存儲

public: //三元組表

C++數組特殊矩陣壓縮存儲

SparseMatrix ( int MaxRow, int Maxcol );

C++數組特殊矩陣壓縮存儲

SparseMatrix<Type> Transpose ( ); //轉置

C++數組特殊矩陣壓縮存儲

SparseMatrix<Type> //相加

C++數組特殊矩陣壓縮存儲

Add ( SparseMatrix<Type> b );

C++數組特殊矩陣壓縮存儲

SparseMatrix<Type> //相乘

C++數組特殊矩陣壓縮存儲

Multiply ( SparseMatrix<Type> b );

C++數組特殊矩陣壓縮存儲

}

C++數組特殊矩陣壓縮存儲

A的三元組順序表圖示

C++數組特殊矩陣壓縮存儲

三元組 (Trituple) 類的定義

C++數組特殊矩陣壓縮存儲

template < class Type > class SparseMatrix < Type > ;

C++數組特殊矩陣壓縮存儲

template < class Type >

C++數組特殊矩陣壓縮存儲

class Trituple {

C++數組特殊矩陣壓縮存儲

friend class SparseMatrix <Type>

C++數組特殊矩陣壓縮存儲

private:

C++數組特殊矩陣壓縮存儲

int row, col; //非零元素所在行号/列号

C++數組特殊矩陣壓縮存儲

Type value; //非零元素的值

C++數組特殊矩陣壓縮存儲

}

C++數組特殊矩陣壓縮存儲

稀疏矩陣

C++數組特殊矩陣壓縮存儲

轉置矩陣

C++數組特殊矩陣壓縮存儲

用三元組表表示的稀疏矩陣及其轉置：

C++數組特殊矩陣壓縮存儲

a.smArray b.smArray （a.Rows=6,a.Cols=7,a.Terms=8）（b.Rows=7,b.Cols=6,b.Terms=8）稀疏矩陣轉置算法思想對應上圖的一個最簡單的方法是把三元組表中的row與col的内容互換，然後再按照新的row中的行号對各三元組從小到大重新排序，最後得到上圖右半部分的三元組表，但是用這樣的方法其時間複雜度為平方級的，下面再用一種方法來處理：假設稀疏矩陣A有n列，相應地，需要針對它的三元組表中的col列進行n次掃描，第k次掃描是在數組的col列中查找列号為k的三元組，若找到，則意味着這個三元組所表示的矩陣元素在稀疏矩陣的第k列，需要把它存放到轉置矩陣的第k行。具體辦法是：取出這個三元組，并交換其row（行号）與col（列号）的内容，連同value中存儲的值，作為新三元組存放到矩陣的三元組表中。當n次掃描完成時，算法結束。程式清單如下：稀疏矩陣的轉置

C++數組特殊矩陣壓縮存儲

template < class Type > SparseMatrix < Type > SparseMatrix < Type > :: Transpose ( ) {

C++數組特殊矩陣壓縮存儲

//将稀疏矩陣a(*this訓示)轉置，結果在稀疏矩陣b中。

C++數組特殊矩陣壓縮存儲

SparseMatrix<Type> b ( Cols, Rows );//建立一個稀疏矩陣類的對象b

C++數組特殊矩陣壓縮存儲

b.Rows = Cols; b.Cols = Rows; //交換其row（行号）與col（列号）的内容，連同value

C++數組特殊矩陣壓縮存儲

b.Terms = Terms;//中存儲的值作為新三元組放到矩陣的三元組表中。

C++數組特殊矩陣壓縮存儲

if ( Terms > 0 ) { //非零元個數不為零

C++數組特殊矩陣壓縮存儲

int CurrentB = 0; //轉置三元組表存放指針

C++數組特殊矩陣壓縮存儲

for ( int k = 0; k < Cols; k++ ) //按列号做掃描，做cols次

C++數組特殊矩陣壓縮存儲

for ( int i = 0; i < Terms; i++ ) //在數組中找列号為k的三元組

C++數組特殊矩陣壓縮存儲

if ( smArray[i].col == k) { //第i個三元組中元素的列号為k

C++數組特殊矩陣壓縮存儲

b.smArray[CurrentB].row = k; //新三元組的行号

C++數組特殊矩陣壓縮存儲

b.smArray[CurrentB].col=smArray[i].row;//新三元組的列号

C++數組特殊矩陣壓縮存儲

b.smArray[CurrentB].value=smArray[i].value;//新三元組的值

C++數組特殊矩陣壓縮存儲

CurrentB++; //存放指針加1

C++數組特殊矩陣壓縮存儲

}

C++數組特殊矩陣壓縮存儲

}

C++數組特殊矩陣壓縮存儲

return 0;

C++數組特殊矩陣壓縮存儲

}

C++數組特殊矩陣壓縮存儲

若設稀疏矩陣的行數為Rows，列數為Cols，非零元素個數為Terms，則最壞情況下的時間複雜度主要取決于二重潛套for循環内的if語句，if語句在二重循環的作用下總的執行次數為O（Cols*Terms）。而在if控制内的指派語句則執行了Terms次，它取決于三元組表本身的長度。若非零元素個數Terms與矩陣行，列數的乘積Rows*Cols等數量級，則上述程式清單的時間複雜度為O(Cols*Terms)＝O（Rows*Cols*Cols）。設Rows=500,Cols=100,Terms=10000,則O(500*100*100)=O(5000 000)，處理效率極低。為了提高轉置效率，采用一種快速轉置的方法。在此方法中，引入兩個輔助數組： 1． rowSize[]。用它存放事先統計出來的稀疏矩陣各列的非零元素個數，轉置以後是轉置矩陣各行的非零元素個數。具體做法是：先把這個數組清零，然後掃描矩陣A的三元組表，逐個取出三元組的列号col，把以此列号為下标的輔助數組元素的值累加1。 for(int i=0;i<Cols;i++) rowSize[i]=0;//清零 for(j=0;j<Terms;j++) rowSize[smArray[j].col]++;//統計，注意這裡用到的簡潔的算法 2． rowstart[]。用它存放事先計算出來的稀疏矩陣各行非零元素在轉置矩陣的三元組表中應存放的位置。 rowSize[0]=0;//計算矩陣b第i行非零元素的開始存放位置 for(i=1;i<Cols;i++)rowStart[i]=rowStart[i-1]+rowSize[i-1] 快速轉置算法的思想 Ø 建立輔助數組 rowSize 和 rowStart，記錄矩陣轉置後各行非零元素個數和各行元素在轉置三元組表中開始存放位置。 Ø 掃描矩陣三元組表，根據某項的列号，确定它轉置後的行号，查 rowStart 表，按查到的位置直接将該項存入轉置三元組表中。 Ø 轉置時間代價為O(max(Terms, Cols))。若矩陣有200 列，10000個非零元素，總共需要10000次處理。

C++數組特殊矩陣壓縮存儲

對應上圖的代碼在就像前面所列的： for ( int i = 0; i < Cols; i++ ) rowSize[i] = 0; for ( i = 0; i < Terms; i++ ) rowSize[smArray[i].col]++; rowStart[0] = 0; for ( i = 1; i < Cols; i++ ) rowStart[i] = rowStart[i-1]+rowSize[i-1]; 稀疏矩陣的快速轉置

C++數組特殊矩陣壓縮存儲

template < class Type > SparseMatrix < Type >

C++數組特殊矩陣壓縮存儲

SparseMatrix < Type > ::FastTranspos ( ) {

C++數組特殊矩陣壓縮存儲

//對稀疏矩陣a(*this訓示)做快速轉置，結果放在b中，時間代價為O(Terms+Columns)。

C++數組特殊矩陣壓縮存儲

int *rowSize = new int[Cols];//輔助數組，統計各列非零元素個數

C++數組特殊矩陣壓縮存儲

int *rowStart = new int[Cols];//輔助數組，預計轉置後各行存放位置

C++數組特殊矩陣壓縮存儲

SparseMatrix<Type> b ( Cols, Rows );//存放轉置結果

C++數組特殊矩陣壓縮存儲

b.Rows = Cols; b.Cols = Rows;

C++數組特殊矩陣壓縮存儲

b.Terms = Terms;

C++數組特殊矩陣壓縮存儲

if ( Terms > 0 ) {

C++數組特殊矩陣壓縮存儲

for (int i = 0; i < Cols; i++) rowSize[i] = 0;//統計矩陣b中第i行非零元素個數

C++數組特殊矩陣壓縮存儲

for ( i = 0; i < Terms; i++ )

C++數組特殊矩陣壓縮存儲

//根據矩陣a中第i個非零元素的列号，将rowSize相當該列的計數加1

C++數組特殊矩陣壓縮存儲

rowSize[smArray[i].col]++;

C++數組特殊矩陣壓縮存儲

rowStart[0] = 0; //計算矩陣b第i行非零元素的開始存放位置

C++數組特殊矩陣壓縮存儲

for ( i = 1; i < Cols; i++ ) //rowStart[i]=矩陣b的第i行的開始存放位置

C++數組特殊矩陣壓縮存儲

rowStart[i] = rowStart[i-1]+rowSize[i-1];

C++數組特殊矩陣壓縮存儲

for ( i = 0; i < Terms; i++ ) { //從a向b傳送

C++數組特殊矩陣壓縮存儲

int j = rowStart[smArray[i].col];//j為第i個非零元素在b中應存放的位置

C++數組特殊矩陣壓縮存儲

b.smArray[j].row = smArray[i].col;

C++數組特殊矩陣壓縮存儲

b.smArray[j].col = smArray[i].row;

C++數組特殊矩陣壓縮存儲

b.smArray[j].value = smArray[i].value;

C++數組特殊矩陣壓縮存儲

rowStart[smArray[i].col]++;

C++數組特殊矩陣壓縮存儲

}

C++數組特殊矩陣壓縮存儲

}

C++數組特殊矩陣壓縮存儲

delete[ ] rowSize; delete [ ] rowStart;

C++數組特殊矩陣壓縮存儲

return b;

C++數組特殊矩陣壓縮存儲

}

C++數組特殊矩陣壓縮存儲

在此程式中有4個并列循環，其時間複雜度分别為O(Cols),O(Terms),O(Cols),和O（Terms），則程式總的時間複雜度為O(Cols+Terms)。當Terms與Rows*Cols等數量級時，程式的時間複雜度為O(Cols＋Terms)＝O(Rows*Cols)。設Rows=500，Cols＝100,Terms=10000,則O（500*100）=O（50000）。當Terms遠遠小于Rows*Cols時，此程式會更省時間，但程式中需要增加兩個體積為Cols的輔助數組。一般Terms總是大于Cols的，如果能夠大幅度提高速度，這點空間存儲上的開銷是值得的。

C++數組特殊矩陣壓縮存儲

繼續閱讀

C語言第四章自述2第四章選擇結構程式設計

面試題:vector和map的差別，異同。空間分布，100萬資料存哪個比較合适。一、疊代器差別二、vector三、Map、Set四、vector_map 為什麼比map效率高五、如何選擇六、容器選擇原則七、效率對比

C++ 多線程用條件變量确定線程的執行順序而不是使用 sleep(1)

POJ 1284 Primitive Roots (歐拉函數&原根定理)

CQ V1.0分詞bates(基于雙數組tire樹)—應該是目前最快的中文分詞算法

成員函數初始化清單

2021-08-13c++——類之操作符重載

swmm與lisflood-fp源碼如何一起編譯 CMake指令

Windows下VS開發環境環境安裝工程項目設定關于Debug和Release的提示

一文看懂字元串的加減乘除

C++ 第十五周報告1--《冒泡法排序》

C++實作簡單順序表

C經典書籍筆記——C陷阱與缺陷②(文法陷阱之優先級)一、錯誤案列二、優先級規律

線性表之順序表的實作

C++判斷素數、求最大公約數代碼判斷一個數是否為素數求兩個數的最大公約數

SequoiaDB巨杉資料庫C++驅動概述

C++數組 特殊矩陣壓縮存儲

繼續閱讀

C++數組特殊矩陣壓縮存儲