天天看點

node總結之Buffer(緩沖區)了解下(一)

JavaScript 語言自身隻有字元串資料類型,沒有二進制資料類型,但在處理像TCP流或檔案流時,必須使用到二進制資料。是以在 Node.js中,定義了一個 Buffer 類,該類用來建立一個專門存放二進制資料的緩存區。

在 Node.js 中,Buffer 類是随 Node 核心一起釋出的核心庫,Buffer 庫為 Node.js 帶來了一種存儲原始資料的方法,可以讓 Node.js 處理二進制資料,每當需要在 Node.js 中處理I/O操作中移動的資料時,就有可能使用 Buffer 庫。原始資料存儲在 Buffer 類的執行個體中。一個 Buffer 類似于一個整數數組,但它對應于 V8 堆記憶體之外的一塊原始記憶體。

順帶說一句,在v6.0之前建立Buffer對象直接使用new Buffer()構造函數來建立對象執行個體,但是Buffer對記憶體的權限操作相比很大,可以直接捕獲一些敏感資訊,是以在v6.0以後,官方文檔裡面建議使用 Buffer.from() 接口去建立Buffer對象。

我們來看下node目前支援的字元編碼:

  • ascii - 僅支援 7 位 ASCII 資料。如果設定去掉高位的話,這種編碼是非常快的。
  • utf8 - 多位元組編碼的 Unicode 字元。許多網頁和其他文檔格式都使用 UTF-8 。
  • utf16le - 2 或 4 個位元組,小位元組序編碼的 Unicode 字元。支援代理對(U+10000 至 U+10FFFF)。
  • ucs2 - utf16le 的别名。
  • base64 - Base64 編碼。
  • latin1 - 一種把 Buffer 編碼成一位元組編碼的字元串的方式。
  • binary - latin1 的别名。
  • hex - 将每個位元組編碼為兩個十六進制字元。

我們之前說的Buffer 執行個體呢,一般就用于表示編碼字元的序列,比如 UTF-8 、 UCS2 、 Base64 、或十六進制編碼的資料。 通過使用顯式的字元編碼,就可以在 Buffer 執行個體與普通的 JavaScript 字元串之間進行互相轉換,來看個執行個體:

const buf = Buffer.from('runoob', 'ascii');

// 輸出 72756e6f6f62
console.log(buf.toString('hex'));

// 輸出 cnVub29i
console.log(buf.toString('base64'));
           

Buffer 提供了以下 API 來建立 Buffer 類:

  • Buffer.alloc(size[, fill[, encoding]]): 傳回一個指定大小的 Buffer 執行個體,如果沒有設定 fill,則預設填滿 0
  • Buffer.allocUnsafe(size): 傳回一個指定大小的 Buffer 執行個體,但是它不會被初始化,是以它可能包含敏感的資料
  • Buffer.allocUnsafeSlow(size)
  • Buffer.from(array): 傳回一個被 array 的值初始化的新的 Buffer 執行個體(傳入的 array 的元素隻能是數字,不然就會自動被 0 覆寫)
  • Buffer.from(arrayBuffer[, byteOffset[, length]]): 傳回一個建立的與給定的 ArrayBuffer 共享同一記憶體的 Buffer。
  • Buffer.from(buffer): 複制傳入的 Buffer 執行個體的資料,并傳回一個新的 Buffer 執行個體
  • Buffer.from(string[, encoding]): 傳回一個被 string 的值初始化的新的 Buffer 執行個體

來看下執行個體:

// 建立一個長度為 10、且用 0 填充的 Buffer。
const buf1 = Buffer.alloc(10);

// 建立一個長度為 10、且用 0x1 填充的 Buffer。 
const buf2 = Buffer.alloc(10, 1);

// 建立一個長度為 10、且未初始化的 Buffer。
// 這個方法比調用 Buffer.alloc() 更快,
// 但傳回的 Buffer 執行個體可能包含舊資料,
// 是以需要使用 fill() 或 write() 重寫。
const buf3 = Buffer.allocUnsafe(10);

// 建立一個包含 [0x1, 0x2, 0x3] 的 Buffer。
const buf4 = Buffer.from([1, 2, 3]);

// 建立一個包含 UTF-8 位元組 [0x74, 0xc3, 0xa9, 0x73, 0x74] 的 Buffer。
const buf5 = Buffer.from('tést');

// 建立一個包含 Latin-1 位元組 [0x74, 0xe9, 0x73, 0x74] 的 Buffer。
const buf6 = Buffer.from('tést', 'latin1');
           

來看下寫入 Node 緩沖區的文法:

buf.write(string[, offset[, length]][, encoding])
           

參數描述如下:

  • string - 寫入緩沖區的字元串。
  • offset - 緩沖區開始寫入的索引值,預設為 0 。
  • length - 寫入的位元組數,預設為 buffer.length
  • encoding - 使用的編碼。預設為 'utf8' 。

node根據 encoding 的字元編碼寫入 string 到 buf 中的 offset 位置, length 參數是寫入的位元組數,如果 buf 沒有足夠的空間儲存整個字元串,則隻會寫入 string 的一部分,并且隻部分解碼的字元不會被寫入。它傳回實際寫入的大小,但是如果 buffer 空間不足, 則隻會寫入部分字元串。執行個體如下:

buf = Buffer.alloc(256);
len = buf.write("www.runoob.com");

console.log("寫入位元組數 : "+  len);
           

運作結果為:

$node main.js
寫入位元組數 : 14
           

來看下讀取 Node 緩沖區資料的文法:

buf.toString([encoding[, start[, end]]])
           

參數描述如下:

  • encoding - 使用的編碼。預設為 'utf8' 。
  • start - 指定開始讀取的索引位置,預設為 0。
  • end - 結束位置,預設為緩沖區的末尾。

解碼緩沖區資料并使用指定的編碼傳回字元串,執行個體如下:

buf = Buffer.alloc(26);
for (var i = 0 ; i < 26 ; i++) {
  buf[i] = i + 97;
}

console.log( buf.toString('ascii'));       // 輸出: abcdefghijklmnopqrstuvwxyz
console.log( buf.toString('ascii',0,5));   // 輸出: abcde
console.log( buf.toString('utf8',0,5));    // 輸出: abcde
console.log( buf.toString(undefined,0,5)); // 使用 'utf8' 編碼, 并輸出: abcde
           

再來看下将 Node Buffer 轉換為 JSON 對象的函數文法格式:

buf.toJSON()
           

當字元串化一個 Buffer 執行個體時,JSON.stringify() 會隐式地調用該 toJSON(),會傳回一個JSON對象,完事來看執行個體:

const buf = Buffer.from([0x1, 0x2, 0x3, 0x4, 0x5]);
const json = JSON.stringify(buf);

// 輸出: {"type":"Buffer","data":[1,2,3,4,5]}
console.log(json);

const copy = JSON.parse(json, (key, value) => {
  return value && value.type === 'Buffer' ?
    Buffer.from(value.data) :
    value;
});

// 輸出: <Buffer 01 02 03 04 05>
console.log(copy);
           

運作結果為:

{"type":"Buffer","data":[1,2,3,4,5]}
<Buffer 01 02 03 04 05>
           

還有Node 緩沖區合并的文法:

Buffer.concat(list[, totalLength])
           

參數描述如下:

  • list - 用于合并的 Buffer 對象數組清單。
  • totalLength - 指定合并後Buffer對象的總長度。

它會傳回一個多個成員合并的新 Buffer 對象,來看執行個體:

var buffer1 = Buffer.from(('luyaran'));
var buffer2 = Buffer.from(('is my love'));
var buffer3 = Buffer.concat([buffer1,buffer2]);
console.log("buffer3 内容: " + buffer3.toString());
           

輸出結果為:

buffer3 内容: luyaranis my love
           

Node Buffer 比較的函數文法如下所示, 該方法在 Node.js v0.12.2 版本引入:

buf.compare(otherBuffer);
           

參數描述如下:

  • otherBuffer - 與 buf 對象比較的另外一個 Buffer 對象。

它會傳回一個數字,表示 buf 在 otherBuffer 之前,之後或相同,來看執行個體:

var buffer1 = Buffer.from('ABC');
var buffer2 = Buffer.from('ABCD');
var result = buffer1.compare(buffer2);

if(result < 0) {
   console.log(buffer1 + " 在 " + buffer2 + "之前");
}else if(result == 0){
   console.log(buffer1 + " 與 " + buffer2 + "相同");
}else {
   console.log(buffer1 + " 在 " + buffer2 + "之後");
}
           

輸出結果為:

ABC在ABCD之前
           

最後再來看Node 緩沖區拷貝文法:

buf.copy(targetBuffer[, targetStart[, sourceStart[, sourceEnd]]])
           

參數描述如下:

  • targetBuffer - 要拷貝的 Buffer 對象。
  • targetStart - 數字, 可選, 預設: 0
  • sourceStart - 數字, 可選, 預設: 0
  • sourceEnd - 數字, 可選, 預設: buffer.length

它是沒有傳回值的,來看下執行個體:

var buf1 = Buffer.from('abcdefghijkl');
var buf2 = Buffer.from('RUNOOB');

//将 buf2 插入到 buf1 指定位置上
buf2.copy(buf1, 2);

console.log(buf1.toString());
           

輸出結果為:

abRUNOOBijkl
           

結尾我看來看下buf.compare(otherBuffer);,這個方法啊。

它是按位比較的,就是buffer1 的第一位比較 buffer2 的第一位,相等的話比較第二位以此類推直到得出結果,來看下執行個體:

var buffer1 = Buffer.from('ABCDEF99');
var buffer2 = Buffer.from('ABCDEF98765');
           

上面那個 buffer1 和 buffer2 比較的話,result 的結果是 1,前面的結果都是相等,直到比較 9>8 的時候出結果。按位逐一比較直到出結果。那麼說如果把 buffer1 設為 12313213121 這種純數字呢,數字和字母比較的結果就是 -1。

 好啦,本次記錄就到這裡了。

如果感覺不錯的話,請多多點贊哦。。。

繼續閱讀