天天看點

分區存儲助力QLC應用到嵌入式儲存設備

作者:電子技術應用ChinaAET
分區存儲助力QLC應用到嵌入式儲存設備

背景

目前應用在移動終端的嵌入式儲存設備(這裡主要指UFS/eMMC等,以下統稱“嵌入式儲存設備”)中主流媒體還是TLC。但更高存儲密度的QLC也已經産品化,比如一些資料中心(讀密集型應用)已經在部署QLC儲存設備。QLC可以給儲存設備帶來更低的成本,作為消費級産品的嵌入式儲存設備,未來引入QLC也是勢在必行。

但和目前主流TLC相比,QLC在性能和壽命上都相差很大,從下面某原廠TLC和QLC在性能和壽命方面的一個對比可見一斑。

分區存儲助力QLC應用到嵌入式儲存設備

(Table 1:某原廠TLC和QLC性能和壽命對比)

是以,QLC要應用在嵌入式儲存設備上,首先需要解決性能差和壽命短兩大問題。

雖然QLC還不到TLC的1/4寫入性能,但目前消費級固态存儲産品都有成熟的SLC cache機制,能保證使用者有比較好的突發寫入性能(寫SLC的性能)。由于嵌入式儲存設備有比較充裕的空閑時間,儲存設備可以利用空閑時間把資料從SLC搬到QLC,隻要不是重度寫入場景,這部分QLC寫入性能,使用者一般感覺不到。

但資料一旦寫到QLC,對比TLC,使用者讀取性能變差。針對這個讀取性能差的問題,有一種方案是把熱資料(經常讀取)寫回SLC,但這樣無疑增加了裝置複雜性,而且資料搬移帶來了額外的寫放大,這讓壽命本來就不長的QLC“雪上加霜”。

如果說性能問題可以通過SLC解決或者緩解,那對于QLC壽命問題,在分區存儲引入之前,可能的解決方案有:使用者端使用類F2FS檔案系統和使用資料分流。

F2FS檔案系統化随機寫為順序寫,這會減少儲存設備内部垃圾回收導緻的寫放大,但F2FS檔案系統本身的垃圾回收,會給儲存設備帶來額外的寫。綜合下來,F2FS檔案系統給裝置帶來的寫放大不一定減少。

資料分流需要主機和裝置配合:主機端對資料進行冷熱甄别,裝置端根據資料的冷熱程度把它們存儲在不同的閃存塊上。資料分流能一定程度上減少儲存設備寫放大,但具體能帶來多大收益,這取決于使用者冷熱資料的比例,是以有一定的局限性。

今天要介紹減小寫放大的終極大招——分區存儲(Zoned Storage),它能消除QLC和TLC壽命之間的差異,而且能提升儲存設備性能,讓QLC應用到嵌入式儲存設備上變得可能。

什麼是分區存儲?

分區存儲概念最早來源于SMR HDD。SMR是“Shingled Magnetic Recording”(疊瓦式磁記錄)的首字母縮寫,是一種用于增加容量并降低硬碟每TB成本的重要技術。SMR硬碟把硬碟分成一個個的分區(Zone),每個分區内部必須順序寫,否則會發生資料覆寫進而導緻之前寫入的資料丢失問題。

分區存儲助力QLC應用到嵌入式儲存設備

(Figure 1:SMR HDD)

分區儲存設備的邏輯空間被劃分成一個個連續的分區,分區内部隻能被順序寫入。每個分區都有一個寫指針,用于跟蹤下一次寫入的位置。分區中的資料不能被覆寫,必須首先使用特殊指令(區域重置)擦除資料。

分區存儲助力QLC應用到嵌入式儲存設備

(Figure 2:分區存儲概念)

除了HDD,基于閃存的固态儲存設備,也是非常喜歡順序寫入的,因為順序寫性能好,而且導緻的寫放大也小。“讓主機端順序寫入”一直是固态儲存設備的夢想,在SMR HDD助力下,分區存儲生态日趨完善,NVMe也制定了ZNS(Zoned Namespace)标準,SSD也算是“圓夢”了。

分區存儲帶來的好處

分區存儲帶來的一大好處就是能消除儲存設備内部的垃圾回收。儲存設備垃圾回收會導緻兩個主要問題:一是引入寫放大,導緻儲存設備壽命減少;二是垃圾回收的同時如果伴有主機讀寫,垃圾回收操作則會影響主機讀寫性能。

分區存儲助力QLC應用到嵌入式儲存設備

(Figure 3:垃圾回收示例)

垃圾回收原理:為騰出空閑閃存塊,需要把有效資料A、B、C從源閃存資料塊搬到新的閃存塊,内部資料的搬移引入寫放大。寫放大 = 寫入閃存的資料量/主機寫入的資料量,寫放大越大,對閃存磨損越厲害。

分區存儲怎麼就能消除儲存設備垃圾回收的呢?

如果分區大小是儲存設備閃存塊大小的整數倍,這樣一個分區的資料會被寫到閃存裝置的整數個閃存塊内。由于分區不允許覆寫寫,一個分區資料隻能被整體無效掉,也就是意味着該分區對應的閃存塊也是整體被無效掉(上面沒有任何有效資料),是以儲存設備内部回收閃存塊無需垃圾回收——隻需要一個擦除動作。

傳統垃圾回收由于需要搬移閃存塊上的有效資料,會導緻寫放大。還有,為減小寫放大和加速垃圾回收,儲存設備都會預留一些閃存空間(也就是我們常說的OP),以減少閃存塊上有效資料數量。現在分區儲存設備中由于不存在垃圾回收,是以沒有寫放大,同時這部分OP也可以省掉了(節省成本)。

分區存儲助力QLC應用到嵌入式儲存設備

(Figure 4:傳統SSD資料存放和分區SSD資料存放比較)

分區存儲帶來的另一大好處就是大大減少了映射表大小,進而提升系統性能,減少儲存設備成本。

基于閃存的傳統儲存設備一般按4KB邏輯塊大小為映射粒度,其L2P映射表(邏輯位址到實體位址的映射)大小一般為儲存設備容量的1/1024,比如一個512GB的UFS裝置,其L2P映射表大小為512MB。企業級SSD一般都配有相應大小的DRAM來存儲運作時的L2P映射表,比如512GB的企業級SSD需要搭載至少512MB的DRAM;而業界消費級儲存設備則是出于成本考慮,一般都沒有DRAM,它利用控制器小的SRAM緩存部分L2P映射表,而絕大多數L2P映射表都是存在閃存,固件按需從閃存加載映射關系資料到控制器SRAM。這種DRAM-less的儲存設備,與帶DRAM的儲存設備相比,少了DRAM的成本,但性能無疑會大打折扣,因為控制器SRAM大小有限,對随機讀取場景來說,映射表緩存命中率很低,固件很多時候需要先從閃存加載映射關系,然後再根據獲得的實體位址去讀使用者資料,也就是說讀取一筆資料需要通路幾次閃存,意味着讀取性能肯定比隻通路一次閃存要慢得多。

問題的根因是傳統儲存設備映射粒度太細了,導緻映射表巨大。而分區儲存設備,我們可以按照分區大小為映射粒度。假設分區大小為128MB,一個512GB的裝置有4096個分區,每個分區對應的實體位址用4位元組表示,那麼整個L2P映射表隻有16KB!這麼小的映射表完全可以存儲在控制器SRAM中,是以在企業級SSD中可節省DRAM的使用;對消費級存儲産品來說,L2P映射表可以常駐記憶體,無需從閃存中擷取映射關系,讀取一筆資料隻需通路一次閃存,這大大加速了随機讀取性能。

分區存儲助力QLC應用到嵌入式儲存設備

(Table 2:傳統儲存設備和分區儲存設備映射對比)

分區存儲助力QLC嵌入式儲存設備

回到QLC應用到嵌入式儲存設備的話題。

在傳統嵌入式儲存設備中,垃圾回收一般會引入3-4的寫放大,即一個3000次擦寫次數的TLC閃存,真正給到使用者的擦寫次數可能不到1000次。而分區存儲的使用,由于不存在垃圾回收,是以寫放大可以做到接近1,也就是一個1500次擦寫次數的QLC,給到使用者就是實打實的1500次。這意味着:傳統用3000次擦寫次數TLC的儲存設備,假設TBW為100TB,現在如果用QLC,雖然QLC的擦寫次數隻有TLC的一半,但由于分區存儲的使用,TBW反而能提升到150TB。

對分區儲存設備,由于L2P映射表很小,完全能夠存放在控制器SRAM,是以可快速更新和擷取映射關系,進而大幅提升系統讀寫性能。傳統基于TLC的嵌入式儲存設備,在随機讀取一筆資料(4KB)的時候,由于L2P映射緩存很小(幾百KB),固件大機率要先從閃存上加載L2P映射關系,這個時間大概40us左右,然後再花60us左右的時間從閃存加載使用者資料——随機讀取一筆資料的時間大概需要花100us左右;而現在基于分區存儲的嵌入式儲存設備,由于省掉了加載映射關系的時間,雖然讀取閃存的時間QLC要比TLC長,但總的時間下來,兩者是相當的。

由于分區儲存設備的使用,再加上成熟的SLC緩存機制,這兩大特性彌補了QLC壽命短和性能差兩大短闆,讓QLC應用到嵌入式儲存設備上變得可行。現在典型的嵌入式儲存設備為UFS裝置,如果引入了分區存儲,像UFS中的HPB、FBO等特性完全可以抛棄,這也無疑簡化了UFS裝置的設計。

嵌入式儲存設備技術展望

前端接口協定方面,應用于安卓平台上的嵌入式儲存設備目前主流是UFS裝置,相信未來很長一段時間也會沿着UFS路線繼續向前。UFS4.0協定今年8月份釋出,三星早前也釋出了UFS4.0儲存設備。

分區存儲助力QLC應用到嵌入式儲存設備

(Figure 5:嵌入式存儲協定發展路線)

存儲媒體方面,作為消費級産品,嵌入式儲存設備對成本敏感,随着QLC閃存的成熟,QLC必然會應用到未來的嵌入式儲存設備上,無論是廠商還是消費者,都要做好這個心理準備。事實上,今年(2022年)年初铠俠已經釋出了基于QLC的UFS3.1産品。

QLC應用到嵌入式儲存設備上,要讓消費者用得放心,這需要相關的技術來解決QLC媒體可靠性差、壽命短、性能差等問題。是以在技術趨勢方面,一方面是嵌入式存儲控制器糾錯能力需要變得越來越強;另一方面,像資料分流、分區存儲這些能減小寫放大的技術也會被引入,來彌補QLC壽命短這塊短闆。

目前,江波龍具有基于主流3D TLC閃存的豐富的嵌入式存儲産品,從eMMC到高性能UFS3.1,從消費級存儲到車規級存儲,産品矩陣全面。同時,公司也在思考怎麼把存儲密度更高的QLC應用到嵌入式存儲産品上,并開展相關技術預研工作。未來,江波龍會持續給客戶帶來更多超越期望的嵌入式存儲産品。

數字化尖峰制造,江波龍中山二期封頂,打造11萬平米企業級存儲專線

CES 2023 | 從科技趨勢看存儲新風向

新的跨越!江波龍首款企業級SSD橫空出世

FORESEE PCIe Gen4 SSD系列産品通過PCI-SIG相容性認證

繼續閱讀