天天看點

小紅書資料架構及 TiDB 使用場景

作者:張魚小丸子-PingCAP​

小紅書是一個内容+電商平台,截至 2019 年 10 月,小紅書月活躍使用者數已經過億,并持續快速增長。

那麼,一個快速發展的電商平台,為什麼更願意引入 NewSQL 技術棧?支援這些業務高速增長的背景的資料架構,是怎樣疊代的?小紅書都在哪些場景使用 TiDB 呢?我們來聊下這個問題。

技術棧的時間成本

小紅書使用 TiDB 曆史可以追溯到 2017 年甚至更早,大家知道 TiDB 1.0 GA 是在 2.017 年下半年釋出的,也就是說在 GA 之前小紅書就已經持續保持關注了。回頭去看,2017 年的小紅書已經具備了一定的體量,那時他們在物流、倉庫等業務場景很渴望用新的技術,而與此同時 NewSQL 資料庫開始真正落地。到了在 2018 年 5 月,TiDB 開始逐漸鋪開,到了 2019 年初,小紅書使用 TiDB 節點規模快速達到了 200+ 。當時 TUG 華東區大使俊駿同學有一篇案例詳細了描述這個過程(​​https://mp.weixin.qq.com/s/fq7U_x4LftlqFx3vD1S3jw)​​

這裡面的關鍵因素是時間成本,TiDB 對這類快速發展的公司,通過節省技術棧提供兩個關鍵時間價值:

  • 線上業務方向,TiDB 天然擴充性避免了傳統分庫分表技術棧的引入,直接接入新一代技術;
  • 線上分析方向,TiDB 的 HTAP 能力,延緩引入或者部分替換繁重的 Hadoop 技術棧,準實時的數倉反向推動業務創新;

業務場景

TiDB 在小紅書的使用場景是非常廣的,其中主要的業務場景包括:

  • 資料中台、報表分析
  • 實時的業務背景查詢
  • 實時風控與反欺詐類
小紅書資料架構及 TiDB 使用場景

小紅書資料架構方案

  • TiDB 逐漸成為資料服務層的主要解決方案;
  • 業務類的資料直接同步到 TiDB 進行實時類的背景查詢;
  • 簡化了 Hadoop 在離線數倉的使用,并且對離線結果資料同步到 TiDB,提供資料服務。

​​

​​

繼續閱讀