天天看點

騰訊雲自研"原生态AI"VectorDB向量資料庫

向量資料庫是未來,騰訊也開始下場卷。隻有這塊屬于“剛需賣鏟子掙錢”成功率高

騰訊雲自研"原生态AI"VectorDB向量資料庫

在沒有看到内部分享時,隻看到一些外部推文号稱:它最高支援業界領先的10億級向量檢索規模,并将延遲控制在毫秒級。相比傳統單機插件式資料庫檢索規模提升10倍,同時具備百萬級每秒查詢(QPS)的峰值能力。

騰訊雲自研"原生态AI"VectorDB向量資料庫

因為騰訊是國内最早使用Milvus向量資料庫的公司之一,Milvus也有類似的描述(Qdrant評測比Milvus性能更強悍)。

起初以為騰訊雲的向量資料庫基于Milvus封裝套殼搞的。因為我們自己使用開源向量資料庫+Embedding模型(微調)搞應用,自認為️比較深入了解。

等看了一些騰訊雲内部分享資料後,其實産品思路跟其他開源DB近乎一緻,除基于開源封裝圍繞外圍做工作,基于Faiss向量引擎(facebook開源的c++向量引擎,性能就yyds強悍),HNSW,NWS優秀檢索算法

騰訊雲自研"原生态AI"VectorDB向量資料庫

集”衆家之長“:WAL(日志預寫),Snapshot(快照),Index(索引),Vector(向量),內建Embedding模型(簡單化,缺點依賴度高)

騰訊雲自研"原生态AI"VectorDB向量資料庫

發現大家除技術路線選擇,對向量資料庫的使用場景竟然驚奇的一緻

騰訊雲自研"原生态AI"VectorDB向量資料庫

騰訊雲推出的向量資料庫VectorX計劃8月正式上線,内測已經開啟可以自己嘗試申請測試。

備注:圖檔具體騰訊内部分享資料截取

繼續閱讀