天天看點

星環科技分布式圖資料庫StellarDB5.0:萬物互聯,一觸即“答”

作者:星環科技

大資料智能時代,資料量呈現爆發式的增長,資料互聯的關系也變得越來越複雜,企業對于資料庫的需求已經從一般的資料管理演變為從複雜的資料關系中最大化提取資料價值。圖資料庫作為一項新興的資料存儲管理系統,因為其靈活的模組化能力和優異的關聯關系查詢性能,在政府、金融、通信、社交等對海量資料關系分析需求旺盛的領域受到了很高的關注和應用。

然而,随着客戶業務方面的深入探索和發展,對圖資料庫的性能和其他系統方面的要求越來越高。

  • 高性能 圖資料庫能夠存儲更多資料的同時,也要求在TP/AP/HTAP等業務應用場景中的資料分析計算過程中能夠更快地做出響應。
  • 圖智能 圖資料智能的高速發展,利用圖相關的智能技術如圖機器學習技術來賦能圖資料價值的挖掘。
  • 動态圖 針對圖資料動态變化的特性,實作更加簡潔、直覺的模型建構,并從變化的趨勢中挖掘出更多的資料價值。
  • 可視化分析 圖資料庫采用點、邊結構來存儲和分析計算資料,具有高度解釋性,利用可視化資料分析能力進一步降低使用者資料分析門檻,加速業務創新。
  • 資料融合分析 多種類型資料之間的資料壁壘給企業使用者挖掘更深層次的資料價值帶來很大的挑戰。

StellarDB5.0:更高性能、更智能、更易用

星環科技分布式圖資料庫StellarDB5.0:萬物互聯,一觸即“答”

為了解決上述問題,StellarDB在存算引擎、深度圖架構、動态圖模型、可視化等方面引入了更多新的設計和疊代更新,推出了更高性能、更智能、更易用的企業級分布式圖資料庫StellarDB 5.0。

性能數倍提升,加速資料分析創新

StellarDB5.0實作了存儲引擎和計算引擎雙引擎更新。在存儲部分,全新設計了底層資料存儲結構,在計算部分優化了TEoC編譯器,同時對多場景計算架構進行了深度優化,為多場景的高性能要求奠定了堅實的基礎。

在實時場景中,響應速度提升了近5倍,并且在高并發場景下,QPS可達上萬以上。在關聯關系場景中,多跳查詢能力最高提升達到10倍。此外,StellarDB5.0對近50種圖算法進行了深度的優化,性能平均提升8倍。

StellarDB5.0實作從實時場景到關聯關系分析場景,到圖算法分析場景全方位的性能提升,大幅提高了客戶業務效率。

深度圖學習,賦能工業級圖智能應用

在視覺推理、基于社交網絡的推薦等場景中,圖機器學習技術的使用能夠有效提升結果的準确率,特别是對于解決分類、風險識别、關聯推薦、以及知識推理等問題,圖機器學習都能夠給予更好的支援。然而将圖機器學習真正應用于生産實踐,門檻較高,需要使用者具有非常強的知識和技術積累。

為了能夠将圖機器學習技術在實際生産中落地,StellarDB5.0接入了星環科技自研的ZenGraph深度圖架構,将圖資料庫技術和深度圖技術深度融合,利用圖資料庫的優勢實作圖資料快速地讀取和寫回,提供快速子圖過濾能力,進而提升整個深度圖鍊路的處理效率;ZenGraph深度圖架構可以針對不同的業務場景提供不同的深度圖模型,滿足多樣化的業務場景。

在實踐過程中,StellarDB結合ZenGraph深度圖架構,預測準确率達到了業内較高水準。例如,論文引用推薦場景中,在630萬點邊,128個特征數的資料集下,推薦準确率高達81.23%,比傳統鍊路預測算法提升了23%。類似的,如基于内容本身的微網誌推薦、書籍推薦、商品推薦或者歌曲推薦等場景中,結合ZenGraph,推薦準确率可以得到大幅提升。

同樣,圖資料子圖過濾場景中,在6800萬點邊,5個過濾特征的資料集下,使用StellarDB進行子圖過濾僅需4.97秒,極大加速了深度圖鍊路處理效率。

下一階段,StellarDB将進一步融合圖資料庫技術和深度圖技術,提供更加易用、一體化的工業級圖深度學習解決方案。

簡潔的動态圖模型,圖資料變化直覺、高效分析

許多圖資料應用場景中的圖資料并不是靜态不變的,而是動态變化的。例如,金融交易網絡中不同交易實體之間在不同時間點發生多筆交易,或者新增交易關系時,傳統的做法是使用多條邊來表示不同時間或發生的不同交易關系。當交易關系增多時,這種模式會讓圖資料模型變得非常複雜,增加了資料備援存儲,并增加了資料分析的難度。

星環科技分布式圖資料庫StellarDB5.0:萬物互聯,一觸即“答”

StellarDB5.0提供動态圖模型的建構。例如在上述場景中,當賬戶在不同時間段發生交易時,使用者無需添加多條邊來描述交易情況,僅需在之前屬性為交易的邊上繼續添加不同時間的交易資訊即可。這些随時間變化的資訊都是存儲在點和邊的屬性當中,簡化了資料模組化,降低了資料備援,同一張畫布可以承載更多的點邊資料,讓圖資料分析變得更加便捷。

此外,動态圖模型能夠将圖資料變化的曆史全部記錄下來,可以按照時間點查詢圖的曆史變更,也可以一次性擷取點/邊屬性的所有曆史記錄。通過對動态圖進行時間軸可視化,可以直覺、便捷地對圖資料變化進行分析,幫助使用者更容易的發現圖背後的規律。例如在金融反欺詐應用中,圖結構的動态變化可以表征欺詐團夥的人員變化和交易關系變化等,進而幫助業務人員更準确、更高效地進行資料分析和預測。

面向資料分析的深度可視化,易用性大幅提高

StellarDB5.0對可視化元件KG Explorer進行深度更新,包括全新的UI界面,支援圖算法的可視化、支援動态圖時間軸可視化以及豐富的資料互動分析輔助功能,如案例上傳下載下傳,将易用性和實用性相結合,加速企業資料分析和業務創新。

星環科技分布式圖資料庫StellarDB5.0:萬物互聯,一觸即“答”
星環科技分布式圖資料庫StellarDB5.0:萬物互聯,一觸即“答”

突破資料模型屏障,挖掘資料融合分析價值

大資料時代資料量井噴、業務融合多樣化,企業需要部署多個不同類型的資料庫用來存儲不同的資料類型,而在做一些複雜業務分析時需要多種類型資料進行聯合分析。但資料庫與資料庫之間的不相容,資料需要導入導出複雜操作等給企業業務發展帶來了很大的阻礙。

基于星環科技多模型統一技術架構,StellarDB5.0能夠與關系型資料、時序資料、時空資料等不同類型資料進行統一存儲管理,并能夠實作跨資料模型聯合查詢分析。例如,将用于資料關聯的圖場景StellarDB和用于OLAP場景的星環關系型分析引擎Inceptor聯合,通過星環科技自研的統一編譯器,使用者隻需一條SQL語句,即可實作兩種類型資料的關聯查詢,大大簡化了開發複雜度和使用者操作。同時資料也仍保留在原存儲引擎中,不用對資料進行導入導出,不會存在資料不一緻或資料備援存儲的問題。

更多提升和新能力,加速圖資料應用創新

StellarDB5.0針對開發者,新增了ORM程式設計,優化了Java SDK負載均衡和重試機制,并進一步完善了Python SDK的能力,提高Python應用快速對接圖技術的效率。

在運維方面,StellarDB5.0進一步優化了運維管理路徑,對資料副本遷移功能進一步優化,讓資料副本維護變得更加輕松。

StellarDB5.0在性能、智能化、可視化、資料融合分析等方面的疊代更新,能夠更好地服務客戶,讓使用者能夠感受到資料互聯的價值,助力每一個企業的業務創新。

繼續閱讀