天天看點

「萬字長文系列」帶你理清圖資料庫 & 圖計算

作者:DataFunTalk

引言:本文将圍繞圖資料庫、圖計算、圖學習三大版塊,為大家揭秘關于“圖”的奧秘。

「萬字長文系列」帶你理清圖資料庫 & 圖計算

01.

圖庫資料

1.圖資料庫的産生背景

網際網路和移動網際網路的快速發展,帶來了資料産生速率的指數級增長,呈現出從資料到大資料,再到深資料(也就是圖資料)的一路演變。資料量也呈現出了海量、複雜、多變等特點。

現代商業社會對資料庫性能方面的要求,推動了資料處理基礎架構與技術的發展,資料庫引擎的類型也随着資料從簡單到複雜;從鍵值資料庫、列存儲資料庫、文檔資料庫、關系型資料庫到圖資料庫一路與時俱進,每一類都有各自的特性。

但值得一提的是,隻有圖資料庫才具有将資料中的實體關聯起來,100%映射和反應出它們在真實世界中的關系,并能發現資料間的深度的關聯關系,且以直覺高效的資料表達方式。

「萬字長文系列」帶你理清圖資料庫 & 圖計算

2.圖存儲與圖算力

所有圖計算或圖分析平台的底層一定會用到圖存儲的技術。差別在于有的是原生圖存儲,有的是非原生圖存儲。例如使用列資料庫、鍵值資料庫、文檔資料庫或關系型資料庫來實作圖存儲就是非原生圖存儲。原生圖存儲通常會強調存儲效率更高、原生化的支援圖中高維的關聯關系的表達與查詢等。高性能存儲的特點就是要具備通路高效、更新高效和存儲高效的疊加。

但是,我們要知道,圖資料庫的發展要解決的并不是數倉、湖倉系統所鼓吹的無限的資料存儲,而是要解決複雜查詢、深度查詢的計算時效性的問題!

這也是為什麼圖資料庫不能隻存不算,如果隻強調存儲的話,用任何其它資料庫都可以。但作為圖資料庫,必須要具有算力,而圖資料庫的算力特點就是深度下鑽的能力,如果連這個能力都不具備,還要自稱為圖資料庫,那一定是妥妥的騙局了。

在傳統的RDBMS資料庫(RDBMS/SQL)中,計算是附着于存儲的二等公民,每次查詢都需要大量通路硬碟讀取資料的查詢,效率必然是極低的。試想,以金融業務為例,它的業務是瞬息萬變的,更多的時候需要更高的計算效率,盡管很多數倉都宣稱對SQL查詢可以進行加速,但是數倉加速的邏輯是基于更多的表(中間表、臨時表)、更寬的表對資料進行了各種抽取、組合,在本質上并沒有改變資料編織的低維性(二維表)。是以,高性能的圖資料庫一定是優先解決算力的問題,即具備高算力,讓計算引擎成為一等公民!

3.圖資料庫VS傳統關系型資料

在傳統關系型資料庫中,難以簡捷地表達業務所需的多元關聯關系,尤其是涉及到多表關聯查詢時,計算量與表内資料量的笛卡爾乘積等比例增長,資料量越大,表關聯越多、越複雜,效率越低;而(高性能)圖資料庫采用的計算存儲邏輯是:近鄰無索引與關聯計算(查詢)模式,計算複雜度低,計算與分析效率指數級提升。

圖資料庫中的高維關系的建構隻依賴兩大類最基礎的中繼資料類型:頂點與邊,我們也通常稱作實體與關系。用圖資料庫可以簡單、高效、自由,并且非常自然的表達真實世界中的關聯關系。這種100%還原世界的能力,讓圖資料庫比關系型資料庫或其它類型的資料庫或大資料處理架構可以更加快速、深度、準确的挖掘事物間的關聯關系。

我們看到,相比于傳統的關系型資料庫中的關系表所展現的二維性,圖資料庫就具備了符合人類大腦思維習慣的高維表達能力——所想(見)即所得。通過節點和節點相關聯,就能信手拈來地通過圖資料去直接地建構真實世界中的屬性和關系,且模組化簡單,性能強勁,搜尋功能豐富,擴充性強。

「萬字長文系列」帶你理清圖資料庫 & 圖計算

4.圖語言的設計

一門先進的(資料庫)查詢語言的優美感,不是通過它到底有多複雜,而是通過它有多簡潔來展現的。而且,資料庫查詢語言不應該隻是資料科學家、分析員的專有工具,任何業務人員都可以并應該掌握一門查詢語言。是以,它應該具備易學、易懂,高性能以及系統的底層複雜性不應該暴露到語言接口層面這樣的一些特性,也就是說所有資料庫底層的架構、工程實作的複雜性,應當服務于便于使用。

特别是最後一點,如果讀者真正使用過SQL、Cypher 或GraphSQL,那麼你就會知道它們中的嵌套邏輯是多麼複雜,而Ultipa GQL貼近自然語言的表達方式,支援兼具 schematic 與 schema-free 的半模式(demi-schema)模式,以支援最大靈活度的圖資料操作,所見即所得。

「萬字長文系列」帶你理清圖資料庫 & 圖計算

5.從SQL到GQL

作為資料庫行業的第一個國際标準——SQL已發展将近半個世紀了,并且疊代了很多版本。然而,關系型資料庫以及采用SQL查詢語言,始終存在一個“弱點”,那就是很難做到簡捷進行遞歸查詢,例如下鑽、穿透、歸因、溯源分析、深度路徑分析、複雜情景模拟與全場景壓力測試等,最終造成時效性差。

從關系型資料庫(及數倉、數湖)向圖資料庫的遷移是個不可逆的趨勢,它背後的推動因素主要是工業界和學術界亟需一種新型的、高效的、靈活的、高維的架構出現。

也是以,GQL作為繼SQL的國際标準語言,成為自1983年以來,唯一一個即将在今或明年面世的國際圖資料庫語言标準,這可謂是大衆所盼之事,同時也是圖資料庫技術未來影響力和重要性的有力展現。

「萬字長文系列」帶你理清圖資料庫 & 圖計算

02.

圖計算

1.圖計算與圖資料庫的差異:

圖計算(graph computing)與圖資料庫(graph database)之間的差異是很多剛接觸圖的人不容易厘清的。盡管在很多情況下,圖計算可以和圖資料庫混用、通用。但是,它們之間存在很多不同。

(1)圖計算:

  • 圖計算可以簡單地等同于圖處理架構、圖計算引擎(graph computing engines),它的主要工作是對已有的資料進行計算和分析。圖計算架構多數都出自學術界,這個和圖論自20世紀60年代與計算機學科發生學科交叉并一直不斷演化有關。
  • 圖計算架構在過去20年中,主要發展是在OLAP(聯機分析處理)場景中進行資料批處理。

(2)圖資料庫:

  • 圖資料庫的出現要晚得多,最早可以稱之為圖資料庫的也要到20世紀90年代,而真正的屬性圖或原生圖技術在2011年後才出現。
  • 圖資料庫的架構主要功能可以分為三大部分:存儲、計算與面向應用的服務(例如資料分析、決策方案提供、預測等)。其中計算部分,包含圖計算,但是圖資料庫通常可以處理AP與TP類操作,也就是說可以兼顧OLAP與OLTP(線上事務處理),兩者的結合也衍生出了新的HTAP類型的圖資料庫,簡言之,從功能角度上看,圖資料庫是圖計算的超集。

(3)重要差異點小結:

  • 圖計算與圖資料庫有個重要的差異點:圖計算通常隻關注和處理靜态的資料,而圖資料庫則能處理動态的資料。換言之,圖資料庫在資料動态變化的同時能保證資料的一緻性,并能完成業務需求。這兩者的差別基本上也是AP和TP類操作的差別之所在。
  • 多數圖計算架構都源自學術界,其關注的要點和場景與工業界的圖資料庫有很大的不同。前者在建立之初大都面向靜态的磁盤檔案,通過預處理、加載入磁盤或記憶體後進行處理;而後者,特别是在金融、通信、物聯網等場景中,其資料是不斷流動、頻繁更新的。靜态的計算架構不可能滿足各類業務場景的需求,這也催化了圖資料庫的不斷疊代。
  • 再者,圖計算架構一般隻關注圖本身的拓撲結構,并不需要理會圖上的點和邊的複雜屬性問題,而這對于圖資料庫而言則是必須關注的。事實上,目前很多所謂的圖資料庫并不具備在下鑽查詢時(例如路徑查詢、K 鄰查詢、圖算法等場景下)對點、邊屬性進行無差别過濾的能力。
「萬字長文系列」帶你理清圖資料庫 & 圖計算

2.OLAP VS OLTP

從另外一個次元,也就是從資料處理模式的次元來看,圖計算是側重于OLAP,也就是線上分析的處理上,它更偏向于線下、批處理、非實時模式的資料分析。

而圖資料庫則更多需要先具備線上、實時的資料更新的能力,也包括讀寫、删除、資料一緻性保持的能力,并在此基礎上通過架構層面的擴充性(包括分布式)來支援OLTP與OLAP的融合,業界也稱之為HTAP模式,即在一個圖資料庫的叢集内同時可以支援OLTP與OLAP的工作模式——它本質上的邏輯是一方面允許資料庫的增删改查(以及資料一緻性保持),另一方面允許處理複雜的圖查詢與算法。

「萬字長文系列」帶你理清圖資料庫 & 圖計算

3.哪些場景必須要用圖資料庫

在之前圖計算與圖資料庫的差異對比中,我們了解到,差別于圖計算在學術範疇中的應用,圖資料庫更廣泛适用于在嚴苛的工業環境中大展身手,适用于任何複雜場景的分析。

那麼,有哪些場景是必須要用到圖資料庫,如果用圖計算架構(也包含知識圖譜等)是無法應對的呢?

一是對分析深度有要求的;二是對分析次元有要求的;三是對分析準确度有要求的;四是對時效性有要求的;五是對靈活性有要求的;六是對可解釋性有要求的;七是對可視化有要求的,八是對資料的實時性有要求的。

以上八大類的需求場景,以及多類之間的任意組合,可以說是無法窮舉。再加上SQL和傳統資料庫、數倉“肆虐”多年,早已讓企業不堪負重,從五花八門的資料治理到數字資産管理,再到各類業務資料分析、BI需求,可以說圖資料庫的應用場景是不計其數的。

「萬字長文系列」帶你理清圖資料庫 & 圖計算

4.圖算法解決的典型問題

(1)BFS和DFS:

圖的廣度優先搜尋和深度優先搜尋對于擷取圖的結構資訊具有重要的作用,很多圖相關的算法都是建立在對圖的結構進行搜尋的基礎上。如最小生成樹算法、Dijkstra最短路徑算法都采用了和BFS相似的思想。

那麼,什麼是廣度和深度優先搜尋呢?顧名思義,作為圖的搜尋算法,人們依據搜尋的順序不同,将其分為“廣度優先搜尋(BFS)”和“深度優先搜尋(DFS)”兩種。

在圖論中,廣度優先搜尋指的是從某個頂點出發,由淺及深的周遊、搜尋相鄰頂點的方式。它必須先把前一層的鄰居都周遊完畢後,才可以周遊之後一層的鄰居。

相對于廣度優先的橫向優先搜尋而言,深度優先搜尋則是縱向優先搜尋,它會從目前頂點出發先深度的探索,在到達最大限定的搜尋深度後或目前路徑上無路可尋時折傳回到上一層繼續搜尋,直到找到符合搜尋終止條件的點、邊結束,或周遊完全圖而結束。必須指出,目前很多圖資料庫廠家的基礎圖查詢實作都存在有邏輯錯誤、結果錯誤的問題。舉兩個例子:

  • K 鄰查詢是否支援指定某一深度傳回其全部鄰居,即傳回第 K 層的全部鄰居。很多圖資料庫隻支援傳回 1 到 K 層的鄰居,但是不支援第 K 層(或任意其它層級)的鄰居!大家應該明白,這兩種模式之間有着計算複雜度的天壤之别 —— 支援僅傳回第 K 層的模式,需要更強的算力、周遊模式與資料結構支撐,而第 1-至-第 K 層傳回的模式,則是典型的一鍋燴,其算法複雜度不可同日而語,而且極有可能是實作邏輯錯誤,無法嚴格區分某個鄰居的最短路徑距離。
  • 超級節點是否可以窮舉周遊與穿透的問題:某些圖資料庫系統宣稱在遇到超級節點時,采用抽樣的邏輯,這是典型的謬誤!無論是否是超級節點,如果對其進行穿透,例如查詢其 3-hop 鄰居,必須采用全量計算的邏輯,豈能“抽樣”來糊弄了事?以 Twitter 資料集為例,14.7 億條邊,4200 萬頂點,其中有大量頂點存儲在百萬條以上關聯邊(關系),在圖查詢上,遇上這些(超級)頂點的機率很大,圖計算是要求精準計算的,豈能采用抽樣的方式來傳回結果呢?

(2)單邊圖和多邊圖:

還有一組概念,在這裡具體闡述一下,單邊圖和多邊圖,又叫做簡單圖和複雜圖。

顧名思義,在圖中,任意兩個頂點間隻能存在一條邊的情況,在圖論中的定義為單邊圖。反之,可以存在多條邊的情況,就是多邊圖。

我們知道,要更自然的表達真實世界,顯然是需要多邊圖的。否則的話,就需要制造大量的實體和沒有太多意義的關聯邊來構圖,會造成的後果之一就是效率低下。

「萬字長文系列」帶你理清圖資料庫 & 圖計算

03.

圖學習

1.揭開圖的面紗

(1)圖的源起:

其實,“圖”并不是一個新生事物或新概念,它最早起源于300年前數學家歐拉送出的一篇名為《哥尼斯堡的七座橋》的論文,這也成為圖論和拓撲學最早的開端。

在歐拉之後,直到上世紀六十年代,才出現了随機圖理論,也是從彼時開始,圖論由紙上談兵轉為大量的實際應用,比如地圖染色算法、最短、最優路徑計算,動态規劃,社群識别等各類圖算法等。

(2)什麼是圖:

那麼,什麼是“圖”呢?就是由點和連接配接每對點的邊所構成的圖就叫做“圖”。

它的“特長”就是非常地擅長對海量的、複雜的、多變的資料之間的關系,進行處理、運算和分析。而且,“圖”是一種能對現實世界進行直覺模組化的工具,這也符合人類大腦的思維習慣。

符合人類大腦的思維習慣的方式,是一種高維性的展現,它不僅能夠随着人類的思考方式進行無限延展,通過節點和節點相關聯,就能信手拈來地建構出真實世界中的屬性和關系,同時能夠建立起深刻的洞察(深圖周遊)力。

「萬字長文系列」帶你理清圖資料庫 & 圖計算

2.為什麼是圖?

物流、金融、交通、傳媒、電信、電力、醫療…… 時至今日, 圖技術在各行各業的應用,早已無處不在。

因為圖是一種處理互聯資料的理想技術,通過顯性地模組化關系,可以對顯示世界進行自然表達,如,計算機網絡、實體學中的粒子結構、社交網絡以及食物鍊都可以用圖結構來表達。

同時,因為它還具備強大的圖分析能力,能幫助人們快速地發現薄弱環節、提供改進機會,能夠深度洞察的能力,幫助人們發現背後的真相。

此外,它還具備能夠輕松擴充以及強大的表現力——用機器學習方法分析圖的研究越來越受到重視。

「萬字長文系列」帶你理清圖資料庫 & 圖計算

3.圖算法

在我們日常的生活和工作中,人與人、人與物、物與物之間的互動都離不開“計算”二字。在這一背景下,算法就閃亮登場了。

圖算法提供了一種最有效的分析連接配接資料的方法,它們描述了如何處理圖以發現一些定性或者定量的結論。

圖算法基于圖論,利用節點之間的關系來推斷複雜系統的結構和變化。我們可以使用這些算法來發現隐藏的資訊,驗證業務假設,并對行為進行預測。

圖算法可以看作一種特殊的圖查詢語句。如果按照計算複雜度來衡量,有的圖算法是針對個體節點的,有的是針對全量資料的,後者往往因為計算量巨大,而通常在中、大圖上(百萬或千萬量級以上)以批處理的方式運作;有的圖算法是求精确解的,有的則通過求近似解的方法來以較低(指數級地節省計算資源與降低時耗)的成本“推測”答案。

關于圖算法的分類,業界并沒有嚴格意義上的共識。側重于學術研究的圖計算架構甚至會把廣度優先或深度優先搜尋作為算法單列,盡管它們更适合作為一種圖周遊模式存在。還有的像最短路徑算法,在20世紀計算機發展的前30年間,最短路徑算法不斷推陳出新,對計算機體系架構的發展有很大的推動作用。

圖算法具有廣泛的應用範疇,從防止欺詐,優化呼叫路由,到預測流感的傳播,以及優化管道、通訊網絡、航路選擇等等。

Ultipa 提供了豐富的圖算法包(50+種通用圖算法,以及 50+定制圖算法,總計超過 100 種圖算法 —— Ultipa 也是目前業界擁有最為完備的線上圖算法文檔的圖資料庫産品),一些全圖、全量資料運作的算法,可通過異步任務的方式達到近實時的效果。

同時,Ultipa 算法包支援熱插拔、可擴充接口。可以進行熱更新,并且支援可程式設計擴充接口來根據業務需要進行圖算法定制,并能充分的利用 Ultipa 的高密度并發圖計算引擎的性能優勢來實作圖算法的高效運作,節省 90%以上的時耗及資源消耗。

「萬字長文系列」帶你理清圖資料庫 & 圖計算

4.實時圖資料庫(圖計算)、知識圖譜與高可視化的有機統一

通用的知識圖譜的建設在很長一段時間内都着重在 NLP和可視化呈現等方面,但忽略了計算時效性、資料模組化靈活性、查詢(計算)過程與結果可解釋性等問題。

尤其是在整個世界從大資料時代向深資料時代轉型的當下,過去傳統的基于SQL或 NoSQL建構的圖譜的缺陷,已無法高效去處理海量、複雜、動态的資料的能力。

在2020年之前, 極少有人真正關注底層算力,幾乎所有的知識圖譜系統建設,都僅僅是圍繞 NLP 和可視化這兩部分。而沒有底層算力支撐的知識圖譜,隻是在本體與三元組的抽取和建構,并不具備解決深度的查詢、速度和可解釋性等問題的能力。

我們看到,在實時圖資料庫(圖計算)引擎的幫助下,産業界可以實時地在不同資料間找到深度關聯的各種關系,甚至可以找到最優的、人腦都無法企及的智能途徑——這就是源于圖資料庫的高維性。

何為高維性?圖不僅僅作為一種符合人類大腦思維習慣、能對現實世界進行直覺模組化的工具,同時能夠建立起深刻的洞察力。

諸如大家都知道“蝴蝶效應”,就是在海量的資料和資訊中,去捕捉看似毫無關系的兩個以上的實體之間的微妙關系,這從資料處理架構的角度來看,如果沒有圖資料庫(圖計算)技術的幫助是極難實作的。

以查找企業最終受益人為例。此類問題的挑戰在于,現實世界中,最終受益人與被檢查公司實體之間,經常相隔許多節點,也就是空殼公司實體,又或者多個自然人或公司實體之間通過多條投資、參股路徑對其它公司進行控制。傳統的關系型資料庫或文檔資料庫,甚至多數的圖資料庫,都無法實時解決這類圖譜穿透問題。圖資料庫系統解決了以上諸多挑戰。

同時,還有靈活性。圖譜系統的靈活性可以是個非常廣泛的話題,大體包含資料模組化、查詢與計算邏輯、結果呈現、接口支援、可擴充性等幾個部分。

此外,圖譜系統除了上面提到的以外,還需要有白盒化(可解釋性)、表單化(低代碼、無代碼)以及以所見即所得的方式賦能業務的能力,總結說就是圖技術=增強智能+可解釋 AI,它是 AI 與大資料發展過程中融合的必然産物。

「萬字長文系列」帶你理清圖資料庫 & 圖計算

04.

圖應用

1、圖在全行業的應用

圖資料庫技術是大資料與人工智能AI技術不斷發展、互相滲透、直至融合的必然結果。進入21世紀以來,對于所有技術驅動的新型公司,使用圖資料庫(圖計算)技術并不罕見。例如,我們日常生活中使用的導航、社交搜尋、物品推薦,工業生産中的資源排程、地圖染色等都源于它。而且,今天很多大型網際網路公司、金融科技公司都是基于圖技術起家的。

  • 金融服務:金融領域中的許多問題都涉及到複雜的資料關系,如投資組合優化、客戶風險評估等。
  • 社交網絡:圖資料庫可以幫助社交網絡提供更好的推薦算法,實作更精準的比對。
  • 醫療保健:醫療保健領域中的資料非常複雜,包括醫療記錄、醫療裝置、醫療服務等多個方面。
  • 電力與能源:電力和能源行業需要處理大量的裝置、供應商、能源來源等資料,圖更好地管理和分析這些資料,優化能源生産和配置設定,提高效率。
  • 物流與供應鍊:物流和供應鍊領域涉及大量的供應商、分銷商、運輸方式等複雜關系。
  • 零售業:可賦能零售商更好地分析和管理客戶、産品、庫存等資料,實作更精準的推薦算法。
  • 政企:路網規劃、智能交通、疫情精準防疫等等。
  • 電商推薦:随着海量資料湧現,圖資料庫技術可賦能于全行業的各種場景應用中。
「萬字長文系列」帶你理清圖資料庫 & 圖計算

2.圖在金融行業的應用

在金融場景中,圖資料庫技術可以幫助金融機構更好地了解資料之間的關系,進而更好地管理和分析資料,提高決策效率和風險控制能力。圖資料庫技術與金融場景主要在如下幾個方面進行深度融合。

  • 一是金融風險管理。圖資料庫可以将客戶、賬戶、交易、事件等多元度的資料整合到一個平台,利用計算、圖查詢、圖分析等技術進行風險識别和管理。通過分析客戶和賬戶之間的關聯關系、賬戶之間的資金流轉關系等,更好地發現潛在風險,及時采取相應的措施。
  • 二是金融欺詐檢測。圖資料庫可以将金融交易資料存儲為點和邊的形式,這樣可以更友善地發現交易之間的關聯關系。例如,同一人在不同時間、不同地點使用不同的賬戶進行交易,這些行為可能表明欺詐行為的存在。通過對這些關聯關系進行分析,可以更高效、更準确地識别和預防欺詐行為。
  • 三是知識圖譜建構。金融機構可以利用圖資料庫技術建構知識圖譜,将客戶、賬戶、交易、風險、合規等相關資訊進行整合形成一個圖譜。這樣可以更好地實作對客戶360度全景視圖,更快地識别客戶需求、風險和潛在機會。需要注意的是,盡管很多廠家都可以構造圖譜,但是,缺乏圖資料庫的算力支撐的圖譜,效率是非常低下的。
  • 四是市場營銷分析。圖資料庫可以幫助金融機構更好地了解市場、行業、公司之間的關聯關系。例如公司之間的合作、競争、股權交易等。這樣可以更好地預測市場趨勢,優化投資組合。
「萬字長文系列」帶你理清圖資料庫 & 圖計算

3.反洗錢(AML)案例

我們知道,洗錢手段是複雜多樣的,而且,洗錢及相關上遊犯罪呈上升趨勢,在金融機構合規管理之中,它是一項非常重要的内容,屬于典型的監管科技應用。

為了逃避偵查,洗錢分子在進行交易時,往往會制造出錯綜複雜的關系,使資金網路内節點衆多交錯,是以圖技術在反洗錢(AML)方面有廣泛的應用,通過天然的圖的複雜網絡分析能力和超強算力能力,能夠更準确、更高效地識别洗錢交易。以下是一些圖資料庫在反洗錢領域中的應用方面:

  • 實體關系分析:圖資料庫可以用于建立和維護不同實體(如個人、組織、賬戶等)之間的複雜關系網絡。通過這些關系網絡,可以檢測到洗錢行為中隐藏的模式和連接配接,如通過虛假賬戶進行資金轉移、多個賬戶之間的交易模式等。
  • 風險評估:圖資料庫可以整合和分析來自多個資料源的資訊,如交易記錄、客戶資料、開資料等,以繪制客戶和賬戶的全面畫像。通過分析這些資料的關系和屬性,可以進行風險評估并識别潛在的洗錢風險。
  • 異常檢測:圖資料庫可以監測和分析大規模的交易資料,以便及時識别異常模式和行為。例如,如果一個賬戶與大量與洗錢有關的實體有關聯,或者賬戶的交易模式與同類賬戶明顯不同,就可能存在洗錢風險。圖資料庫可以幫助發現這些異常模式,并提供警報和推薦的行動。
  • 實時分析:圖資料庫的優勢之一是能夠處理實時資料,并快速更新和查詢圖結構。這對于反洗錢來說非常重要,因為洗錢行為可能是動态變化的。圖資料庫可以通過實時分析來及時發現和應對新出現的洗錢模式和政策。
  • 可視化分析:圖資料庫可以通過可視化工具将複雜的關系網絡呈現給分析人員,幫助他們更好地了解和發現洗錢行為。可視化分析可以揭示隐藏的模式、群組和其他結構,進而幫助分析人員做出更準确的決策。
「萬字長文系列」帶你理清圖資料庫 & 圖計算

4.圖在醫療行業的應用

圖資料庫在醫療行業中有許多應用,随着技術的不斷發展和創新,圖資料庫在醫療領域的應用前景仍然廣闊,以下是其中一些常見的應用場景:

  • 藥物研發和發現:圖資料庫可以幫助科研人員分析藥物、疾病和基因之間的關系。通過建構藥物-靶标-疾病關聯的網絡,可以發現新的治療方法、藥物靶點和藥物組合,加快藥物研發過程。
  • 臨床決策支援:圖資料庫可以整合和分析臨床資料、患者資料和醫學知識,幫助醫生做出更準确的診斷和治療決策。通過建構患者的健康資料圖譜,可以提供個性化的治療方案和預測風險。
  • 醫療資源管理:圖資料庫可以用于管理醫療資源,例如醫院設施、醫生和患者之間的關系。通過分析資源之間的連接配接和使用情況,可以優化醫療資源的配置設定和利用,提高醫療服務的效率和品質。
  • 健康監測和預測:圖資料庫可以整合和分析大規模的健康資料,例如傳感器資料、基因組學資料和生物标志物資料。通過建構健康資料圖譜,可以監測個體或群體的健康狀态,并進行風險預測和疾病預防。
  • 疾病網絡分析:圖資料庫可以用于建構疾病之間的關聯網絡,幫助醫療專業人員了解疾病之間的關系、風險因素和傳播路徑。通過分析這些網絡,可以提供更好的診斷和治療決策支援,等等。
「萬字長文系列」帶你理清圖資料庫 & 圖計算

6、圖在疫情防控方面的應用

我們知道,病毒傳播的資料具有高關聯性和碎片化的特征,也就是具備了規模性與散發聚集性并存、多點多源多鍊的特點。

「萬字長文系列」帶你理清圖資料庫 & 圖計算

Ultipa 實時圖資料庫分析平台,針對病毒傳播速度快、傳染性強的特點,充分發揮圖計算的算力強、算法準、資料可視化的優勢,同時利用圖的天然特征,可以快速地利用點和邊為基礎單元來建構資料管理,通過人工智能輔助決策,科學、高效進行管理。

綜上所述,從技術上來講,全球各行各業都面臨着數字化轉型的挑戰與機遇。數字化轉型在技術本質上是從傳統的關系型資料庫向大資料、快資料再到深資料(關聯資料、圖資料)轉型的挑戰。

知識圖譜與圖資料庫的結合将會幫助各行各業加速實作資料中台的業務建設,賦能組織更好地運籌帷幄且決勝千裡。

謝謝大家。對“圖”有更多興趣的朋友,可以詳細閱讀機械工業出版社出版的《圖資料庫原理、架構與應用》一書,由 Ultipa 的技術專家團隊傾情奉獻,也是國内第一部圖資料庫領域的專著,讓你全面了解“圖”技術。謝謝!

「萬字長文系列」帶你理清圖資料庫 & 圖計算

(注:本文為知識圖譜知識地圖釋出會圖資料庫部分的視訊整理,視訊連結: https://pan.baidu.com/s/14_rl7fbwAAPzsCxYuhwUHg,提取碼: w2kb)

- End -

分享嘉賓:孫宇熙

視訊錄音:孫婉怡

繼續閱讀