天天看點

阿裡雲圖資料庫GraphDB上線,助力圖資料處理GraphDB簡介GraphDB特性雲上大規模GraphDB優勢使用阿裡雲GraphDB

GraphDB簡介

GraphDB圖資料庫适用于存儲,管理,查詢複雜并且高度連接配接的資料,圖庫的結構特别适合發現大資料集下資料之間的共性和特性,特别善于釋放蘊含在資料關系之間的巨大價值。GraphDB引擎本身并不額外收費,僅收取雲hbase費用。

适合的業務場景

在如下多種場景中圖資料庫比其他類型資料庫(RDBMS和NoSQL)更合适

推薦及個性化

幾乎所有的企業都需要了解如何快速并且高效地影響客戶來購買他們的産品并且推薦其他相關商品給他們。這可能需要用到雲服務的推薦,個性化,網絡分析工具。

如果使用得當,圖分析是處理推薦和個性化任務的最有效武器,并根據資料中的價值做出關鍵決策。

舉個例子,網絡零售商需要根據客戶過往消費記錄及訂單推薦其他商品給這個客戶。為了能成功的達到目的,目前回話下使用者浏覽操作等都可以實時內建到一張圖中。

圖非常适合這些類似的分析用例,如推薦産品,或基于使用者資料,過去行為,推薦個性化廣告。

電商商品推薦案例

如何使用GraphDB做商品實時推薦

安全和欺詐檢測

在複雜及高度相關的使用者,實體,事務,時間,互動操作的網絡中,圖資料庫可以幫助檢測哪些實體,交易,操作是有欺詐性質的,進而規避風險。簡而言之,圖資料庫可以幫助在數不清金融活動中産生的關系及事件組成的海量資料集中找到那根壞針。

某深圳大資料風控案例

客戶介紹:

該大資料有限公司專注于為銀行、消費金融、三方支付、P2P、小貸、保險、電商等客戶解決線上風險和欺詐問題。

案例背景及痛點

近幾年網際網路金融行業興起,誕生了很多網際網路金融企業,使用者參加線上貸款,金融消費,P2P融資等金融活動門檻大大降低,在這些金融行為中如何有效規避風險,進行風控是每個金融企業面臨的比較嚴峻的問題。使用者的金融行為中會沉澱大量有價值的資料,在白騎士客戶小貸場景中會産生一筆筆貸款記錄關聯的手機号,身份證,銀行卡号,裝置号等。這些資料代表一個個實體人,正常金融活動中,貸款,金融服務不是高頻行為,一個實體人一般有一個唯一身份證,常用銀行卡号,手機号,裝置号。這幾者頂點見不會産生高密度圖,但有一些高危低信用使用者可能會使用同一手機裝置申請貸款進行騙貸。客戶痛點在于如何高效識别這些高危低信用使用者。

解決方案

建立圖模型

阿裡雲圖資料庫GraphDB上線,助力圖資料處理GraphDB簡介GraphDB特性雲上大規模GraphDB優勢使用阿裡雲GraphDB

分别建立手機号,裝置号,身份證,銀行卡号四類頂點及互相關聯的邊,擴充屬性便于查詢。從原資料倉庫清洗後通過

graph-loader

工具導入GraphDB

線上評估使用者信用資質

在申請貸款流程中,可以通過使用圖庫可以實時查詢圖中任意一手機号關聯的身份證數量(一跳/二跳查詢),惡意申請有如下特點,關聯子圖各類頂點過多,并且可能關聯上離線分析标注過得黑名單使用者,說明目前使用者存在惡意申請風險,實時拒掉貸款申請。下圖顯示如何與自身小貸平台打通,做實時風控預警,箭頭方向代表資料流方向。

阿裡雲圖資料庫GraphDB上線,助力圖資料處理GraphDB簡介GraphDB特性雲上大規模GraphDB優勢使用阿裡雲GraphDB

主動識别黑名單使用者

借助spark graphframes分析能力,離線計算全圖中各個頂點出入度及pagerank,主動挖掘超級頂點,超級頂點如一個手機号關聯了多個身份證頂點,說明該使用者金融活動頻繁,背後的故事是一個實體人有多筆申請記錄,分别關聯了不同的身份證,手機号,說明該使用者在進行惡意欺詐活動,人工标注黑名單使用者,從源頭禁掉使用者金融活動。

物聯網

物聯網(IoT)是另一個非常适合圖資料庫領域。 物聯網使用案例中,很多通用的裝置都會産生時序相關的資訊如事件和狀态資料。

在這種情況下,圖資料庫效果很好,因為來自各個獨立的終端的流彙聚起來的時候産生了高度複雜性

此外,涉及諸如分析根本原因之類的任務時,也會引入多種關系來做整體檢查,而非隔離檢查。

GraphDB特性

整體架構

阿裡雲圖資料庫GraphDB上線,助力圖資料處理GraphDB簡介GraphDB特性雲上大規模GraphDB優勢使用阿裡雲GraphDB

使用Apache TinkerPop建構

GraphDB是Apache TinkerPop3接口的一個實作,支援Tinkerpop全套軟體棧,支援Gremlin語言,可以快速上手。

在GraphDB中,為應對不同的業務場景,資料模型已經做到盡可能的靈活。例如,GraphDB中點和邊均支援使用者自定義ID;自定義ID可以是字元串或數字;屬性值可以是任意類型,包括map,數組,序列化的對象等。是以,應用不需要為了适應圖資料庫的限制而做多餘的改造,隻需要專注在功能的實作上面。

GraphDB具有完善的索引支援。支援對頂點建立label索引和屬性索引;支援對邊建立label索引,屬性索引和頂點索引;支援頂點索引和邊索引的範圍查詢和分頁。良好的索引支援保證了頂點In/Out查詢和根據屬性查找頂點/邊的操作都具有很好的性能。

與HBase深度內建

GraphDB使用企業認證的HBase版本作為其持久資料存儲。 由于與HBase的深度內建,GraphDB繼承了HBase的所有主要優勢,包括服務可用性名額,寫/讀/時刻都線上高可用功能,線性可擴充性,可預測的低延遲響應時間,hbase專家級别的的運維服務。 在此基礎上,GraphDB增強了性能,其中包括自适應查詢優化器,分片資料位置感覺能力。

使用spark graphframes做圖分析

借助阿裡雲HBase X-Pack提供的Spark産品,可以對GraphDB中的圖資料進行分析。作為優秀的大資料處理引擎,Spark能夠對任意資料量的資料進行快速分析,Spark支援scala、java、python多種開發語言,可本地調試,開發效率高。此外,阿裡雲HBase X-Pack的Spark服務通過全托管的方式為使用者提供企業級的服務,大大降低了使用門檻和運維難度。Spark GraphX中内置了常見的圖分析操作,例如PageRank、最短路徑、聯通子圖、最小生成樹等。

雲上大規模GraphDB優勢

全托管,全面解放運維,為業務穩定保駕護航

大資料應用往往涉及元件多、系統龐雜、開源與自研混合,是以維護更新困難,穩定性風險極高。雲HBase GraphDB提供的全托管服務相比其他的半托管服務以及使用者自建存在天然的優勢。依托持續8年在核心和管控平台的研發,以及大量配套的監控工具、跨可用區、跨域容災多活方案,GraphDB的底層核心阿裡雲HBase提供目前業界最高的4個9的可用性(雙叢集),11個9的可靠性的高SLA的支援,滿足衆多政企客戶對平台高可用、穩定性的訴求。

使用阿裡雲GraphDB

GraphDB引擎包含在HBase 2.0版本中,使用者在購買雲上HBase資料庫服務時,可以選擇GraphDB作為其圖資料引擎。GraphDB引擎本身并不額外收費,對于需要使用圖資料功能的使用者而言,将大幅降低應用和開發成本。

了解更多關于阿裡雲雲資料庫HBase及圖引擎GraphDB請戳連結:

産品入口:

https://cn.aliyun.com/product/hbase?spm=5176.224200.100.35.7f036ed6YlCDxm

幫助文檔:

https://help.aliyun.com/document_detail/92186.html?spm=a2c4g.11174283.6.610.260d3c2eONZbgs