天天看點

知識圖譜_示例圖

知識圖譜這個網絡具備以下3種特性:

1.1 由節點(Point)和邊(Edge)組成

1.2 每個節點表示現實世界中存在的“實體”,每條邊為實體與實體之間的“關系”

1.3 知識圖譜是關系的最有效的表示方式

是以,知識圖譜本質上就是語義網絡,是一種基于圖的資料結構;

2 知識圖譜能幹什麼?

先按知識圖譜應用的深度主要可以分為兩大類:

一是通用知識圖譜,通俗講就是大衆版,沒有特别深的行業知識及專業内容,一般是解決科普類、常識類等問題。

二是行業知識圖譜,通俗講就是專業版,根據對某個行業或細分領域的深入研究而定制的版本,主要是解決目前行業或細分領域的專業問題。

下面我根據這兩大類,分别從知識圖譜應用的廣度進行介紹:

2.1 通用知識圖譜

我們日常見到的都是通用知識圖譜,主要應用于面向網際網路的搜尋、推薦、問答等業務場景;

先列舉3個通用知識圖譜的案例:

2.1.1、百度知識圖譜(http://tupu.baidu.com/)

知識圖譜_示例圖

2.1.2、搜狗搜尋(https://www.sogou.com/)

知識圖譜_示例圖

2.1.3、360搜尋(https://www.so.com)

知識圖譜_示例圖

2.2 行業知識圖譜

行業知識圖譜指面向特定領域的知識圖譜,使用者目标對象需要考慮行業中各級别的人員,不同人員對應的操作和業務場景不同,因而需要一定的深度與完備性,行業知識圖譜對準确度要求非常高,通常用于輔助各種複雜的分析應用或決策支援,有嚴格與豐富的資料模式,行業知識圖譜中的實體通常屬性比較多且具有行業意義

知識圖譜_示例圖

2.2.1、人脈路徑查詢

基于兩個使用者之間的關聯實體(比如:所在機關、同僚、同學、朋友、家人等)找到兩者之間的關聯路徑。

知識圖譜_示例圖

2.2.2、企業社交圖譜查詢

基于投資、任職、專利、招投标、涉訴關系以目标企業為核心心向外層層擴散,形成一個網絡關系圖,直覺立體展現企業關聯。

知識圖譜_示例圖

2.2.3、企業最終控股人查詢

基于股權投資關系尋找持股比例最大的股東,最終追溯至自然人或國有資源管理部門。

知識圖譜_示例圖

2.2.4、輔助信貸稽核

基于知識圖譜資料的統一查詢,全面掌握客戶資訊;避免由于系統、資料孤立、資訊不一緻造成信用重複使用、資訊不完整等問題。

知識圖譜_示例圖

2.2.5、反欺詐之組團騙貸

同一個人利用多個身份去申請貸款,詳細見下圖:雖然貸款人A、貸款人B、貸款人C之間沒有直接的關系,但通過知識圖譜可以看出三者之間都共享某一部分資訊,存在一定的組團騙貸風險。

知識圖譜_示例圖

還有更多行業案例,畫圖真的很辛苦,有時間再補充,同時歡迎大家添磚加瓦。

案例補充:

1、企業發展曆程時序圖(融資)

基于企業知識圖譜中的投融資事件發生的時間順序,記錄企業的融資發展曆程。

知識圖譜_示例圖

2、競品分析

電商平台常會用到,兩家企業知識路徑越相似,競争關系越緊張。

知識圖譜_示例圖

3、征信系統

根據使用者已有資訊(例如:教育資訊、身份資訊、聯系方式、擔保或被擔保人資訊)關聯多家平台信用記錄。

知識圖譜_示例圖

建設一個知識圖譜系統,需要包括:知識模組化、知識擷取、知識融合、知識存儲和知識應用5大部分:

1、知識模組化:建構多層級知識體系,将抽象的知識、屬性、關聯聯關系等資訊,進行定義、組織、管理,轉化成現實的資料庫。

2、知識擷取:将不同來源、不同結構的資料轉化成圖譜資料,包括結構化資料、半結構化資料(解析)、知識标引、知識推理等,保障資料的有效性和完整性。

3、知識融合:将多個來源、重複的知識資訊進行融合,包括融合計算、融合計算引擎、手動操作融合等。

4、知識存儲:根據業務場景提供合理的知識存儲方案,存儲方案具備靈活、多樣化、可拓展特性。

5、知識應用:為已建構知識圖譜提供圖譜檢索、知識計算、圖譜可視化等分析與應用能力。并提供各類知識計算的SDK,包含圖譜基礎應用類、圖結構分析類、圖譜語義應用類、自然語言處理類、圖資料擷取類、圖譜統計類、資料集資料擷取類、資料集統計類。