天天看點

知識圖譜(Knowledge Graph)之綜述了解知識圖譜的研究背景及其意義知識圖譜的發展知識圖譜的定義大規模知識庫知識圖譜關鍵技術知識圖譜的典型應用知識圖譜的問題與挑戰總結

注:該博文是我在看了數篇知識圖譜綜述以及閱讀了相關資料後的一個總結以及自己的相關了解。
      

知識圖譜技術是人工智能技術的重要組成部分,以結構化的方式描述客觀世界中的概念、實體及其鍵的關系。知識圖譜提技術提供了一種更好的組織、管理和了解網際網路海量資訊的能力,将網際網路的資訊表達成更接近于人類認知世界的形式。是以,建立一個具有語義處理能力與開放互聯能力的知識庫,可以在智能搜尋、智能問答、個性化推薦等智能資訊服務重産生應用價值。

本文的主要内容如下

目錄

知識圖譜的研究背景及其意義 知識圖譜的發展 知識圖譜的定義 知識圖譜的架構 大規模知識庫 知識圖譜關鍵技術 知識圖譜的典型應用 知識圖譜的問題與挑戰 知識抽取  知識表示  知識融合  知識加工  知識更新  知識應用  其他 總結 參考文獻

單單從字面上了解,知識圖譜應該是一種更加結構化(主要是基于圖)的知識庫,将散亂的知識有效的組織起來,友善人們的查閱,而不是之前那樣一堆文在擺在眼前,沒有一目了然的趕腳,哈哈哈。是以,很容易想到,知識圖譜的産生背景就是,第一方面網際網路資訊的暴增,以及資訊的雜亂無章,第一個意義就是為了人們更加快速有效的檢索某一資訊。,第二方面,随着現在科學技術的進步與發展,很多先進技術都應運而生(比如深度學習),人們期望機器像人一樣可以去了解海量的網絡資訊,期望可以更快、準确、智能的擷取到自己需要的資訊,為了滿足這種需求,智能化的知識圖譜應運而生,其研究意義還是在于友善人類!(有木有發現,幾乎所有的研究意義都是這四個字呐)(在這裡我隻是用一種簡單了解的方式來表達,當然還有更多的研究意義,隻不過知識圖譜剛剛開始火熱起來的時候,就是應用在資訊檢索方面。為了容易了解以及友善記憶,記住這個就ok了)

一般情況下研究背景就展現了研究意義。以下是官網語言描述,非完美主義者可以跳過這些繁瑣的文字表達,哈哈哈。

伴随着web技術的不斷演進與發展,人類先後經曆了以文檔互聯為主要特征的“web 1.0”時代,以資料互聯為特征的“web 2.0”時代,正在邁向基于知識互聯的嶄新“Web 3.0”時代。

知識網際網路的目标是建構一個人與機器都可以了解的網際網路,使得人們的網絡更加智能化。然而,由于網際網路上的内容多源一直,組織結構松散,給大資料環境下的知識互聯帶來了極大的挑戰。是以,人們需要根據大資料環境下的知識組織原則,從新的視角去探索既符合網絡資訊資源發展變化又能适應使用者人之需求的知識互聯方法,從更深層次上揭示人類認知的整體性關聯性。知識圖譜以其強大的語義處理能力與開放互聯能力,使web 3.0提出的“知識之網”遠景成為了可能。

進入21世紀,随着網際網路的蓬勃發展以及知識的爆炸式增長,搜尋引擎被廣泛使用。傳統的搜尋引擎技術能夠根據使用者查詢快速排序網頁,提高資訊檢索的效率。然而,這種網頁檢索效率并不意味這使用者能夠快速準确的擷取資訊和知識,對于搜尋引擎傳回的大量結果還需要進行人工排查和篩選。面對網際網路上不斷增加的海量資訊,網頁檢索方式(僅包含網頁和網頁之間連結的傳統文檔)已經不能滿足人們迅速擷取所需資訊和全面掌握資訊資源的需求。為了滿足這種需求,知識圖譜技術應運而生。它們力求通過将知識進行更加有序、有機的組織起來,使使用者可以更加快速、準确地通路自己需要的知識資訊,并進行一定的知識挖局和智能決策。從機構知識庫到網際網路搜尋引擎,近年來不少學者和機構紛紛在知識圖譜上深入研究,希望以這種更加清晰、動态的方式(注:知識圖譜一定是動态的,不斷更新的,不是靜止的,不然,就是去了其真正的意義)展現各種概念之間的聯系,實作

0世紀中葉,普萊斯等人提出使用引文網絡來研究當代科學發展的脈絡的方法,首次提出了知識圖譜的概念。(注意:這裡的知識圖譜和本博文主要介紹的知識圖譜不太一樣,在此是指Mapping Knowledge Domain,而本博文主要介紹的知識圖譜是指Knowledge Graph)1977年,知識工程的概念在第五屆國際人工智能大會上被提出,以專家系統為代表的知識庫系統開始被廣泛研究和應用,直到20世紀90年代,機構知識庫的概念被提出,自此關于知識表示、知識組織的研究工作開始深入開展起來。機構知識庫系統被廣泛應用于各科研機構和機關内部的資料整合以及對外宣傳工作。2012年11月Google公司率先提出知識圖譜(Knowledge Graph,KG)的概念,表示将在其搜尋結果中加入知識圖譜的功能。其初衷是為了提高搜尋引擎的能力,增強使用者的搜尋品質以及搜尋體驗。據2015年1月統計的資料,Google 建構的KG已經擁有5億個實體,約35億條實體關系資訊,已經被廣泛應用于提高搜尋引擎的搜尋品質。雖然知識圖譜(Knowledge Graph)的概念較新,但它并非是一個全新的研究領域,早在2006年,Berners Lee就提出了資料連結(linked data)的思想,呼籲推廣和完善相關的技術标準如URI(Uniform resource identifier),RDF(resource discription framework),OWL(Web ontology language),為迎接語義網絡的到來做好準備。随後掀起了一場語義網絡研究的熱潮,知識圖譜技術正是建立在相關的研究成果之上的,是對現有語義網絡技術的一次揚棄和升華。

知識圖譜(Knowledge Graph)之綜述了解知識圖譜的研究背景及其意義知識圖譜的發展知識圖譜的定義大規模知識庫知識圖譜關鍵技術知識圖譜的典型應用知識圖譜的問題與挑戰總結

在維基百科的官方詞條中:知識圖譜是Google用于增強其搜尋引擎功能的知識庫。本質上,知識圖譜是一種揭示實體之間關系的語義網絡,可以對現實世界的事物及其互相關系進行形式化地描述。現在的知識圖譜已被用來泛指各種大規模的知識庫。可作如下定義:

知識圖譜 :是結構化的語義知識庫,用于以符号形式描述實體世界中的概念及其互相關系。其基本組成機關是“實體 關系 實體”三元組,以及實體及其相關屬性值對,實體間通過關系互相聯結,構成網狀的知識結構。

知識圖譜(Knowledge Graph)之綜述了解知識圖譜的研究背景及其意義知識圖譜的發展知識圖譜的定義大規模知識庫知識圖譜關鍵技術知識圖譜的典型應用知識圖譜的問題與挑戰總結

在此,知識圖譜包含三層含義:

  1.  知識圖譜本身是一個具有屬性的實體通過關系連結而成的網狀知識庫.從圖的角度來看,知識圖譜在本質上是一種概念網絡,其中的節點表示實體世界的實體(或概念),而實體間的各種語義關系則構成網絡中的邊.由此,知識圖譜是對實體世界的一種符号表達 .
  2.  知識圖譜的研究價值在于,它是建構在目前Web基礎之上的一層覆寫網絡(overlay network),借助知識圖譜,能夠在Web網頁之上建立概念間的連結關系,進而以最小的代價将網際網路中積累的資訊組織起來,成為可以被利用的知識。
  3.  知識圖譜的應用價值在于,它能夠改變現有的資訊檢索方式,一方面通過推理實作概念檢索(相對于現有的字元串模糊比對方式而言);另一方面以圖形化方式向使用者展示經過分類整理的結構化知識,進而使人們從人工過濾網頁尋找答案的模式中解脫出來。

在此主要給出幾個常見的知識圖譜架構圖,這幾個圖大同小異,通過看圖可以一目了然的了解,免去了文字的繁瑣介紹。

知識圖譜(Knowledge Graph)之綜述了解知識圖譜的研究背景及其意義知識圖譜的發展知識圖譜的定義大規模知識庫知識圖譜關鍵技術知識圖譜的典型應用知識圖譜的問題與挑戰總結
知識圖譜(Knowledge Graph)之綜述了解知識圖譜的研究背景及其意義知識圖譜的發展知識圖譜的定義大規模知識庫知識圖譜關鍵技術知識圖譜的典型應用知識圖譜的問題與挑戰總結
知識圖譜(Knowledge Graph)之綜述了解知識圖譜的研究背景及其意義知識圖譜的發展知識圖譜的定義大規模知識庫知識圖譜關鍵技術知識圖譜的典型應用知識圖譜的問題與挑戰總結

知識圖譜架構主要部分:

- 知識抽取(包括實體抽取、關系抽取以及屬性抽取等)

- 知識融合(包括實體消岐等)

- 知識加工(包括本體構架、知識推理等)

- 知識更新

知識圖譜(Knowledge Graph)之綜述了解知識圖譜的研究背景及其意義知識圖譜的發展知識圖譜的定義大規模知識庫知識圖譜關鍵技術知識圖譜的典型應用知識圖譜的問題與挑戰總結

具體的可以參加下圖:

知識圖譜(Knowledge Graph)之綜述了解知識圖譜的研究背景及其意義知識圖譜的發展知識圖譜的定義大規模知識庫知識圖譜關鍵技術知識圖譜的典型應用知識圖譜的問題與挑戰總結

這一部分是本文的重點,前面都是需要基本了解的知識圖譜基礎知識,這一部分是核心也是主要的研究問題。其實知識圖譜的關鍵技術主要是圍繞着建立一個高品質的知識圖譜所展開讨論的。在此主要是一個簡單的總結,便于大家的了解與記憶。

  • 知識抽取(或者資訊抽取)
  1.  實體抽取
  2.  關系抽取
  3.  屬性抽取(實質上屬性抽取也可以看作是關系抽去)
知識圖譜(Knowledge Graph)之綜述了解知識圖譜的研究背景及其意義知識圖譜的發展知識圖譜的定義大規模知識庫知識圖譜關鍵技術知識圖譜的典型應用知識圖譜的問題與挑戰總結
  • 知識融合

 實體連接配接

  1. 實體消岐–專門用于解決同名實體産生歧義問題的技術。實體消岐主要采用聚類的方法,聚類法消歧的關鍵問題是如何定義實體對象與指稱項之間的相似度,常用的方法有:《1》空間向量模型(詞袋模型)《2》語義模型(與空間向量模型相似,不同的地方在于語義模型不僅包含詞袋向量,而且包含一部分語義特征)《3》社會網絡模型(該模型的基本假設是物以類聚人以群分,在社會化環境中,實體指稱項的意義在很大程度上是由與其相關聯的實體所決定的)《4》百科知識模型(百科類網站通常會為每個實體配置設定一個單獨頁面,其中包括指向其他實體頁面的連接配接,百科知識模型正是利用這種連結關系來計算實體指稱項之間的相似度)
  2. 實體對齊–主要用于消除異構資料中實體沖突、指向不明等不一緻性問題,可以從頂層建立一個大規模的統一知識庫,進而幫助機器了解多源異質的資料,形成高品質的知識庫。對齊算法可以分為成對實體對齊和集體實體對齊,而集體實體對齊又可以分為局部集體實體對齊和全局集體實體對齊。成對實體對齊:《1》基于傳統機率模型的實體對齊方法。《2》基于機器學習的實體對齊方法。局部實體對齊方法:局部實體對齊方法為實體本身的屬性以及與它有關聯的實體的屬性分别設定不同的權重,并通過權重求和計算總體的相似度,還可以使用向量空間模型以及餘弦相似性來判别大規模知識庫中的實體的相似程度,算法為每個實體建立了名稱向量與虛拟文檔向量,名稱向量用于辨別實體的屬性,虛拟文檔向量則用于表示實體的屬性值以及其鄰居節點的屬性值的權重和值。全局集體實體對齊方法:《1》基于相似性傳播的集體實體對齊方法。《2》基于機率模型的集體實體對齊方法

實體連結技術也可以從整體層面分類如下:

知識圖譜(Knowledge Graph)之綜述了解知識圖譜的研究背景及其意義知識圖譜的發展知識圖譜的定義大規模知識庫知識圖譜關鍵技術知識圖譜的典型應用知識圖譜的問題與挑戰總結

知識合并

  • 合并外部知識庫—将外部知識庫融合到本地知識庫需要處理2個層面的問題。《1》資料層的融合,包括實體的指稱、屬性、關系以及所屬類别等,主要的問題是如何避免執行個體以及關系的沖突問題,造成不必要的備援。《2》通過模式層的融合,将新得到的本體融入已有的本體庫中。
  • 合并關系資料庫—在知識圖譜的建構過程中,一個重要的高品質知識來源是企業或者機構自己的關系資料庫。為了将這些結構化的曆史資料融入到知識圖譜中,可以采用資源描述架構(RDF)作為資料模型。業界和學術界将這一資料轉換過程形象的稱為RDB2RDF,其實質就是将關系資料庫的資料轉換成RDF的三元組資料。

知識加工

  • 本體建構—本體的最大特點在于它是共享的,本體中反映的知識是一種明确定義的共識。本體是同一領域内不同主體之間進行交流的語義基礎,本體是樹狀結構,相鄰層次的節點(概念)之間具有嚴格的“IsA”關系,這種單純的關系有利于知識推理卻不利于表達概念的多樣性。本體的建構可以采用人工編輯的方式手動建構(借助于本體編輯軟體),也可以采用計算機輔助,以資料驅動的方式自動建構,然後采用算法評估和人工稽核相結合的方式加以修正和确認。除了資料驅動的方法,還可以采用跨語言知識連結的方法來建構本體庫。對目前本體生成方法的主要研究工作主要集中在實體聚類方法,主要挑戰在于經過資訊抽取得到的實體描述非常簡短,缺乏必要的上下文資訊,導緻多數統計模型不可用。(可以利用主題進行層次聚類)。
  • 知識推理—知識推理是指從知識庫中已有的實體關系資料出發,經過計算機推理,建立實體間的新關聯,進而拓展和豐富知識網絡,知識推理是知識圖譜建構的重要手段和關鍵環節,通過知識推理,能夠從現有知識中發現新的知識。知識推理的方法如下圖:
  • 品質評估—對知識庫的品質評估任務通常是與實體對齊任務一起進行的,其意義在于,可以對知識的可信度進行量化,保留置信度較高的,舍棄置信度較低的,有效保證知識的品質。
知識圖譜(Knowledge Graph)之綜述了解知識圖譜的研究背景及其意義知識圖譜的發展知識圖譜的定義大規模知識庫知識圖譜關鍵技術知識圖譜的典型應用知識圖譜的問題與挑戰總結

知識更新

人類所擁有資訊和知識量都是時間的單調遞增的函數,是以知識圖譜的内容也需要與時俱進,其建構過程是一個不斷疊代更新的過程。從邏輯上看,隻是哭的更新包括概念層更新和資料層更新。知識圖譜内容的更新有兩種方式:資料驅動下的全面更新和增量更新。

雖然三元組的知識表示形式受到了人們的廣泛認可,但是其在計算效率、資料稀疏性等方面卻面臨着諸多問題。近年來,以深度學習為代表的學習技術取得了重要的進展,可以将實體的語義資訊表示為稠密低維的實值向量,進而在低維空間中高效計算實體、關系及其之間的複雜語義關聯,對知識庫的建構、推理、融合以及應用均具有重要的意義。分布式表示旨在用一個綜合的向量來表示實體對象的語義資訊,是一種模仿人腦工作的表示機制,通過知識表示而得到的分布式表示形式在知識圖譜的計算、補全、推理等方面起到重要的作用:語義相似度計算、連結預測(又被稱為知識圖譜補全)等代表模型如下所示:

知識圖譜(Knowledge Graph)之綜述了解知識圖譜的研究背景及其意義知識圖譜的發展知識圖譜的定義大規模知識庫知識圖譜關鍵技術知識圖譜的典型應用知識圖譜的問題與挑戰總結
  • 距離模型

首先将實體用向量進行表示,然後通過關系矩陣将實體投影到與實體向量同一緯度的向量空間中,最後通過計算投影向量之間的距離來判斷實體間已經存在的關系的置信度。由于距離模型中的關系矩陣是兩個不同的矩陣,故實體間的協同性較差,這也是該模型本身的主要缺陷。

  • 單層神經網絡

針對距離模型的缺陷,提出了采用單層神經網絡的非線性模型(single layer model,SLM)。單層神經網絡模型的非線性操作雖然能夠進一步刻畫實體在關系下的語義相關性,但是在計算開銷上卻大大增加。

  • 雙線性模型

雙線性模型又叫隐變量模型(latent factor model,LFM)。雙線性模型主要是通過基于實體間關系的雙線性變換來刻畫實體在關系下的語義相關性,模型不僅形式簡單、易于計算,而且能夠有效刻畫實體間的協同性。

  • 神經張量模型

其基本思想是,在不同次元下,将實體聯系起來,表示實體間複雜的語義聯系。神經張量模型在建構實體的向量表示時,是将該實體中的所有單詞的向量取平均值,這樣一方面可以重複使用單詞向量建構實體,另一方面将有利于增強低維向量的稠密程度以及實體與關系的語義計算。

  • 矩陣分解模型

通過矩陣分解的方式可以得到低維的向量表示,故不少研究者提出可以采用該方式進行知識表示學習,其中典型的代表是RESACL模型。

知識圖譜(Knowledge Graph)之綜述了解知識圖譜的研究背景及其意義知識圖譜的發展知識圖譜的定義大規模知識庫知識圖譜關鍵技術知識圖譜的典型應用知識圖譜的問題與挑戰總結

知識圖譜為網際網路上海量、異構、動态的大資料表達、組織、管理以及利用提供了一種更為有效的方式,使得網絡的智能化水準更高,更加接近于人類的認知思維。

  •  智能搜尋
  •  深度問答
  •  社交網絡
  •  個性化推薦
  •  垂直行業應用,例如 金融行業、醫療行業、電商行業以及教育行業等等。

知識抽取是知識圖譜組織建構、進行問答檢索的主要任務,對于深層語義的了解以及處理具有重要的意義。一些傳統的知識元素(實體、關系、屬性)抽取技術與方法,它們在限定領域、主題的資料集上獲得了較好的效果,但由于制約條件較多,算法準确性和召回率低,方法的可擴充能力不夠強,未能很好地适應大規模、領域獨立、高效的開放式資訊抽取要求。 目前,基于大規開放域的知識抽取研究仍處于起步階段,尚需研究者努力去攻關開墾。主要問題包括實體抽取、關系抽取以及屬性抽取。其中,多語種、開放領域的純文字資訊抽取問題是目前面臨的重要挑戰。

KnowItAll、TextRunner、WOE、ReVerb、R2A2、KPAKEN這些系統已為開放域環境下,實體關系抽取中的二進制關系抽取、n元關系抽取發展開創了先河,具有廣闊的研究前景。再者,對于隐含關系的抽取,目前主流的開放式資訊抽取方法性能低下或尚無法實作。是以,以馬爾可夫邏輯網、本體推理的聯合推理方法将成為學術界的研究熱點。 聯合推理方法不僅能夠推斷文本語料所不能顯示的深層隐含資訊,還能夠綜合資訊抽取各階段的子任務,像杠杆一樣在各方面之間尋求平衡,以趨向整體向上的理想效果,為大規模開放域下的知識抽取提供了一種新的思路。除上述外,跨語言的知識抽取方法也成為了目前的研究熱點,對于我國的研究者而言,更應發揮自身在中文資訊處理方面的天然優勢,面對挑戰與機遇,做出應有的貢獻。

目前存在的表示方式仍是基于三元組形式完成的語義映射,在面對複雜的知識類型、多源融合的資訊時,其表達能力仍然有限。是以有研究者提出,應針對不同的應用場景設計不同的知識表示方法。

  • 複雜關系中的知識表示

已有的工作将知識庫中的實體關系類型分為1-to-1、1-to-N、N-to-1、N-to-N這4種,這種劃分方法無法直覺地解釋知識的本質類型特點,也無法更有針對性地表示複雜關系中的知識。 但發現分布式的知識表示方法來源于認知科學,具有靈活的可擴充能力。基于上述,對認知科學領域人類知識類型的探索将有助于知識類型的劃分、表示以及處理,是未來知識表示研究的重要發展方向。

  • 多源資訊融合中的知識表示

**對于多源資訊融合中的知識表示研究尚處于起步階段,涉及的資訊來源也極為有限,已有的少數工作都是圍繞文本與知識庫的融合而展開的。**另外,已有文獻将注意力轉向面向關系表示的多源資訊融合領域,并已在CNN上進行了一定的實作。在知識融合表示中,融合是最關鍵的前期步驟,如能有機的融合多源異質的實體、關系等資訊,将有利于進一步提升知識表示模型的區分能力以及性能。基于實體的、關系的、Web文本的、多知識庫的融合均具有較為廣闊的研究前景。

知識融合對于知識圖譜的建構、表示均具有重要的意義。實體對齊 是知識融合中的關鍵步驟,雖然相關研究已取得了豐碩的成果,但仍有廣闊的發展空間,如下:

  • 并行與分布式算法

大規模的知識庫不僅蘊含了海量的知識,其結構、資料特征也極其複雜,這些對知識庫實體對齊算法的準确率、執行效率提出了一定的挑戰。目前,不少研究者正着力研究對齊算法的并行化或分布式版本,在兼顧算法準确率與召回率的同時,将進一步利用并行程式設計環境MPI,分布式計算架構Hadoop、Spark等平台,提升知識庫對齊的整體效果。

  • 衆包算法

人機結合的衆包算法可以有效地提高知識融合的品質。衆包算法的設計講求資料量、知識庫對齊品質以及人工标注三者的權衡。将衆包平台與知識庫對齊模型有機結合起來,并且能夠有效判别人工标注的品質,這些均具有較為廣闊的研究前景。

  • 跨語言知識庫對齊

多語言的知識庫越來越多,多語言知識庫的互補能力将為知識圖譜在多語言搜尋、問答、翻譯等領域的實際應用提供更多的可能。 文獻已在這方面取得了一定的進展,但知識庫對齊的品質不高,這方面仍有廣闊的研究空間。

綜之,主要的研究問題包括開放域條件下的實體消歧、共指消解、外部知識庫融合和關系資料庫知識融合等問題.目前受到學術界普遍關注的問題是如何在上下文資訊受限(短文本、跨語境、跨領域等)條件下,準确地将從文本中抽取得到的實體正确連結到知識庫中對應的實體.

知識加工是最具特色的知識圖譜技術,同時也是該領域最大的挑戰之所在.主要的研究問題包括:本體的自動建構、知識推理技術、知識品質評估手段以及推理技術的應用.目前,本體建構問題的研究焦點是聚類問題,對知識品質評估問題的研究則主要關注建立完善的品質評估技術标準和名額體系.知識推理的方法和應用研究是目前該領域最為困難,同時也是最為吸引人的問題,需要突破現有技術和思維方式的限制,知識推理技術的創新也将對知識圖譜的應用産生深遠影響.

在知識更新環節, 增量更新技術是未來的發展方向,然而現有的知識更新技術嚴重依賴人工幹預.可以預見随着知識圖譜的不斷積累,依靠人工制定更新規則和逐條檢視的舊模式将會逐漸降低比重,自動化程度将不斷提高,如何確定自動化更新的有效性,是該領域面臨的又一重大挑戰

目前,大規模知識圖譜的應用場景和方式還比較有限,其在智能搜尋、深度問答、社交網絡以及其他行業中的使用也**隻是處于初級階段,**仍具有廣闊的可擴充空間。人們在挖掘需求、探索知識圖譜的應用場景時,應充分考慮知識圖譜的以下優勢:1) 對海量、異構、動态的半結構化、非結構化資料的有效組織與表達能力;2) 依托于強大知識庫的深度知識推理能力;3) 與深度學習、類腦科學等領域相結合,逐漸擴充的認知能力。 在對知識圖譜技術有豐富積累的基礎上,敏銳的感覺人們的需求,可為大規模知識圖譜的應用找到更寬廣、更合适的應用之道。

最具基礎研究價值的挑戰是如何解決知識的表達、存儲與查詢問題,這個問題将伴随知識圖譜技術發展的始終,對該問題的解決将反過來影響前面提出的挑戰和關鍵問題.目前的知識圖譜主要采用圖資料庫進行存儲,在受益于圖資料庫帶來的查詢效率的同時,也失去了關系型資料庫的優點,如SQL語言支援和集合查詢效率等.在查詢方面,如何處理自然語言查詢,對其進行分析推理,翻譯成知識圖譜可了解的查詢表達式以及等價表達式等也都是知識圖譜應用需解決的關鍵問題.

知識圖譜的重要性不僅在于它是一個全局知識庫,是支撐智能搜尋和深度問答等智能應用的基礎,而且在于它是一把鑰匙,能夠打開人類的知識寶庫,為許多相關學科領域開啟新的發展機會。 從這個意義上看來,知識圖譜不僅是一項技術,更是一項戰略資産。本文的主要目的就是介紹和宣傳這項技術,希望吸引更多的人重視和投入這項研究工作。