天天看點

一文讀懂人工智能背後的技術:知識圖譜

作者:AI數智彙
  • 什麼是知識

有讀者可能會說,知識不就是我們在學校、工作中學到的内容嘛,這還有什麼好講的?實際上你隻了解對了一部分,且容我細細道來。我們先來看一張圖。

一文讀懂人工智能背後的技術:知識圖譜

由上圖可知,知識是将資料進行加工處理形成有邏輯的資訊,并經過沉澱和結構化成為有價值的資訊。

在數字化時代,人類擁有海量的資料,這是不是代表人類可以随時随地利用無窮無盡的知識呢?答案是否定的。

知識是人們在實踐中認識客觀世界(包括人類自身)的成果,它包括事實、資訊、描述以及在教育和實踐中獲得的技能。

知識是人類從各個途徑中獲得的經過提升、總結與凝煉的系統的認識,是對資訊進行處理之後的認識和了解,是對資料和資訊的凝煉、總結後的成果。知識是有價值的資訊。

我們在學校學習的課程以及工作中的相關内容、日常刷短視訊、閱讀文章都隻是在擷取資訊,資訊隻有經過總結、提煉後成為對自己有用的内容,才叫知識。

舉個非常簡單的例子,比如我們在學校學習1+1=2,這是資訊,當我們買菜的時候,給老闆付2元錢,這時候1+1=2 才是知識。

那什麼是圖譜,下面這幾個就是圖譜。

一文讀懂人工智能背後的技術:知識圖譜
一文讀懂人工智能背後的技術:知識圖譜

簡單來說,圖就是用來表示一些事物(Object)與另一些事物之間互相連接配接的結構。一張圖通常由一些結點(Vertice或Node)和連接配接這些結點的邊(Edge)組成。

一文讀懂人工智能背後的技術:知識圖譜
  • 知識圖譜是什麼

從字面上看,知識圖譜就是用圖的形式将知識表示出來。圖中的結點代表語義實體或概念,邊代表結點間的各種語義關系。

專業定義一:知識圖譜(Knowledge Graph, KG)是一種以結構化的形式描述客觀世界中事物及事物之間聯系的技術,它通過大資料和人工智能技術,将網際網路的資訊表達成更接近人類認知世界的模式。

專業定義二、知識圖譜本質上是一個語義網絡,由節點(Point)和邊(Edge)組成,每個節點代表現實世界中存在的“實體”,每條邊則表示實體之間的關系。它是為了提升搜尋引擎傳回答案的品質以及使用者查詢的效率,通過建構的知識庫來增強語義搜尋的效率和品質。

簡單來說,知識圖譜就是将現實世界中的事物和關系,用關聯圖的方式展現出來,讓人能夠一眼看出他們之間的關系。舉個栗子。

一文讀懂人工智能背後的技術:知識圖譜

如圖所示,我們可以看到,如果中國和北京兩個節點之間存在關系,他們就會被一條無向邊連接配接在一起,那麼這兩個節點,我們就稱為實體(Entity),它們之間的這條邊,我們就稱為關系(Relationship)。我們先介紹一下知識圖譜的相關概念。實體:對應現實世界中的具體事物,比如中國、張三、老虎、軟體工程師、合肥、鉛筆等。關系:用來表達不同實體之間的某種聯系,不同實體之間通過關系互相連接配接,比如國與國之間的競争關系、合作關系、敵對關系等,人與人之間的父子關系、夫妻關系、同學關系等。屬性:對實體或關系抽象方面的刻畫,實體屬性如一個人的年齡、身高、體重等,關系屬性如夫妻關系的結婚時間、同學關系的就讀學校等。

知識圖譜是由實體(Entity)、關系(Relationship)、屬性(Property)三元組構成,抽象地描述為:實體—關系—實體。

  • 知識圖譜的發展裡程
一文讀懂人工智能背後的技術:知識圖譜

最初,知識圖譜的概念與早期的人工智能研究緊密相關,特别是專家系統和知識工程的興起為知識圖譜的發展奠定了基礎。1960年,人工智能早期發展中出現了三個主要學派:符号派、連接配接派、行為派。符号派注重用計算機符号表示人腦中的知識,以此模拟人的思考、推理過程;連接配接派則注重模拟人腦的生理結構,由此發展了人工神經網絡。行為學派強調模拟人的行為。這三個分支的研究為知識圖譜的發展提供了理論和技術基礎。

以深度學習為代表的連接配接學派,主要解決了感覺問題,也引領了這一輪人工智能的發展熱潮。但是在更高層次的認知領域,例如自然語言了解、推理和聯想等方面,還需要符号學派的幫助。

知識圖譜是符号學派的代表,可以幫助我們建構更有學識的人工智能,進而提升機器人推理、了解、聯想等功能。而這一點,僅通過大資料和深度學習是無法做到的。多倫多大學的Geoffrey Hinton教授也提出,人工智能未來的發展方向之一就是深度神經網絡與符号人工智能的深入結合。

一文讀懂人工智能背後的技術:知識圖譜

2012年,随着大資料、雲計算和人工智能技術的快速發展,知識圖譜的研究和應用迎來了新的高潮。Google正式提出了“知識圖譜”這一概念,旨在通過整合網際網路上的開放資料,建立一個能夠提供更加豐富和準确資訊的智能搜尋服務。

到目前為止,知識圖譜的應用已經非常廣泛,包括但不限于語義搜尋、問答系統、智能決策等。它能夠幫助網絡的智能化水準更高,更加接近于人類的認知思維。知識圖譜還可以被應用于自然語言處理、推薦系統等多個領域。知識圖譜是實作通用人工智能(Artificial General Intelligence,AGI)的重要基石。在從感覺到認知的跨越過程中,建構大規模高品質知識圖譜是一個重要環節。當人工智能可以通過更結構化的表示了解人類知識,并進行互聯時,才有可能讓機器真正實作推理、聯想等認知功能。

是以,也産生了一個問題,當AI擁有了全部人類知識後是否能夠形成獨立思考的能力?目前還不好下結論,需要專家學者的進一步研究。

  • 知識圖譜應用場景

知識圖譜的應用領域非常廣泛,涵蓋了多個行業和應用場景。

一文讀懂人工智能背後的技術:知識圖譜

知識圖譜典型應用

在金融風控領域,知識圖譜通過建構和分析金融實體之間的關系網絡,能夠幫助銀行等金融機構識别和預防欺詐行為。

通過建構銀行賬戶、客戶等金融實體的知識圖譜模型,利用圖分析技術挖掘提煉賬戶之間的關聯風險特征,進一步結合傳統會計案防規則,形成智能化的反欺詐政策。

融合銀行内外部資料,深度挖掘各類實體之間的關聯關系,識别賬号、客戶、企業風險、異常擔保、疑似實控人等情況,為銀行的風險防控提供支援。知識圖譜的應用不僅限于貸前、貸中和貸後三個環節,還包括對主體進行多元度、多層次的風險評估,提供更加全面、準确的風險預警。

例如,在信貸場景中,知識圖譜可以應用于信用風險的識别和管理。同時,面對信貸黑産的猖獗發展,知識圖譜和圖譜挖掘技術能夠識别欺詐團夥、黑産中介等惡意騙貸行為,有效預防團夥欺詐、黑産中介、代辦包裝等惡意騙貸行為。

知識圖譜在金融風控領域的應用主要通過建構和分析金融實體之間的關系網絡,結合大資料技術和圖分析技術,實作對欺詐行為的早期識别和預防,進而幫助金融機構提高風險管理的效率和準确性。

在醫療健康領域的應用主要展現在輔助診斷和治療決策方面,具體案例包括:

輔助診斷:通過分析患者的症狀、病史、檢查結果等資訊,為醫生提供診斷建議。這種應用可以幫助醫生更準确地診斷疾病,提高診斷的準确性。随着人工智能技術的發展,最近可以看到人工智能替代中醫問診并開中藥的視訊,視訊顯示人工智能機器人診斷的準确率及開的中藥方與工作多年的老中醫開的藥方近似度約80-90%,就是最好的證明。

影像輔助知識圖譜:建構影像輔助知識圖譜,以及罕見病知識圖譜診斷模型,利用人工智能算法在醫學決策支援上的應用,這些例子證明了知識圖譜推理在醫學領域的有效性。

基于疾病診斷相關分組的醫學知識圖譜庫:詳細闡述了基于疾病診斷相關分組的醫學知識圖譜庫建構方法,展望了其在健康宣教、輔助診斷決策系統、優化疾病診斷相關分組器等方面的應用前景。

胃癌惡性良性腫瘤知識圖譜:面向臨床決策支援的胃癌惡性良性腫瘤知識圖譜建構與應用,包括胃癌輔助臨床分期與診療決策支援,可為胃癌診療相關臨床科室提供支援。

百度靈醫智惠臨床輔助決策系統CDSS:除了基于循證醫學架構的疾病診斷功能,還支援智能風控、相似病曆檢索、治療方案推薦、醫學知識檢索等多項AI輔診功能,全方位、多元度提升醫生診療能力

利用自然語言了解與知識圖譜進行互動式導診:通過自動處理患者互動資訊用于醫生臨床診斷并附有醫療建議,利用自然語言了解關聯使用者資訊并半自動建立結構化的醫療知識庫。

高品質臨床醫學知識庫知識圖譜與人工智能結合:讓計算機“學習”醫生的醫療知識,模拟醫生的思維和診斷推理,進而給出診斷和治療方案,是人工智能技術在醫療領域的核心應用場景之一。

一文讀懂人工智能背後的技術:知識圖譜

繼續閱讀