天天看點

記阿裡人工智能與服務創新研讨會寫在最後

之前沒有了解過知識圖譜,同樣也是第一次參加研讨會。

總體而言,研讨會能夠快速,高效地了解到學術界目前的研究方向。

知識圖譜,簡而言之,就是以三元組代表(headentity, relationship, tailentity)頭實體,尾實體以及它們之間的關系。

知識圖譜(mapping knowledge domain)也被稱為科學知識圖譜,在圖書情報界稱為知識域可視化或知識領域映射地圖,是顯示知識發展程序與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、建構、繪制和顯示知識及它們之間的互相聯系。

具體來說,知識圖譜是通過将應用數學、圖形學、資訊可視化技術、資訊科學等學科的理論與方法與計量學引文分析、共現分析等方法結合,并利用可視化的圖譜形象地展示學科的核心結構、發展曆史、前沿領域以及整體知識架構達到多學科融合目的的現代理論。它把複雜的知識領域通過資料挖掘、資訊處理、知識計量和圖形繪制而顯示出來,揭示知識領域的動态發展規律,為學科研究提供切實的、有價值的參考。

<a href="https://zh.wikipedia.org/wiki/google%e7%9f%a5%e8%af%86%e5%9b%be%e8%b0%b1">google知識圖譜wiki</a>

其他代表知識庫:

wordnet

freebase

主要研究思路: 将知識圖譜嵌入到低維向量空間

實體和關系都表示為低維向量

有效表示和度量實體、關系間的語義關聯

知識表示代表模型:

對每個事實(head, relation, tail),将relation看做從head到tail的翻譯操作。

記阿裡人工智能與服務創新研讨會寫在最後

訓練的優化目标為: h + r = t

此外還有neural tensor network(ntn)以及energy model。

記阿裡人工智能與服務創新研讨會寫在最後
記阿裡人工智能與服務創新研讨會寫在最後

表示學習在處理一對多、多對一、多對多的關系時,不能較好的處理。當出現多個結果時,每個結果的權重相當。

在transe的基礎上考慮關系對實體的影響。

有以下兩個典型的算法:

transh

transr

記阿裡人工智能與服務創新研讨會寫在最後
記阿裡人工智能與服務創新研讨會寫在最後

關系路徑的表示學習: recursive neural network(rnn)

記阿裡人工智能與服務創新研讨會寫在最後

考慮了關系路徑的transe算法為ptranse:

記阿裡人工智能與服務創新研讨會寫在最後

relation之間的組合語義,通常包括 add, multiply, rnn

記阿裡人工智能與服務創新研讨會寫在最後

通常關系之間的每個組合,需要單獨訓練一個目标函數。

在大規模複雜的知識圖譜中,目标函數也會呈現指數級增長。

這個算法,由于落地難的問題,大家都沒有講=.=

歸納邏輯程式設計 ilp

類似資料挖掘中的關聯規則

關系路徑

分布式表示

bootstrapping

distant supervision

open ie(stanford openie)

王泉研究員,我隻能獻上我的膝蓋了,語速很快,思路無敵清晰。簡簡單單的一個slide就能把目前知識圖譜的研究方向洋洋灑灑的講出來。

繼續閱讀