天天看點

《語義網基礎教程(原書第3版)》—— 第2章 描述網際網路資源:RDF

本節書摘來自華章出版社《語義網基礎教程(原書第3版)》一 書中的第2章,第2.1節,作者:(希)grigoris antoniou(荷)paul groth(荷)frank van harmelen(荷)rinke hoekstra ,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

網際網路的成功展現了使用标準化的資訊交換和通信機制的力量。html是編輯網頁的标準語言。它允許任何人釋出一個文檔并且相信該文檔可以被任何網際網路浏覽器正确呈現。

html和其他交換語言都擁有以下3個組成元素:文法、資料模型和語義。文法告訴我們如何撰寫資料。資料模型告訴我們資料的結構或組織形式。語義告訴我們如何解釋資料。我們可以通過下面的html片段展現上述每個組成元素:

《語義網基礎教程(原書第3版)》—— 第2章 描述網際網路資源:RDF

html的文法是用尖括号撰寫的帶标簽文本(例如

)。html的資料模型稱為文檔對象模型(document object model),将由标簽定義的元素組織成一個層次樹狀結構。例如,應該在之前,而元素應該包含在元素内。最後,html的語義告訴我們浏覽器應該如何解釋網頁。例如,浏覽器應該将網頁體的内容呈現在浏覽器視窗中,同時元素應該呈現為一個有序清單。文法、資料模型和語義都在html标準中定義。

html用于傳遞有關面向人類的文檔結構的資訊。而對于語義網,我們的需求更加豐富。我們需要一個能夠被各種應用使用的資料模型,不僅為人類描述文檔,而且為特定應用描述資訊。這個資料模型需要是領域無關(domain independent)的,是以從房地産到社交網絡的應用都可以使用它。除了一個靈活的資料模型之外,我們還需要一種機制來将語義賦予使用這個資料模型表達的資訊。它應該允許使用者描述一個應用該如何在一個社交網絡描述中解釋“朋友”,以及如何在一個地理資訊描述中解釋“城市”。最終,和html類似,我們需要将所有這些資訊寫下來,即文法。

rdf(資源描述架構)恰好提供了這樣一個靈活并且領域無關的資料模型。它的基礎構件是一個實體–屬性(attribute)–取值的三元組,稱為聲明(statement)。例如,我們可以使用這個模型來表達“the baron way apartment is an apartment”、“the baron way apartment is part of the baron way building”以及“the baron way building is located in amsterdam”。因為rdf不針對任何領域及使用,對使用者而言必須定義他們在這些聲明中使用的術語。為此,需要利用rdf模式(rdfs)。rdfs允許使用者精确地定義它們的詞彙表(vocabulary,即它們的術語)應該如何解釋。

綜合起來,這些技術定義了在不同機器間交換任意資料的一種标準化語言的組成部分:

rdf—資料模型

rdfs—語義

turtle / rdfa / rdf-xml—文法

盡管rdf主要是指資料模型,它也經常被用來作為上述所有的總稱(本書中也會這樣使用)。

本章概述

繼續閱讀