天天看點

《語義網基礎教程(原書第3版)》—— 3.1 SPARQL基礎設施

本節書摘來自華章出版社《語義網基礎教程(原書第3版)》一 書中的第3章,第3.1節,作者:(希)grigoris antoniou(荷)paul groth(荷)frank van harmelen(荷)rinke hoekstra ,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

想要執行一條sparql查詢,就需要一個能執行查詢的軟體。能做到這一點的最常用的軟體叫做三元組存儲庫(triple store)。本質上,一個三元組存儲庫就是一個rdf的資料庫。在網上可以下載下傳到很多三元組存儲庫。在sparql的相關規範中,三元組存儲庫也稱為圖存儲庫。

在查詢一個三元組存儲庫之前,需要先向其中填充rdf資料。大部分三元組存儲庫都提供批量上傳的選項。也有一種稱為sparql更新的機制,提供了一系列向三元組存儲庫中插入、加載及删除rdf的選項。本章中将稍後讨論sparql更新。

當資料被加載進三元組存儲庫之後,就可以使用sparql協定來發送sparql查詢去查詢了。每個三元組存儲庫都提供一個端點(endpoint),在此送出sparql查詢。重要的一點是,用戶端使用http協定向端點發送查詢。事實上,要将一條sparql查詢送出給一個端點,其實可以将它輸入浏覽器位址欄中!當然,我們還是建議使用一個專門為sparql設計的用戶端。網上也能找到很多。

因為sparql使用标準的網際網路技術,你在網上将會找到大量的sparql端點。這些端點可以讓你存取大量的資料。例如,dbpedia.org/sparql提供了一個查詢端點來查詢一份維基百科的rdf表示。在ckan.org中可以找到一份完整的sparql端點清單。

一旦我們有了這個基礎設施,就可以開始寫sparql查詢了。