天天看點

資訊可以劃分結構化資料與非結構化資料

結構化資料與非結構化資料

學習記錄

資訊可以劃分為兩大類:

一類資訊能夠用資料或統一的結構加以表示,稱為結構化資料(即行資料,存儲在資料庫裡,可用二維表結構來邏輯表達實作的資料),如數字、符号;

另一類資訊無法用數字或統一的結構表示,如不同格式的辦公文檔、文本、網頁、XML、HTML、各類報表、圖像和音頻/視訊資訊等,稱為非結構化資料。

結構化資料屬于非結構化資料,是非結構化資料的特例。

例子:

把一堆水果的種類、顔色、名稱等屬性按照一定的格式記錄下來,這部分資料就是結構化資料,可以通過固定的模闆讀取某一條記錄的某一個屬性值。

現在給水果們拍照,用語言描述水果的口感,甚至給每個水果做一個網頁,這些資料都是非結構化資料,這些資料不直接對應某個屬性,需要相對複雜的方式來分析才能知道其含義。

個人學習記錄

繼續閱讀