結構化資料與非結構化資料
學習記錄
資訊可以劃分為兩大類:
一類資訊能夠用資料或統一的結構加以表示,稱為結構化資料(即行資料,存儲在資料庫裡,可用二維表結構來邏輯表達實作的資料),如數字、符号;
另一類資訊無法用數字或統一的結構表示,如不同格式的辦公文檔、文本、網頁、XML、HTML、各類報表、圖像和音頻/視訊資訊等,稱為非結構化資料。
結構化資料屬于非結構化資料,是非結構化資料的特例。
例子:
把一堆水果的種類、顔色、名稱等屬性按照一定的格式記錄下來,這部分資料就是結構化資料,可以通過固定的模闆讀取某一條記錄的某一個屬性值。
現在給水果們拍照,用語言描述水果的口感,甚至給每個水果做一個網頁,這些資料都是非結構化資料,這些資料不直接對應某個屬性,需要相對複雜的方式來分析才能知道其含義。
個人學習記錄