1、Hive中所有的資料都存儲在 HDFS 中,沒有專門的資料存儲格式(可支援Text,SequenceFile,ParquetFile,RCFILE等)
- db:在hdfs中表現為${hive.metastore.warehouse.dir}目錄下一個檔案夾
- table:在hdfs中表現所屬db目錄下一個檔案夾
-
external table:外部表, 與table類似,不過其資料存放位置可以在任意指定路徑
普通表: 删除表後, hdfs上的檔案都删了
External外部表删除後, hdfs上的檔案沒有删除, 隻是把檔案删除了
- partition:在hdfs中表現為table目錄下的子目錄
- bucket:桶, 在hdfs中表現為同一個表目錄下根據hash散列之後的多個檔案, 會根據不同的檔案把資料放到不同的檔案中