天天看點

clickhouse入門學習clickhouse是什麼?OLAP是什麼?clickhouse的優點clickhouse的缺點clickhouse的核心概念clickhouse的使用

clickhouse

  • clickhouse是什麼?
  • OLAP是什麼?
  • clickhouse的優點
  • clickhouse的缺點
  • clickhouse的核心概念
  • clickhouse的使用

clickhouse是什麼?

  • clickhouse是一個完全的列式分布式資料庫管理系統(DBMS)
  • clickhouse是一個用于聯機分析(OLAP)的列式資料庫管理系統,主要用于線上分析處理查詢,能夠使用SQL查詢實時生成分析資料報告

OLAP是什麼?

  • OLAP是資料倉庫系統的主要應用,支援複雜的分析操作,側重決策支援,并且提供直覺易懂的查詢結果。
  • OLAP采用多元報表和統計圖形,查詢提出以及資料輸入直覺靈活,使用者可以友善的逐層細化,切塊,切片,資料旋轉

clickhouse的優點

  • 靈活的MPP(大規模并行處理系統)架構,支援線性擴充,簡單友善,高可靠性
  • 多伺服器分布式處理資料,完備的DBMS系統
  • 底層資料列式存儲,支援壓縮,優化資料存儲,優化索引資料
  • 容錯跑分快:比vertica快5倍,比hive快279倍,比MySQL快800倍,其可處理的資料級别已達到10億級别
  • 功能多:支援資料統計分析各種場景,支援類SQL查詢,異地複制部署,海量資料存儲,分布式運算,快速閃電的性能,幾乎實時的資料分析,友好的SQL文法,出色的函數支援

clickhouse的缺點

  • 不支援事務,不支援真正的删除/更新
  • 不支援高開發
  • 不支援二級索引
  • 不擅長多表join
  • 中繼資料管理需要人為幹預
  • 盡量做1000條以上的批量寫入,避免逐行insert或小批量的insert,update,delete操作

clickhouse的核心概念

  • 資料分片
  • 列式存儲
  • 向量化(可了解成多線程,并發處理資料)
  • 分區
  • 副本
  • 引擎(不同引擎決定了表資料存儲特點,位置和表資料的操作行為)

clickhouse的使用

登入clickhouse

報錯

clickhouse-client -h linux01` 報錯拒絕連接配接解決辦法
1.看防火牆是否關閉
systemctl status firewalld
2.修改配置檔案
vi conf.xml
<listen_host>::</listen_host>service clickhouse-server restart --重新開機服務
clickhouse-client -h linux01
           

檢視日志資訊

檢視clickhouse存儲位置

cd /data/clickhouse/data   這個就是clickhouse資料庫存儲的位置