天天看点

clickhouse入门学习clickhouse是什么?OLAP是什么?clickhouse的优点clickhouse的缺点clickhouse的核心概念clickhouse的使用

clickhouse

  • clickhouse是什么?
  • OLAP是什么?
  • clickhouse的优点
  • clickhouse的缺点
  • clickhouse的核心概念
  • clickhouse的使用

clickhouse是什么?

  • clickhouse是一个完全的列式分布式数据库管理系统(DBMS)
  • clickhouse是一个用于联机分析(OLAP)的列式数据库管理系统,主要用于在线分析处理查询,能够使用SQL查询实时生成分析数据报告

OLAP是什么?

  • OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
  • OLAP采用多维报表和统计图形,查询提出以及数据输入直观灵活,用户可以方便的逐层细化,切块,切片,数据旋转

clickhouse的优点

  • 灵活的MPP(大规模并行处理系统)架构,支持线性扩展,简单方便,高可靠性
  • 多服务器分布式处理数据,完备的DBMS系统
  • 底层数据列式存储,支持压缩,优化数据存储,优化索引数据
  • 容错跑分快:比vertica快5倍,比hive快279倍,比MySQL快800倍,其可处理的数据级别已达到10亿级别
  • 功能多:支持数据统计分析各种场景,支持类SQL查询,异地复制部署,海量数据存储,分布式运算,快速闪电的性能,几乎实时的数据分析,友好的SQL语法,出色的函数支持

clickhouse的缺点

  • 不支持事务,不支持真正的删除/更新
  • 不支持高开发
  • 不支持二级索引
  • 不擅长多表join
  • 元数据管理需要人为干预
  • 尽量做1000条以上的批量写入,避免逐行insert或小批量的insert,update,delete操作

clickhouse的核心概念

  • 数据分片
  • 列式存储
  • 向量化(可理解成多线程,并发处理数据)
  • 分区
  • 副本
  • 引擎(不同引擎决定了表数据存储特点,位置和表数据的操作行为)

clickhouse的使用

登录clickhouse

报错

clickhouse-client -h linux01` 报错拒绝连接解决办法
1.看防火墙是否关闭
systemctl status firewalld
2.修改配置文件
vi conf.xml
<listen_host>::</listen_host>service clickhouse-server restart --重启服务
clickhouse-client -h linux01
           

查看日志信息

查看clickhouse存储位置

cd /data/clickhouse/data   这个就是clickhouse数据库存储的位置