Apache Kylin权威指南1.3　Apache Kylin的工作原理

<b>1.3　apache kylin的工作原理</b>

<b></b>

apache kylin的工作原理本质上是molap（multidimensional online analytical processing）cube，也就是多维立方体分析。这是数据分析中相当经典的理论，在关系数据库年代就已经有了广泛的应用，下面将对其做简要介绍。

1.3.1　维度和度量简介

在说明molap cube之前需要先介绍一下维度（dimension）和度量（measure）这两个

概念。

简单来讲，维度就是观察数据的角度。比如电商的销售数据，可以从时间的维度来观察（如图1-2的左侧所示），也可以进一步细化，从时间和地区的维度来观察（如图1-2的右侧所示）。维度一般是一组离散的值，比如时间维度上的每一个独立的日期，或者商品维度上的每一件独立的商品。因此统计时可以把维度值相同的记录聚合在一起，然后应用聚合函数做累加、平均、去重复计数等聚合计算。

图1-2　维度和度量的例子

度量就是被聚合的统计值，也是聚合运算的结果，它一般是连续的值，如图1-2中的销售额，抑或是销售商品的总件数。通过比较和测算度量，分析师可以对数据进行评估，比如今年的销售额相比去年有多大的增长，增长的速度是否达到预期，不同商品类别的增长比例是否合理等。

1.3.2　cube和cuboid

有了维度和度量，一个数据表或数据模型上的所有字段就可以分类了，它们要么是维度，要么是度量（可以被聚合）。于是就有了根据维度和度量做预计算的cube理论。

给定一个数据模型，我们可以对其上的所有维度进行组合。对于n个维度来说，组合的所有可能性共有2n种。对于每一种维度的组合，将度量做聚合运算，然后将运算的结果保存为一个物化视图，称为cuboid。所有维度组合的cuboid作为一个整体，被称为cube。所以简单来说，一个cube就是许多按维度聚合的物化视图的集合。

下面来列举一个具体的例子。假定有一个电商的销售数据集，其中维度包括时间（time）、商品（item）、地点（location）和供应商（supplier），度量为销售额（gmv）。那么所有维度的组合就有24=16种（如图1-3所示），比如一维度（1d）的组合有[time]、[item]、[location]、[supplier]4种；二维度（2d）的组合有[time, item]、[time, location]、[time、supplier]、[item, location]、[item, supplier]、[location, supplier]6种；三维度（3d）的组合也有4种；最后零维度（0d）和四维度（4d）的组合各有1种，总共就有16种组合。

图1-3　一个四维cube的例子

计算cuboid，即按维度来聚合销售额。如果用sql语句来表达计算cuboid [time, loca-tion]，那么sql语句如下：

select time, location, sum(gmv) as gmv from sales group by time, location

将计算的结果保存为物化视图，所有cuboid物化视图的总称就是cube。

1.3.3　工作原理

apache kylin的工作原理就是对数据模型做cube预计算，并利用计算的结果加速查询，具体工作过程如下。

1）指定数据模型，定义维度和度量。

2）预计算cube，计算所有cuboid并保存为物化视图。

3）执行查询时，读取cuboid，运算，产生查询结果。

由于kylin的查询过程不会扫描原始记录，而是通过预计算预先完成表的关联、聚合等复杂运算，并利用预计算的结果来执行查询，因此相比非预计算的查询技术，其速度一般要快一到两个数量级，并且这点在超大的数据集上优势更明显。当数据集达到千亿乃至万亿级别时，kylin的速度甚至可以超越其他非预计算技术1000倍以上。

Apache Kylin权威指南1.3　Apache Kylin的工作原理

继续阅读

httpd dead but subsys locked;No space left on device:Couldn't create accept loc

apache (httpd)不支持中文路径问题先卸载yum安装的httpd再用源码安装，重装httpd再安装支持中文的插件遇到问题

搭建httpd服务

windows下配置Apache的vhost初次接触，强烈欢迎拍砖，指出错误

Apache与PHP环境下配置本地虚拟主机

Linux 7 中配置Apache服务，及禁止ip访问，删除apache广告页面。

Apache配置文件中的deny和allow的使用

Apache 配置默认编码

服务器配置——Apache

Apache静态文件访问配置（书封服务器）

apache httpd 配置

Ubuntu16.04安装Apache+MySQL+PHP1. 安装Apache2. 安装MySQL3. 安装PHP4. 安装phpMyAdmin

Apache配置SSLApache配置SSL

Windows下配置Apache的SSL服务

Apache2.4.x 配置文件详解Apache配置需要了解如下：开始讲解：

配置apache支持PHP（win7）

Apache Kylin权威指南1.3 Apache Kylin的工作原理

继续阅读

Apache Kylin权威指南1.3　Apache Kylin的工作原理