天天看點

Dremio與Drill的對比

1.簡述

Dremio與Drill簡述

2.差別

a).資料源支援

使用最新版本Dremio 3.3.1和Drill 1.16.0

Dremio3.1.3版本開始不支援HBase,将來會開源社群版HBase連接配接器

Dremio與Drill的對比
Dremio與Drill的對比

b).自定義功能擴充

  • Dremio無自定義功能開發API
  • Drill有自定義功能開發API: 開發SQL自定義聚合函數,但該功能處于實驗階段

3.性能對比

a).Dremio聚合查詢性能

  1. 明細資料79457153條,聚合結果510002條
  2. 原始資料聚合查詢3分41秒,使用資料反射聚合查詢小于1s
  3. CPU消耗:原始資料聚合時間長使用低,資料反射聚合時間短使用高
Dremio與Drill的對比

圖1 Dremio聚合查詢資料量及耗時

Dremio與Drill的對比

圖2 Dremio聚合查詢CPU使用

b).Drill聚合查詢性能

  1. 明細資料39634975條,聚合結果500000條
  2. 原始資料聚合查詢3分6秒
Dremio與Drill的對比
Dremio與Drill的對比

圖3 Drill聚合查詢

4.Dremio未開源部分

Dremio主要未開源部分如下:

a).資料安全

  1. 使用者、組和角色的管理
  2. 資料源的共享
  3. 虛拟資料源之上的行、列級權限控制
  4. 個人通路令牌(PAT)

b).Wire Encryption(線加密)

  1. 全線加密
  2. ODBC / JDBC用戶端加密
  3. 叢集内加密
  4. 僅Web伺服器加密(開源)

c).REST API

  1. 工作負載管理API
  2. 使用者和令牌相關API
  3. 檢索所有資料反射和根據摘要檢索資料反射
  4. 僅根據Id檢索資料反射、建立、修改和删除檢索資料反射(開源)

d).單點登陸(SSO)

e).LDAP身份驗證(輕型目錄通路協定)