1.簡述
Dremio與Drill簡述2.差別
a).資料源支援
使用最新版本Dremio 3.3.1和Drill 1.16.0
Dremio3.1.3版本開始不支援HBase,将來會開源社群版HBase連接配接器
b).自定義功能擴充
- Dremio無自定義功能開發API
- Drill有自定義功能開發API: 開發SQL自定義聚合函數,但該功能處于實驗階段
3.性能對比
a).Dremio聚合查詢性能
- 明細資料79457153條,聚合結果510002條
- 原始資料聚合查詢3分41秒,使用資料反射聚合查詢小于1s
- CPU消耗:原始資料聚合時間長使用低,資料反射聚合時間短使用高
圖1 Dremio聚合查詢資料量及耗時
圖2 Dremio聚合查詢CPU使用
b).Drill聚合查詢性能
- 明細資料39634975條,聚合結果500000條
- 原始資料聚合查詢3分6秒
圖3 Drill聚合查詢
4.Dremio未開源部分
Dremio主要未開源部分如下:
a).資料安全
- 使用者、組和角色的管理
- 資料源的共享
- 虛拟資料源之上的行、列級權限控制
- 個人通路令牌(PAT)
b).Wire Encryption(線加密)
- 全線加密
- ODBC / JDBC用戶端加密
- 叢集内加密
- 僅Web伺服器加密(開源)
c).REST API
- 工作負載管理API
- 使用者和令牌相關API
- 檢索所有資料反射和根據摘要檢索資料反射
- 僅根據Id檢索資料反射、建立、修改和删除檢索資料反射(開源)