不知不覺間,2022 年的腳步已經走到了倒數第二個月。臨近年末,我們對産品本身以及客戶回報的一些問題進行了持續的更新和優化,例如基線告警、資料服務平台新增 TDengine 資料源支援、行級權限根據使用者屬性實作動态賦權。
以下為袋鼠雲産品功能更新報告第二期内容,更多探索,請繼續閱讀。
數棧 DTinsight
離線開發平台
1. 支援對接 Trino 引擎
建立項目時支援對接 Trino 引擎,支援建立和運作 Trino 任務。

2. 個人賬号支援綁定 Kerberos 認證
數棧支援對使用者或使用者組綁定 Kerberos 證書,并支援以使用者級 / 使用者組級 Kerberos 賬号進行任務送出。
3. 基線告警
基線是一組任務的管理機關,被納入同一組基線的任務一般需要相同的産出時間。一條基線被納入監控後,該基線中的任務及其所有上遊的任務都會被自動監控。
基線在基線管理中開啟時,每天晚上 24 點會生成第二天的基線執行個體,以對第二天的基線上任務所産生的執行個體進行監控。
例子:如下圖,設一條基線包含任務 D、E,則 D、E 及其上遊的 A、B 都會被納入監控。
如果某任務的下遊沒有被納入基線的任務(例如 C),則即使該任務異常,智能監控也不會報警。
4. 安全審計增加類目
5.NULL 可以選擇識别為 NULL
資料同步任務中,FTP 作為源資料源時,NULL 可以選擇識别為 NULL 或者空字元串
6. 整庫同步可以選擇同步任務存放目錄
7. 其他優化項
・在 IDE 中進行任務切換時,會記住上次代碼浏覽位置
・postgresql、db2、greenplum、kingbase、mysql、oceanbase、oracle、sqlserber、tidb 等任務,存儲函數使用 select * from procedure() /select procedure()調用時,在排程不會執行的問題修複
・表查詢結果限制,所有 SQL 任務資料查詢結果預設僅顯示 1000 條
・資料同步任務當 HDFS 分區不存在時,進階配置中可配置是否報錯
具體說明:通過指定進階配置中 failedIfPathNotExist 的狀态,來配置是否進行報錯提示:
若 failedIfPathNotExist=true,則報錯;若 failedIfPathNotExist=false,則不報錯
8. 技術改造
・統計資料流量統計優化
・SQL 加密解密防止某些關鍵字被攔
・支援 spark UDF
・inceptor 同步支援直接讀寫檔案的方式去進行資料同步
實時開發平台
1. 産品首頁改造
在原來隻有項目入口和幫助手冊入口的基礎上,新增了更多運維資訊。幫助使用者進入産品後,不需要一個個進入項目,可以直覺的看到目前項目運作情況、目前需要處理什麼問題,提高産品可用性。
2. 任務運作日志推送
在【任務開發 - 任務設定】頁面,支援将任務運作日志推送至外部 Kafka,運維人員可基于日志資訊做更豐富的日志分析、任務監控等工作。
3. 優化項目
・PyFlink 任務在建立時可以引用第三方 python 包
・Flink1.12 相容 TiDB Connector
・Flink1.10/1.12 相容開啟 SASL 認證的 Kafka Connector
・優化日志列印格式,避免出現 /n/t 等字元
・Source Connector 新增支援了 RocketMQ
資料服務平台
1.【生成 API】新增 TDengine 資料源支援
TDengine 是一款高性能、分布式、支援 SQL 的時序資料庫,廣泛運用于物聯網、工業網際網路、車聯網、IT 運維、金融等領域。除核心的時序資料庫功能外,TDengine 還提供緩存、資料訂閱、流式計算等大資料平台所需要的系列功能。
目前 EasyAPI 支援 TDengine 基本 SQL 語句的查詢功能,可以在「生成 API」-「自定義 SQL 模式」DQL 模式下建立 TDengine API 服務。
2.【API 市場】增加批量導出功能
支援 API 市場 API 的批量導出,使用者可先在測試環境中進行 API 調試,無誤後在 API 市場批量導出 API,再在正式環境中導入 API,提高效率。
3.【API 調用情況】新增下載下傳日志功能
「API 管理」API 調用情況 調用明細 / 錯誤明細子產品增加「下載下傳日志」功能,可以通過設定調用條件下載下傳 7 天内的日志資料,友善使用者進行明細檢視,調用統計。
4.【生成 API】in、not in 操作符增加分隔符配置
之前的版本當進行 in、not in 操作符查詢資料時,預設入參參數為逗号分隔。存在特殊業務場景入參參數中包含逗号的情況,導緻入參分隔錯誤。
目前版本中,針對 in、not in 操作符,可以自定義選擇英文 “,”、“|”、“/”、“:”、“;” 五種分隔符,以滿足不同客戶業務場景需求。
數雁 EasyDigit
客戶資料洞察平台(原智能标簽平台)
1.【授權】- 标簽 / 實體 / 群組 / 目錄細粒度權限控制
使用者痛點:标簽、實體、群組等屬于企業資料資源的一部分,随着資源持續維護、資産沉澱,對資源的權限控制提出了更高的要求,本次新增的授權功能能夠實作靈活的權限控制。
新增功能說明:給使用者 / 使用者組 / 部門 / 角色授予目前資源的權限,可授權的資源包括标簽、實體、群組、目錄,可授予的權限包括可檢視、可編輯權限,也可以将資源設定為全員公開可檢視 / 可編輯,實作細粒度的權限控制。
2.【行級權限】- 根據使用者屬性實作動态賦權
使用者痛點:行級權限 用來控制使用者對标簽資料的通路權限,當某個使用者被設定了行級權限後,隻能檢視在權限規則内設定的标簽資料。
新增功能說明:
・支援針對使用者屬性動态設定權限規則,如 1000 條結果資料,使用者 A 檢視 200 條,使用者 B 檢視 500 條
・單個權限辨別可設多條權限規則,且最大支援 5 個層級,條件之間支援配置 “且”、“或” 關系
・權限的适用成員可指定使用者、使用者組、部門、角色,且支援針對使用者屬性動态設定适用成員
3.【多值标簽】- 标簽值分隔去重
多值标簽 的值由一個或多個值組合構成,多個值之間由分隔符進行分隔(系統固定為英文逗号),可在實體 / 關系建立時指定标簽是否多值。
多值型标簽的操作符包括【包含部分、包含所有、不包含、精确比對、模糊比對、不比對、有值、無值】,可選的是分隔并去重後的标簽值。其中:
・包含所有:若選擇多個标簽值,篩選結果将同時符合所有标簽值,即多個标簽值的篩選結果之間使用交集運算;
・包含部分:若選擇多個标簽值,篩選結果将至少符合其中一個标簽值,即多個标簽值的篩選結果之間使用并集運算。
4.【組織架構】- 引入多層級部門
組織架構 是一個組織整體的結構,是企業内部開展業務、落實管理的基本要素。标簽系統支援根據多層級的組織架構添加使用者,并根據部門進行标簽授權、行級權限的控制。
5.【批量操作】- 釋出 / 更新互動更新
・批量釋出:分類展示可釋出、無法釋出的标簽,并說明标簽無法釋出的原因,降低操作門檻
・批量更新:分類展示可更新、無法更新的标簽,并說明标簽無法更新的原因,降低操作門檻
6.【通用模闆】- 查詢模闆設定
設定查詢次元通用模闆,并直接應用于标簽圈群、上傳本地群組、群組交并差選查詢次元的地方,使用者可以在模闆的基礎上增删查詢次元,減少操作成本。
7.【導出描述】- 導出資料時可填描述
使用者在導出資料時可填寫描述資訊,系統将描述資訊記錄在審計日志中。
8. 其他優化項
・标簽圈群支援重置條件