天天看点

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

作者:得帆云
数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

过去一个月里,得帆云私有化部署持续更新了许多重点功能。数据采集、数据开发、数据质量、数据资产、数据服务五大功能齐发,Hadoop、Spark、Flink、Python全部都有,为您的企业和组织提供一站式大数据开发解决方案。

为避免大家错过高效率玩转得帆云的机会,重点功能都整理在这里啦,一起来看一下吧~

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

01

aPaaS平台管理补充数据开发插件

本次更新后,可以通过开关aPaaS平台的「数据开发」插件,来约束aPaaS后台「数据开发」插件的开关状态。在aPaaS后台想要使用数据开发插件时,需要联系平台管理员开启。

配置方式:

aPaaS平台管理员在「插件管理」菜单内打开数据开发插件的开关,弹出开启插件对话框。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

按需勾选”后台插件同步开启,且不可关闭"复选框,勾选后单击「确定」按钮,页面返回"操作成功"toast,aPaaS后台的数据开发插件将始终保持开启状态。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

02

aPaaS平台管理补充数据开发插件

租户需要对数据进行采集、清洗、处理和开发,平台已开启数据开发插件,且租户拥有数据开发权限时,租户可自主开启数据开发插件。

配置方式:

打开「数据开发」插件开关,页面返回toast"操作成功",左侧显示数据开发菜单。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

单击"齿轮"图标,可对数据开发插件进行配置,主要包含三部分:连接配置、数据源授权和数据开发成员。

  • 连接配置

在连接配置中输入访问地址(前台访问地址)和服务地址(后端部署地址),以连接数据开发模块。点击「测试连接」按钮,即开始连接。

成功之后,返回toast"连接成功"。单击「确定」按钮后弹框关闭,并保存连接配置。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
  • 数据源授权

单击「添加」按钮,选择欲授权给数据开发模块的aPaaS数据源,该数据源将自动授权给此项目,并添加到项目数据源中。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

在已添加的数据源中存在数据编辑开关,此开关开启后,返回toast"操作成功"。后续使用数据开发功能时,支持对此aPaaS数据源中的数据进行编辑。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
  • 数据开发成员

此处展示所有已创建的项目成员账号,单击「同步数据开发成员」按钮后,将为新增的租户管理员创建账号。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

03

增加数据开发菜单「项目管理」

项目配置包含基本配置、环境配置和其他配置。

在基本配置中支持编辑项目信息、作业类型、资源文件类型和项目成员(项目成员为此租户下的所有租户管理员和具有数据开发权限的人员)。

一个项目默认带一个开发环境和一个生产环境,开发环境用于创建、测试作业流和作业,作业流发布到生产环境之后,将按照配置好的调度周期性运行。在其它配置中可以点击「添加权限组」按钮对该项目创建的API权限做出管理。

每个租户对应一个和租户名称相同的数据开发项目,项目是数据开发过程中管理任务、成员,分配角色和权限的基本单元。在使用后续的数据开发、发布管理、运维中心和数据服务等菜单时,也是基于项目的概念来进行开发的。

配置方式:

  • 基本配置

(1)单击「项目管理」菜单进入基本配置页面。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(2)单击作业类型「编辑」按钮,可对作业类型进行编辑,当作业类型被勾选时,才能新建该类型的作业。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(3)单击资源文件类型「编辑」按钮,可对项目允许资源类型进行编辑,当资源文件类型被勾选时,才能够上传该类型的资源文件。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(4)单击项目成员「编辑」按钮,可以查看具有该项目权限的所有人员以及他们的信息。可修改成员角色,将成员设为审批人或移除成员。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
  • 环境配置

(1)切换到环境配置页签,可查看该项目的环境配置,系统已将资源组和数据源的映射关系一一对应起来,无需手动配置,点击「编辑」可进行修改。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(2)单击「资源组」,可查看该环境使用的资源组。点击「添加」按钮,可将状态为可用的资源组添加至环境中。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(3)单击「计算引擎」可查看该环境计算引擎信息,包括基本信息及调度信息。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(4)单击「数据源」,支持为项目添加外部数据源。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

04

增加数据开发菜单「数据开发」

数据开发为核心模块,我们为开发人员提供在线协同开发平台,包括离线作业、实时作业、函数、资源文件、临时作业等的一系列开发功能。

核心功能离线开发由多个存在依赖关系的作业形成作业流,作业适配各类开发组件,支持包括:Hive、Spark、Flink、ETL(数据转换)、HplSQL、API同步、DDL、Python、数据同步等任务类型作业,满足临时查询、周期调度等不同场景下的数据处理需求。

配置方式:

  • 新建作业流

(1)单击「新增作业流」,输入作业流名称,选择数据分层、业务过程、责任人,描述(选填),单击「确定」按钮, 完成作业流创建。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(2)作业流创建完成后,页面中央出现作业流画布,支持将作业拖动进入画布,连线配置作业流。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(3)单击作业流右侧「属性配置」,可查看并修改属性,包括基本属性、调度配置、依赖配置、基线配置和外部调用。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
  • 调度配置包括三部分,调度状态、生效日期、调度周期和调度时间,具体设置因调度周期的设置而不同。
数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
  • 依赖配置中每个作业流可设置多个上游依赖,当所有的上游作业流都运行完成且到达当前作业的调度时间后,此作业流才会被开始调度。
  • 基线配置中支持选择已经配置好的重试规则, 当作业流发布后的实例运行失败时,将按照配置好的重试规则自动进行重试。
数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
  • 外部调用开关开启后,显示URL和AccessKey,此时发布作业流,当前作业流就可以通过URL和AccessKey被调用。
  • 运行作业流

(1)从左边作业流拖动作业到画布,通过拖拽连线配置依赖关系。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(2)单击「运行」按钮,弹出作业流实例界面,展示运行情况。作业流运行状态分为成功、失败、运行中、待运行,以不同颜色区分。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
  • 发布作业流

保存作业流后,作业流为"已提交"状态。

(1)依次单击各个作业的「提交」按钮,将画布中的作业全部提交。

(2)单击作业流的「发布」按钮,弹出发布作业流列表,支持批量发布,显示文件名称、作业类型、提交人和修改类型。按需勾选后点击确定,待发布的作业流在「发布管理」——「待发布列表」中展示。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
  • 编辑作业流
数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(1)新建目录

点击左侧作业流名称旁的「操作」图标,选择「新建目录」,输入名称并选择目录,点击「确定」按钮完成,会在该作业流下创建新目录。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(2)编辑

点击左侧作业流名称旁的「操作」图标,选择编辑,弹出「编辑作业流」对话框,支持修改作业流名称、责任人和描述,点击「确定」按钮,完成作业流编辑。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(3)新建离线作业

点击左侧作业流名称旁的「操作」图标,选择「新建离线作业」,填充作业名称、作业类型、资源组、目录等信息,点击「确定」按钮,完成新建作业。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(4)删除

点击左侧作业流名称旁的「操作」图标,选择「删除」,弹出二次确认窗口,点击「确定」按钮,完成删除。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
  • 下线作业流

点击下线按钮,返回toast"操作成功",完成下线。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

05

增加数据开发菜单「发布管理」

本次更新后,作业流由开发环境发布到生产环境需要经过发布管理由运维人员审批,审批通过之后在生产环境按照调度周期性运行。数据服务中创建的API需要经过发布管理由运维人员审批通过后才能被调用。

配置方式:

  • 待发布列表

在「发布管理」页面,待发布列表一栏中,可以看到全部待发布的任务。支持在操作中点击「查看」按钮,查看任务的配置详情,包括代码信息、运行参数、备注、调度信息、依赖信息、基线信息等。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(1)勾选文件,选中的文件将显示在右边「所选文件」一栏中,可以对所选文件进行批量删除和创建发布包操作。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(2)点击「创建发布包」按钮,将会对栏中全部文件统一打包,输入发布包名称,点击「确定」按钮进行创建。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
  • 发布历史

(1)成功创建发布包的作业和作业流,被默认放在「发布历史」——「待审核」一栏中。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(2)发布包由项目默认审批人进行审核,审批人可以对发布包进行审批操作,提交者可以对发布包进行撤回操作。

  • 撤回后,发布包回到待提交一栏,允许重新提交和删除;
  • 审批拒绝后,发布包回到待提交一栏,允许重新提交和删除;
  • 审批同意后,发布包进入已发布一栏,并可以查看发布详情及审批意见。
数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

06

增加数据开发菜单「运维中心」

运维中心包括运维总览、实例分析和任务详情模块,提供了作业流、离线作业和实时作业的操作与状态等多方位的运维能力。

  • 运维总览为开发人员提供实时的数据记录、跟踪、追溯和预警提示功能,便于全面的监控数据并做出及时调整。
  • 实例分析对作业流、作业和标签等任务运行情况实时捕捉,记录各任务下产生的实际数据和每个具体的任务内容。
  • 任务详情展示此项目所有处于已发布状态的作业流和作业。

配置方式:

  • 运维总览

提供综合展示界面,对全局所有开发信息例如:作业流、作业、标签等进行运维监控及统计汇总,按运行时段分析,展示当前项目进度。

(1)默认系统当前日期的运行情况。点击运行日期的日历组件,可分别选择查看作业流、离线作业、实时作业、标签和DDL作业的指定日期的运行情况概览。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(2)点击「折线图标」,可直观地看到运行日期当天的作业流、离线作业、实时作业、标签和DDL作业运行情况时段分析的折线图。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
  • 实例分析

(1)实例分析列表支持查看当前项目的作业流实例、离线作业实例、实时作业实例、DDLV实例、标签实例等。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(2)单击蓝色实例ID字样,可进入作业实例页面,支持查看离线作业、DDL作业的运行日志,支持点击下载按钮下载运行日志。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
  • 业务详情

(1)任务详情展示所有处于已发布状态的离线作业和实时作业。点击「下拉图标」,即展开显示该作业流或实时作业下的所有作业。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(2)任务详情中的作业流支持启动/暂停、查看运行实例的操作。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(3)任务详情中的作业支持查看代码/查看配置操作。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

07

增加数据开发菜单「数据服务」

数据服务是基于数据开发的最后一步,数据服务作为统一的数据服务出口,实现了数据的统一化管理,有效地降低数据开放门槛的同时,保障了数据开放的安全。

数据服务将数据开发生成的表数据信息,以生成API的方式提供给被允许的IP调用。

配置方式:

  • 新建API

(1)单击进入「数据服务」菜单,此处展示的是当前租户下生成的所有API。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(2)点击「新建API」按钮,填写API编码,API名称,path,选择请求类型、认证类型,描述(选填),点击「下一步」按钮。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
  • 配置API

在下一步页面填写配置信息。包括基本信息、字段信息与参数信息。

(1)在基本信息一栏选择数据源类型、存储空间/数据源名称和数据库表名。填完基本信息后,字段信息中会展现所选数据表中的所有字段,包括字段名称、字段类型和字段描述。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(2)勾选需要添加的请求参数与返回参数,下方参数列表会显示已选择的请求参数与返回参数。请求参数支持修改参数名称、参数类型、操作符、是否必填,填写示例值、默认值与描述等。返回参数支持修改参数名称、参数类型、示例值与描述。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(3)当勾选「返回结果分页」复选框时,在请求参数页面显示page和pageSize。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(4)点击「保存」按钮,完成创建。

  • 测试API

(1)点击「下一步」按钮,进入测试页面。

(2)请求参数中有默认值时,可以点击「开始测试」按钮,直接测试。

(3)测试完成后,在右侧显示请求详情、返回内容、测试是否成功以及响应时间。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布
  • 编辑API
  • 在API列表中点击右侧的「操作」图标,选择「编辑」,即进入编辑页面;
  • 已发布的API不允许编辑。
  • 发布API

方法一:测试成功后,点击「提交」按钮,确定后,API即被提交到「发布管理」——「待发布」列表中。

方法二:在API列表中点击右侧的「操作」图标,选择「发布」,弹出确认窗口,点击「确定」按钮,API即被提交到「发布管理」——「待发布」列表中。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

在「发布管理」页面经审批人审批之后,API状态变更为"已发布"。

  • 下线API

在API列表中点击右侧的「操作」图标,选择下线,弹出确认窗口,点击「确定」按钮,完成下线。

  • 调用API

只有处于"已发布"状态的API才能被调用。

(1)点击需要调用的API编码,进入详情页面。可以查看此API的调用地址、AccessKey和请求参数。

数据处理能力超大升级!得帆云aPaaS数据开发模块正式发布

(2)可借助Postman接口测试工具尝试对生成的API进行调用。

数据是公司的资产,组织必须从中获取业务价值,最大程度地降低风险并进一步开发利用数据。

得帆云aPaaS数据开发模块的更新上线,可帮助企业沉淀业务数据,创造数据价值,实现业务数据化与数据业务化的双向循环。aPaaS数据开发模块从整体流程出发,帮助客户更早、更及时、更高效地发现数据问题,确保企业数据的可用性、安全性和高质量,从而实现数据治理。

以上就是得帆云上期数据开发功能的主要更新内容,集适用业务场景拓展、工作效率提高、产品功能个性化,三大优势于一体。得帆云致力于全方位完善客户的使用体验。

继续阅读