[]
在缓存数据集中,通过ETL处理数据并输出为数据表,该数据表可与其他数据表无缝集成,支持后续的运算与分析操作。
数据源: 确保系统已成功创建可用的数据源/数据集。
界面状态: 已进入缓存数据集的数据准备界面。
步骤一:进入ETL查询界面
用户登录 Wyn ,进入文档门户,单击创建文档,选择仪表板/报表的准备数据,单击缓存数据集,进入缓存数据集的数据准备界面。
在缓存数据集的数据准备界面中,单击“ETL查询”,打开ETL查询设计器。
步骤二:指定输入
ETL查询设计器界面,选择左侧节点面板的输入节点拖动到画布区域。
单击画布区域的输入节点,在画布区域下方展开节点配置及预览区域,单击选择数据表,进入数据源选择界面,选择已经创建好的数据源,作为数据流处理的起点。
选择数据表对话框中,选择了数据源,用户可通过两种方式进行配置:
表: 用户可直接从所选数据源中挑选特定的表,将其作为输入数据。这种方式操作便捷,适用于对数据源结构熟悉且无需复杂数据筛选的场景,能快速获取完整的表数据。
自定义SQL: 用户可自行输入 SQL 查询语句,系统会执行该语句并将查询结果作为输入数据。此方式灵活性高,用户能够依据自身需求,运用 SQL 强大的查询和筛选功能,精准提取所需数据,实现复杂的数据处理逻辑。
更多详细信息,请参考 ETL查询-输入。
步骤三:添加数据处理命令
指定输入节点后,可以通过添加一系列的数据处理节点对数据进行更进一步的加工,更详细的数据处理节点说明,请参考:ETL查询。
针对不同的处理需求,我们提供了三大组节点(列操作/行操作/合并数据) 供用户选择,用户将所需的节点拖到画布区域,通过连线与上一节点进行连接并完成其他配置(下面gif为便于演示,先筛选部分关键列展示,然后通过添加列命令计算金额字段):
步骤四:查看节点预览数据
正确完成节点配置后,单击任意节点,在画布区域下方展开该节点配置及预览区域,单击数据,切换到数据页签,即可预览数据。
步骤五:指定输出
数据处理流程中,每一条数据流都必然以 “输出” 节点作为收尾环节。“输出” 节点,其核心作用在于明确规定用于输出 ETL 流程所产生结果数据的表格结构。支持修改输出节点名称,该名称将作为最终输出的表名。
步骤六:运行并保存
正确配置了ETL查询,可以先单击运行按钮,查看是否能成功运行。
运行成功后,先单击保存按钮保存ETL查询,然后关闭ETL查询设计器。
关闭后ETL设计器后将返回到缓存数据集设计器,输出的ETL查询结果数据表可直接参与后续的数据集设计。
单ETL限制: 每个缓存数据集仅支持1个ETL查询。
输入要求: 至少1个输入节点,支持多数据源整合,多个输入需按需整合处理数据。
输出要求: 必须包含1个输出命令(唯一)。
数据预览: 默认显示1000行,可调整但可能影响性能。调整可参考ETL查询的预览行数设置。
与抽取模型区别: ETL查询仅允许单输出,而抽取模型支持多输出。