[]
在ETL流程中,联合(Union) 节点用于合并查询结果,将多个数据来源合并为一个结果集,其行为与关系型数据库中的Union关键字一致。支持包含所有列和仅包含相同列两种输出列模式。
节点要求: 确保画布中至少已包含两个有效的输入节点或其他处理节点,以合并为单一结果集。
步骤一:添加修改列类型节点
左侧节点面板中合并数据操作下的联合节点,通过拖拽的方式,将联合节点添加至中间画布区域。
通过连线将输入/其他节点与联合节点连接起来。由于联合(Union)节点的功能是将两个数据来源合并为一个结果集,所以该节点需要2个前置节点与之关联。
步骤二:重命名节点名称
单击画布区域的联合节点,在画布区域下方展开节点配置及预览区域,单击默认节点名右侧的编辑按钮,可重命名该节点。
步骤三:配置节点属性
以下图的数据为例来进行配置属性的讲解,通过联合操作,可将多个数据源智能合并为统一结果集,为后续分析提供完整数据视图(如下图所示)。单击画布区域的联合节点,在画布区域下方展开节点配置及预览区域。
选择输出列
默认提供两个选项供用户选择。
具体说明:
选项名称 | 选项说明 | 示例图 |
---|---|---|
包含所有列 | 通过列名自动匹配,合并两个数据源为并集,未匹配列自动填充Null值。 | |
仅包含相同列 | 自动匹配相同列名,仅保留两表共有的列。 |
配置完成之后,切换到数据页签,即可预览该节点的输出结果。
选择输出列 | 成果展示 |
---|---|
包含所有列 | |
仅包含相同列 |
Wyn 的联合(Union)节点默认采用Union All操作模式(保留所有记录),以最大化处理性能。如需去除重复数据,请搭配“去除重复项”节点使用。