[]
在ETL流程中,连接(Join) 节点用于根据执行条件将两个数据来源合并为一个结果集,其行为与关系型数据库中的Join关键字一致。支持四种连接方式:
原始数据 | 内连接效果 | 左连接效果 | 右连接效果 | 全连接效果 |
---|---|---|---|---|
节点要求: 确保画布中已包含两个有效的输入节点或其他处理节点,以合并为单一结果集。
步骤一:添加连接节点
左侧节点面板中选择合并数据下的连接节点,通过拖拽的方式,将连接节点添加至中间画布区域。
通过连线将输入/其他节点与连接节点连接起来。
步骤二:重命名节点名称
单击画布区域的连接节点,在画布区域下方展开节点配置及预览区域,单击默认节点名右侧的编辑按钮,可重命名该节点。
步骤三:配置节点属性
以下图的数据为例来进行配置属性的讲解,通过连接操作,可将多个数据源智能关联为统一结果集,为后续分析提供完整数据视图(如下图所示)。单击画布区域的连接节点,在画布区域下方展开节点配置及预览区域。
选择连接方式
选择连接方式,提供四种连接方式供用户选择,默认为内连接(Inner Join)。
连接方式说明:
连接类型 | 左表 | 右表 | 结果说明 |
---|---|---|---|
内连接(Inner Join) | 匹配 | 匹配 | 两表交集 |
内连接(Left Join) | 全部 | 匹配 | 左表全集+右表匹配,右表无匹配时自动填充NULL值 |
右连接(Right Join) | 匹配 | 全部 | 右表全集+左表匹配,左表无匹配时自动填充NULL值 |
全连接(Full Join) | 全部 | 全部 | 两表并集,未匹配字段自动填充NULL值 |
选择用于连接的列
系统默认自动匹配多源的同名连接列,支持自定义修改或添加多列组合条件,确保数据精确关联。
配置完成之后,切换到数据页签,即可预览该节点的输出结果。