[]
在ETL流程中,行转列(Pivot)是一种将行数据转换为列的数据重塑操作,常用于将属性-值对结构的数据转换为更适合分析的表格形式。
节点要求: 确保画布中已包含有效的输入节点或其他处理节点。
步骤一:添加行转列节点
左侧节点面板中选择行操作下的行转列,通过拖拽的方式,将行转列节点添加至中间画布区域。
通过连线将输入/其他节点与行转列节点连接起来。
步骤二:重命名节点名称
单击画布区域的行转列节点,在画布区域下方展开节点配置及预览区域,单击默认节点名右侧的编辑按钮,可重命名该节点。
步骤三:配置节点属性
以下图的数据为例来进行配置属性的讲解,通过行转列操作,可将原始数据中的属性值(颜色、尺寸)从行数据转换为列字段,实现数据透视效果(如下图所示)。单击画布区域的行转列节点,在画布区域下方展开节点配置及预览区域。
选择要转换的列
参考本例,首先选择要转换的列为属性。
选择用于分组的列
选择分组依据,能唯一标识行的字段,参考本例,选择订单ID。
添加新列并指定原始行的值和新的填充值
单击添加列按钮,可新增一行新的列映射规则,用于设置新列名、原字段值和值字段(如下图所示)。
参数设置:
新列名: 定义转换后的列名称(如"颜色1")。
原字段值: 指定要匹配的原始属性值(如"颜色")。
值字段: 选择包含实际值的源列(通常为"值"列)。
说明: 在“原字段值”中输入原字段的值,用输入的原字段的值在原始表中匹配对应的“值”列的值,并将这个值填入到新列。参考本例,用订单ID+颜色,在原始表中匹配到了值为“红色”的值,将这个值填入到“颜色”这个新列当中。
配置完成之后,切换到数据页签,即可预览该节点的输出结果。