[]
        
在线Demo 免费试用
(Showing Draft Content)

行转列

1. 概述

1.1 功能概述

在ETL流程中,行转列(Pivot)是一种将行数据转换为列的数据重塑操作,常用于将属性-值对结构的数据转换为更适合分析的表格形式。

PixPin_2025-03-25_14-05-59

2. 操作步骤

2.1 前提条件

  1. 节点要求: 确保画布中已包含有效的输入节点或其他处理节点。

2.2 操作步骤

步骤一:添加行转列节点

  1. 左侧节点面板中选择行操作下的行转列,通过拖拽的方式,将行转列节点添加至中间画布区域。

    PixPin_2025-03-25_12-12-45

  2. 通过连线将输入/其他节点与行转列节点连接起来。

    PixPin_2025-03-25_12-15-27

步骤二:重命名节点名称

  1. 单击画布区域的行转列节点,在画布区域下方展开节点配置及预览区域,单击默认节点名右侧的编辑按钮,可重命名该节点。

    PixPin_2025-03-25_12-15-52

步骤三:配置节点属性

以下图的数据为例来进行配置属性的讲解,通过行转列操作,可将原始数据中的属性值(颜色、尺寸)从行数据转换为列字段,实现数据透视效果(如下图所示)。单击画布区域的行转列节点,在画布区域下方展开节点配置及预览区域。

PixPin_2025-03-25_14-05-59

  1. 选择要转换的列

    参考本例,首先选择要转换的列为属性

    PixPin_2025-03-25_14-17-10

  2. 选择用于分组的列

    选择分组依据,能唯一标识行的字段,参考本例,选择订单ID

    PixPin_2025-03-25_14-18-21

  3. 添加新列并指定原始行的值和新的填充值

    单击添加列按钮,可新增一行新的列映射规则,用于设置新列名、原字段值和值字段(如下图所示)。

  • 参数设置:

    • 新列名: 定义转换后的列名称(如"颜色1")。

    • 原字段值: 指定要匹配的原始属性值(如"颜色")。

    • 值字段: 选择包含实际值的源列(通常为"值"列)。

  • 说明: 在“原字段值”中输入原字段的值,用输入的原字段的值在原始表中匹配对应的“”列的值,并将这个值填入到新列。参考本例,用订单ID+颜色,在原始表中匹配到了值为“红色”的值,将这个值填入到“颜色”这个新列当中。

    PixPin_2025-03-25_15-22-47

2.3 成果展示

  1. 配置完成之后,切换到数据页签,即可预览该节点的输出结果。

    PixPin_2025-03-25_15-26-03