[]
抽取模型支持从ETL查询对数据整合处理,通过高效清洗、转换与聚合能力,既能满足复杂业务场景需求,又能为数据应用提供高质量基础。
界面状态: 已进入抽取模型的数据准备界面。
步骤一:从ETL查询获取数据
数据准备界面,单击上方菜单栏的「数据>获取数据>来自ETL查询」,进入ETL查询数据处理界面。
步骤二:配置获取数据
在ETL查询数据处理界面,支持完整的数据处理流程:
输入:配置数据源接入
处理:执行数据转换操作
输出:定义结果存储方式
步骤三:指定输入
ETL查询设计器界面,选择左侧节点面板的输入节点拖动到画布区域。
单击画布区域的输入节点,在画布区域下方展开节点配置及预览区域,单击选择数据表,进入数据源选择界面,选择已经创建好的数据源,作为数据流处理的起点。
选择数据表对话框中,选择了数据源,用户可通过两种方式进行配置:
表: 用户可直接从所选数据源中挑选特定的表,将其作为输入数据。这种方式操作便捷,适用于对数据源结构熟悉且无需复杂数据筛选的场景,能快速获取完整的表数据。
自定义SQL: 用户可自行输入 SQL 查询语句,系统会执行该语句并将查询结果作为输入数据。此方式灵活性高,用户能够依据自身需求,运用 SQL 强大的查询和筛选功能,精准提取所需数据,实现复杂的数据处理逻辑。
更多详细信息,请参考 ETL查询-输入。
步骤四:添加数据处理命令
指定输入节点后,可以通过添加一系列的数据处理节点对数据进行更进一步的加工,更详细的数据处理节点说明,请参考:ETL查询。
针对不同的处理需求,我们提供了三大组节点(列操作/行操作/合并数据) 供用户选择,用户将所需的节点拖到画布区域,通过连线与上一节点进行连接并完成其他配置(下面gif为便于演示,先筛选部分关键列展示,然后通过添加列命令计算金额字段):
步骤五:查看节点预览数据
正确完成节点配置后,单击任意节点,在画布区域下方展开该节点配置及预览区域,单击数据,切换到数据页签,即可预览数据。
步骤六:指定输出
数据处理流程中,每一条数据流都必然以 “输出” 节点作为收尾环节。“输出” 节点,其核心作用在于明确规定用于输出 ETL 流程所产生结果数据的表格结构。支持修改输出节点名称,该名称将作为最终输出的表名。
步骤七:运行并保存
正确配置了ETL查询,可以先单击运行按钮,查看是否能成功运行。
运行成功后,先单击保存按钮保存ETL查询,然后关闭ETL查询设计器。
关闭后ETL设计器后,进行数据的抽取。抽取完成后表状态显示为成功,单击完成按钮即可将表添加至模型当中并自动保存抽取结果。
步骤八:查看模型表
数据抽取成功后,在数据准备界面,左侧面板中显示添加的表,在中间的画布区域以图形的方式显示表及其表间关系。
单击表名可以查看/编辑表属性
单击表名后的操作图标,支持更多表管理功能
表操作图标说明:
图标 | 说明 |
---|---|
预览表数据: 快速查看表内数据 | |
编辑表: 调整表结构或配置 | |
更多设置: 支持创建新指标、使用分析表达式添加指标或删除表 |
步骤九:验证并保存模型
完成数据配置后,可对模型做其他设置(例如筛选数据),然后单击顶部菜单栏的验证按钮,系统将自动检查模型逻辑的准确性。
验证通过后,单击保存按钮即可保存模型。保存成功的模型可在「文档门户>我的分析>数据模型」进行查看,支持对模型进行管理及分享,被分享用户可在仪表板中选择并使用该模型进行数据展示。
步骤十:在仪表板中使用抽取模型
参考在仪表板中使用抽取模型。
多输入支持: 可根据数据处理需求添加多个"输入"节点,实现多数据源整合。
输出要求: ETL查询必须包含至少1个"输出"命令,否则无法保存
数据预览: 默认显示1000行,可调整但可能影响性能。调整可参考ETL查询的预览行数设置。