BI系统需要对多数据源的多表进行整合加工,通过可视化元素对结果集进行展示和分析。如何让业务人员通俗易懂的理解表与表之间的关联规则,设计出满足展示分析指标、多维度分析所需的数据模型,是自助式BI产品期望优化的功能。目前自助式BI工具通过可视化数据整合加工处理的方法,降低了技术难度,提高了加工效率。

首先,基于数据库理论,数据表之间的关联关系主要可以分为联接和联合,其中联接包含内联接、外联接等。可视化设计是将SQL中的左联接、右联接、内联接、联合等规则,通过可视化配置界面,匹配表间的关联列和关联方式,形成关联结果集。并在此基础上,进行字段筛选、转义、计算、分组、分类、添加列等二次加工,最终加工为使用者可以看懂的,区分维度和度量的结果集,用于设计报表和仪表板。大大降低了使用者对于SQL功底的要求。让业务人员将精力集中在分析业务数据,优化经营管理上。

以下以Wyn Enterprise商业智能和报表软件为例,展示可视化数据集关联设计的实现步骤和形式。

  1. 选择需要分析的数据所在的数据源;

    示例数据分别来自ERP系统、CRM系统和HRM三个系统数据源;

  2. 选择需要分析的数据表,拖拽至可视化设计面板;从不同的数据源,选择需要关联的表,根据关系,选择联接方式;

  3. 如果有关联列或者同名称列,系统自动匹配,亦支持手动调整,可添加多个匹配列和条件;

  4. 对结果进行二次处理;

  5. 保存,形成结果集,用于设计仪表板。

可以看出,可视化数据模型设计过程中,没有涉及到SQL的使用,系统提供的智能关联匹配功能,快速的将订单表中的客户、产品、雇员等维度字段和客户表、产品表、雇员表等实体表进行关联整合,形成分析模型。当然,如果是具有SQL语言编程能力的技术人员,自助式BI也提供了编辑SQL语句的能力。