博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Kylin的简单使用
阅读量:3882 次
发布时间:2019-05-23

本文共 1480 字,大约阅读时间需要 4 分钟。

1. 创建工程

在这里插入图片描述

2. 获取数据源

在这里插入图片描述

3. 选择数据表

选择所需数据表,并点击Sync按钮

在这里插入图片描述

4. 问题

model中的维度表dwd_dim_user_info_his为拉链表、dwd_dim_sku_info为每日全量表,故使用整张表作为维度表,必然会出现订单表中同一个user_id或者sku_id对应多条数据的问题

  1. 在hive中创建维度表的临时表,该临时表中只存放维度表最新的一份完整的数据,在kylin中创建模型时选择该临时表作为维度表。
  1. 与方案一思路相同,但不使用物理临时表,而选用视图(view)实现相同的功能。(采用)
create view dwd_dim_user_info_his_view as select * from dwd_dim_user_info_his where end_date='9999-99-99';--全量维度表视图create view dwd_dim_sku_info_view as select * from dwd_dim_sku_info where dt=date_add(current_date,-1);--当前情形我们先创建一个2020-03-10的视图create view dwd_dim_sku_info_view as select * from dwd_dim_sku_info where dt='2020-03-15';

在这里插入图片描述

在这里插入图片描述

5. 创建model

  1. 点击Models,点击"+New"按钮,点击"★New Model"按钮。

在这里插入图片描述

  1. 填写Model信息,点击Next

在这里插入图片描述

  1. 指定事实表

在这里插入图片描述

  1. 选择维度表,并指定事实表和维度表的关联条件,点击Ok

在这里插入图片描述

  1. 指定维度字段,并点击Next

在这里插入图片描述

  1. 指定度量字段,并点击Next

在这里插入图片描述

  1. 指定事实表分区字段(仅支持时间分区),点击Save按钮,model创建完毕

在这里插入图片描述

6. 构建Cube

  1. 点击new, 并点击new cube

在这里插入图片描述

  1. 填写cube信息,选择cube所依赖的model,并点击next

在这里插入图片描述

  1. 选择所需的维度

在这里插入图片描述

  1. 选择所需度量值
    在这里插入图片描述
  1. cube自动合并设置,cube需按照日期分区字段每天进行构建,每次构建的结果会保存在Hbase中的一张表内,为提高查询效率,需将每日的cube进行合并,此处可设置合并周期。

在这里插入图片描述

  1. Kylin高级配置(优化相关,暂时跳过)

在这里插入图片描述

  1. Kylin相关属性配置覆盖

在这里插入图片描述

  1. Cube信息总览,点击Save,Cube创建完成

在这里插入图片描述

  1. 构建Cube(计算),点击对应Cube的action按钮,选择build
    在这里插入图片描述
  1. 选择要构建的时间区间,点击Submit
    (这里我选择我表中15号的数据)

在这里插入图片描述

  1. 点击Monitor查看构建进度

在这里插入图片描述

7. 测试

我换了一个表

select    ui.gender,    si.category3_id,    dp.region_id,    sum(od.total_amount)from    dwd_fact_order_detail odjoin    dwd_dim_user_info_his_view uion    od.user_id=ui.idjoin    dwd_dim_sku_info_view sion    od.sku_id=si.idjoin    dwd_dim_base_province dpon    od.province_id=dp.idgroup by    ui.gender,si.category3_id,dp.region_id;

在这里插入图片描述

8. Life

自己不能胜任的事情,切莫轻易答应别人,一旦答应了别人,就必须实践自己的诺言。——华盛顿

在这里插入图片描述

转载地址:http://ytzhn.baihongyu.com/

你可能感兴趣的文章
glibc 指导委员会解散声明
查看>>
Linux创始者托瓦兹谈及IoT --「安全在其次」
查看>>
传感器数据分析(Sensor Data Analytics)是什么?
查看>>
智能硬件开发如何选择低功耗MCU?
查看>>
阿里感悟(十)如何写好简历
查看>>
阿里感悟(十一)如何准备面试
查看>>
软件架构入门
查看>>
80 多个 Linux 系统管理员必备的监控工具
查看>>
OOD的原则
查看>>
Tool to trace local function calls in Linux
查看>>
Linux 下查询 DNS 服务器信息
查看>>
ulimit 里的 file size 的 block 单位是多少?
查看>>
linux下查看端口对应的进程
查看>>
将 gdb 用作函数跟踪器 (Function Tracer)
查看>>
原 GCC一些有用的技巧
查看>>
yum 变量追加的方法
查看>>
2倍速的下一代Bluetooth,「Bluetooth 5」发布
查看>>
Top 10 “Yum” installables to be productive as a developer on Red Hat Enterprise Linux
查看>>
[小技巧] Vim 如果去除 “existing swap file” 警告
查看>>
如何在linux下检测内存泄漏
查看>>