![Apache Kylin权威指南(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/797/26261797/b_26261797.jpg)
上QQ阅读APP看书,第一时间看更新
2.4.1 导入Hive表定义
登录Apache Kylin的Web界面,创建新的或选择一个已有项目后,需要做的就是将Hive表的定义导入Apache Kylin。
点击Web界面的“Model”→“Data source”下的“Load Hive Table Metadata”图标,然后输入表的名称(可以一次导入多张表,以逗号分隔表名)(如图2-1所示),点击按钮“Sync”,Apache Kylin就会使用Hive的API从Hive中获取表的属性信息。
![](https://epubservercos.yuewen.com/491023/14693363605380006/epubprivate/OEBPS/Images/t2-1-i.jpg?sign=1738889792-7nznec2q5HEZBCSpFFfsGwiijK7MhEV9-0-d18a23c9f8544303556188e0ba3e9186)
图2-1 输入Hive表名
导入成功后,表的结构信息会以树状形式显示在页面的左侧,可以点击展开或收缩,如图2-2所示。
![](https://epubservercos.yuewen.com/491023/14693363605380006/epubprivate/OEBPS/Images/t2-2-i.jpg?sign=1738889792-QYTDhrXmLc19c0uruxOnjtjI9mvrfuKI-0-b861b439597bcb3686eda6f47043da6b)
图2-2 完成导入的Hive表
同时,Apache Kylin会在后台触发一个MapReduce任务,计算此表每个列的基数。通常稍过几分钟后刷新页面,就会看到基数信息显示出来,如图2-3所示。
![](https://epubservercos.yuewen.com/491023/14693363605380006/epubprivate/OEBPS/Images/t2-3-i.jpg?sign=1738889792-WCLXYuyBpSk7xYelPwwwcnsi17J0ZxLJ-0-98ea2317540592094912811557fbdf28)
图2-3 计算得到的各列基数
需要注意的是,这里Apache Kylin对基数的计算采用的是HyperLogLog的近似算法,与精确值略有误差,但作为参考值已经足够。