当前位置: 首页 > news >正文

厦门中科做网站总打电话来太原竞价托管公司推荐

厦门中科做网站总打电话来,太原竞价托管公司推荐,wordpress插件引入js,java程序员自己做网站Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为 MapReduce任务进行运行。其优点学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计&#xf…

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为

MapReduce任务进行运行。其优点学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,

十分适合数据仓库的统计分析。Hive与HBase的整合功能的实现是利用两者本身对外的API接口互相进行通信,相互通信主要是依靠hive_hbase-handler.jar工具类.

Hive Hbase整合 见官网 Hive HBase Integration:https://cwiki.apache.org/confluence/display/Hive/HBaseIntegration 。

具体步骤整理如下:

集成步骤:

hbase 版本为 0.94.6.1 hive 0.11.0

1,首先将hbase-0.94.6.1/ 目录下的  hbase-0.94.6.1.jar 和 hbase-0.94.6.1/lib下的 zookeeper-3.3.5.jar复制到hive/lib目录下。

    注意:如果hive/lib下已经存在这两个文件的其他版本(例如zookeeper-3.3.3.jar),建议删除后使用hbase下的相关版本.

2,在hive/conf下hive-site.xml文件中添加如下的内容:

 如果hive/conf 目录下没有hive-site.xml 则把此目录下的hive-default.xml.template拷贝一份并命名 为hive-site.xml。

<property><name>hive.aux.jars.path</name>  <value>file:///root/hive-0.11.0/lib/hive-hbase-handler-0.11.0.jar,file:///root/hive-0.11.0/lib/hbase-0.94.6.1.jar,file:///root/hive-0.11.0/lib/zookeeper-3.3.5.jar</value>
</property>
3. 拷贝hbase-0.94.6.1.jar到所有hadoop节点(包括master)的hadoop/lib下。

4. 拷贝hbase/conf下的hbase-site.xml文件到所有hadoop节点(包括master)的hadoop/conf下

注意,如果3,4两步跳过的话,运行hive时很可能出现如下错误:

FAILED: Error in metadata: MetaException(message:org.apache.hadoop.hbase.MasterNotRunningException: ubuntu.ubuntu-domain:60000
    at org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation.getMaster(HConnectionManager.java:394)
    at org.apache.hadoop.hbase.client.HBaseAdmin.<init>(HBaseAdmin.java:83)
    at org.apache.hadoop.hive.hbase.HBaseStorageHandler.getHBaseAdmin(HBaseStorageHandler.java:74)
    at org.apache.hadoop.hive.hbase.HBaseStorageHandler.preCreateTable(HBaseStorageHandler.java:158)
    at org.apache.hadoop.hive.metastore.HiveMetaStoreClient.createTable(HiveMetaStoreClient.java:344)

   不要忘记第3 4步,我曾经忘了这一步  搞了半天!


现在可以尝试启动Hive了。

单节点启动:
1  > bin/hive -hiveconf hbase.master=localhost:60000

集群启动:
1 > bin/hive -hiveconf hbase.zookeeper.quorum=slave1,slave2,slave3,slave4

测试:

 5,测试:

  A, 建立关联表,这里我们要查询的表在hbase中已经存在所以,使用CREATE EXTERNAL TABLE来建立,如下:

CREATE EXTERNAL TABLE hbase_table_1(key string, value string)   
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'   
WITH SERDEPROPERTIES ("hbase.columns.mapping" = "data:1")   
TBLPROPERTIES("hbase.table.name" = "hbase_test"); 
hbase.columns.mapping指向对应的列族;多列时,data:1,data:2;多列族时,data1:1,data2:1;

 hbase.table.name指向对应的表;hbase_table_2(key string, value string),这个是关联表。

我们看一下HBase中要查询的表的结构:

    hbase(main):001:0> describe 'hbase_test'  DESCRIPTION                                                             ENABLED                                 {NAME => 'hbase_test', FAMILIES => [{NAME => 'data', COMPRESSION => 'NONE',  true                                    VERSIONS => '3', TTL => '2147483647', BLOCKSIZE => '65536', IN_MEMORY                                          => 'false', BLOCKCACHE => 'true'}]}                                                                            1 row(s) in 0.0810 seconds  hbase(main):002:0>  

看一下Hbase表中的数据:

    hbase(main):002:0> scan 'hbase_test'  ROW                          COLUMN+CELL                                                                        row11                        column=data:1, timestamp=1300847098583, value=value11                               row12                       column=data:1, timestamp=1300849056637, value=value12                               row21                        column=data:2, timestamp=1300847106880, value=value21                               3 row(s) in 0.0160 seconds  hbase(main):003:0>   

列族:data:1、data:2两个, Key:row1、row12、row21,alue:value1、value12、value21

 hbase_table_1(key string, value string)中对应的test表中的row,value字段对应的是hbase_test表中的value

现在可以来看看查询结果了。

我们在hive命令行中先查看一下hbase_table_1:

    hive> select * from hbase_table_1;  OK  row11    value11  row12   value12  Time taken: 0.197 seconds  hive>  
对比一下hbase_test表中的列族为data:1的数据:

row11                        column=data:1, timestamp=1300847098583, value=value11                               
row12                       column=data:1, timestamp=1300849056637, value=value12

和查询结果相符。


B,创建hbase识别的数据库:

CREATE TABLE test_hbase(key int, value string)
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,cf1:val")
TBLPROPERTIES ("hbase.table.name" = "test_hive"); 

hbase.table.name 定义在hbase的table名称,hbase.columns.mapping 定义在hbase的列族。

在hbase中查看表是否创建成功:

hbase(main):004:0> list
TABLE    
hbase_test                                                                       
test_hive
1 row(s) in 0.0110 seconds

hbase(main):005:0> describe 'test_hive'
DESCRIPTION                                          ENABLED                    {NAME => 'test_hive', FAMILIES => [{NAME => 'cf1',  true                       BLOOMFILTER => 'NONE', REPLICATION_SCOPE => '0', CO                            MPRESSION => 'NONE', VERSIONS => '3', TTL => '21474                            83647', BLOCKSIZE => '65536', IN_MEMORY => 'false',                            BLOCKCACHE => 'true'}]}                                                       
1 row(s) in 0.0300 seconds

导入数据:

我们不能直接使用load data来将数据导入到刚才创建的test_hbase表中,我们可以通过insert overwrite的方式实现数据的插入。

nsert overwrite table test_hbase select * from test_join1;

在HBase中查看通过hive导入的数据是否成功scan 'test_hive'。

scan 'test_hive'
ROW                   COLUMN+CELL                                               1                    column=cf1:val, timestamp=1331278861290, value=SF   2                    column=cf1:val, timestamp=1331278861290, value=DANE       3                    column=cf1:val, timestamp=1331278861290, value=WANG     4                    column=cf1:val, timestamp=1331278861290, value=JULY    5                    column=cf1:val, timestamp=1331278861260, value=EVA     6                    column=cf1:val, timestamp=1331278861260, value=USTC    
6 row(s) in 0.6230 seconds

好,先到这。
http://www.lbrq.cn/news/2796193.html

相关文章:

  • 小程序制作平台代理重庆seo排名收费
  • 什么直播可以做游戏视频网站抖音推广平台
  • 网站关键词排名怎么做快速排名网站
  • 广东省示范校建设专题网站优秀软文范例800字
  • wordpress 学生惠州seo关键词推广
  • 给别人做网站别人违法经营6seo搜索优化公司报价
  • 类似b站的网站怎么做seo文章推广
  • 做文献综述用什么网站唯尚广告联盟app下载
  • 深圳做网站最好上海有哪些优化网站推广公司
  • 建设部人才网站九江seo公司
  • 常用的建站工具有哪些电商平台运营方案思路
  • 有什么做设计接任务的网站推广策划方案怎么做
  • 用php做的网站用什么数据库深圳靠谱网站建设公司
  • wordpress横线广州网站优化软件
  • wordpress增加论坛苏州seo公司
  • 诸城网站优化阿里域名购买网站
  • asp艺术学校网站源码济南seo外包服务
  • p2p网站建设价格百度正版下载恢复百度
  • 网站搭建论文app开发平台
  • 地图网站模板做网络推广可以通过哪些渠道推广
  • 如何在网站上做标记圈信息网站怎么优化关键词
  • 制作网站页面怎么做sem管理工具
  • 购物网站建设报价网站快速收录
  • 建设交通职业技术学院招聘信息网站中国科技新闻网
  • 做商城网站哪里买seo技术员
  • 政治工作网站管理建设网站seo推广公司靠谱吗
  • 台州网站搭建电商网站建设
  • 北京网站建设icp有限公司百度推广个人怎么开户
  • 网站服务器试用游戏广告推广平台
  • 自己做网站去哪买服务器seo建站技巧
  • linux 差分升级简介
  • 升级Android系统webview
  • 项目各功能介绍
  • Temu美国站大规模扫号封店:虚假本土店遭批量封禁,如何规避?
  • sfc_os!SfcQueueValidationRequest函数分析之sfc_os!IsFileInQueue
  • LCC-LCC谐振式无线充电系统控制技术研究的复现