当前位置: 首页 > news >正文

做艺术品的网站/免费友链互换

做艺术品的网站,免费友链互换,高德是外国公司吗?,国外域名商使用sqoop将mysql数据导入至hive的本质,其实是数据先导入至hdfs,然后会有一个脚本去执行将hdfs的数据load至hive中。所以我们将数据导入到hive时,其实hdfs中也会有这个数据。 使用sqoop将数据导入至hive时,需要用到一个hive-comm…

使用sqoop将mysql数据导入至hive的本质,其实是数据先导入至hdfs,然后会有一个脚本去执行将hdfs的数据load至hive中。所以我们将数据导入到hive时,其实hdfs中也会有这个数据。

使用sqoop将数据导入至hive时,需要用到一个hive-common-xxx.jar下面的一个类,所以我们需要先将这个jar包上传至sqoop的lib目录下:

  • 添加jar
[root@hadoop01 ~]# cp $HIVE_HOME/lib/hive-common-2.3.9.jar $SQOOP_HOME/lib
  • 启动hive
[root@hadoop02 ~]# hive --service metastore &
  • 导入数据
sqoop import --connect jdbc:mysql://hadoop03:3306/test_sqoop --username root --password 123456 --table emp --hive-import --hive-overwrite --fields-terminated-by ',' --hive-table 'test_data.emp';#导入数据时没有指定在hive中表的名字,那么会直接使用原来在mysql中的表的名字,所以这里数据导入到hive时表名还为emp
#--hive-table 'test_data.emp'指定hive中的库ming.表明,如果不指定,默认导入至default库中
  • 在hive客户端查看数据
hive> use test_data;
OK
Time taken: 0.105 seconds
hive> show tables;
OK
dynamic_partition1
emp
grade
map_grade
mixed_partition
partition1
partition2
test_regex
tmp_dynamic_partition1
tmp_mixed_partition
Time taken: 0.038 seconds, Fetched: 10 row(s)
hive> select * from emp;
OK
2201    Bob     salesman        2205    2018-10-14      660.0   200.0   10
2202    Tina    manager 2206    2013-09-10      3100.0  400.0   20
2203    Alice   president       NULL    2004-05-25      6000.0  1500.0  10
2204    Tony    salesman        2202    2019-07-06      1200.0  300.0   20
2205    Tom     manager 2203    2012-02-18      4200.0  900.0   10
2206    Alex    president       NULL    2006-01-28      5400.0  1400.0  10
Time taken: 0.197 seconds, Fetched: 6 row(s)
  • 查看hdfs中的数据
[root@hadoop01 ~]# hdfs dfs -cat /user/hive/warehouse/test_data.db/emp/*;

  •  将数据导入至hive的指定分区
sqoop import --connect jdbc:mysql://hadoop03:3306/test_sqoop --username root --password 123456 --table emp --hive-import --hive-overwrite --fields-terminated-by ',' --hive-table 'test_data.emp_partition' --hive-partition-key 'test_date' --hive-partition-value '2022-04-11' -m 1;#--hive-partition-key指定分区字段
#--hive-partition-value指定分区的至
#-m 1指定启动一个map进程
  •  查看数据

hive中的数据最后一列加上了分区字段:

 HDFS中也建好了分区目录:

 查看HDFS中的数据:

[root@hadoop01 ~]# hdfs dfs -cat /user/hive/warehouse/test_data.db/emp_partition/test_date=2022-04-11/*;

 以上就是使用sqoop实现mysql数据导入至hive的简单案例。

http://www.lbrq.cn/news/741511.html

相关文章:

  • vuejs做视频网站设计/怎么自己创建网站
  • 南宁网站优化/微商引流人脉推广软件
  • 建设刷钻网站/如何推广app更高效
  • 页面设计布局/宁波seo优化外包公司
  • 网站的容量/武汉谷歌seo
  • 企业网站开发项目策划书/国内网络推广渠道
  • 给人做代工的网站/seo网络营销外包
  • 网站建设要考虑哪些方面/海外发布新闻
  • 网站排名英文怎么说/站长工具 seo综合查询
  • 网站推广公司哎奶茶/论坛优化seo
  • 网站建设合同纠纷问题/谷歌广告上海有限公司官网
  • seo网站建设厦门/关键词分类
  • 潍坊市住房和城乡建设网站/做百度推广代运营有用吗
  • 男女生做爰视频网站/品牌营销策划方案案例
  • 网页升级访问每天正常更新每日/郑州seo技术代理
  • 北京市建设工程质量监督站网站/营销型网站建设的步骤流程是什么
  • 怎么建淘宝优惠券网站做推广/seo优化啥意思
  • c 做网站流程/如何提高网站排名
  • 加强网站建设技术培训/全域seo
  • 企业如何建设网站呢/站长工具大全
  • 西宁做网站公司排名/百度搜索推广是什么
  • 介休市政府网站/如何做网页制作
  • 佛山网站建设专业现状/太原网络推广价格
  • 做购物类网站有哪些/做销售最挣钱的10个行业
  • 软件技术真的很难学吗/windows优化大师是哪个公司的
  • 网站的seo如何设计/企业培训课程安排表
  • 重视党建网站建设/网站推广的方式有
  • 网站建设需求指引/营销推广费用方案
  • 做视频网站要多少钱/免费网站流量
  • 嘉兴本地推广网站/互联网营销推广方案
  • 升级Android系统webview
  • java17学习笔记
  • Hugging Face 核心组件介绍
  • 大语言模型中的归一化实现解析
  • LLM - MCP传输协议解读:从SSE的单向奔赴到Streamable HTTP的双向融合
  • [免费]基于Python的全国气象数据采集及可视化大屏系统(Flask+request库)【论文+源码+SQL脚本】