当前位置: 首页 > news >正文

建筑公司转让/武汉seo公司

建筑公司转让,武汉seo公司,网站公司怎么找客户,动画设计专业属于什么专业大类将近1年半没有使用hbase了,但是我亲爱的老板,专门从北京(分公司)邮寄过来了一台含n个t的hbase数据的服务器硬盘。现在要求我将列族中的数据拿出来,改成特定的格式,生成新的rowkey,虽然hbase在我…

将近1年半没有使用hbase了,但是我亲爱的老板,专门从北京(分公司)邮寄过来了一台含n个t的hbase数据的服务器硬盘。现在要求我将列族中的数据拿出来,改成特定的格式,生成新的rowkey,虽然hbase在我的脑海中已经模糊的像“椰奶”了,但是作为一个优秀的csdn大数据+全栈+产品经理+数据分析专家的程序员。咱不能说不行,于是爽快的答应老板,“这个嘛,很简单,好做”。

咱不像别人心里虚,咱心里也是【表里如一】!自信满满!不就是学一下,复习一下嘛,有什么难的?我赵日天大魔王是厦大的? 独乐乐,不如众乐乐,然后我想着既然自己复习hbase,不如和大家一起复习hbase。于是才有了这篇文章。

首先学习一个东西,你要知道他是什么,此时传来了曲婉婷美妙的歌声,“出现在我脑海里 ~  我的梦里~ 我的话里”,不知不觉我就想到了这首歌,虽然1年半没用了,但是我的脑子里,还是知道hbase是一个数据库,列式数据库(具体什么是列式,稍后给讲架构的时候会告诉大家),【特点】是只能根据rowkey【可以理解为特定的id】查询(查询速度很快)。适合【千万级】以上的数据存储,如果低于1000w,那你还是用mysql等关系型数据库吧。

大概知道了,hbase 是啥东西后,我们来了解一下 由世界巨头“谷歌”发布的bigtable论文构成的hbase,它能风靡全球(大数据圈),那他的内部构成是什么样的呢?想必你也想和我一起,一探究竟吧。

hbase的内部构成,和大家平常所用的软件一样。分为2部分。

第一部分:软件的构造(你可以理解为内部的程序是怎样合作才让hbase运作的起来的)

第二部分:  软件的数据结构设计(对于数据库软件来说,我们要使用,必须先了解他的存储结构)

HBASE软件的构成

先来放一张全网都能搜到的架构图。

 

你看着这图,看见了什么?用1分钟的时间看一下,看完告诉我,你看到了什么。别浪费我从网上cv过来的图啊。1分钟....后

你看完之后,脑海里是不是有,Hbase、Hadoop、HRegion、Hmaster、zookeeper、Client

从图中你肯定能看到,Hbase和Hadoop是有关联的。

你看客户端作为的是什么,是不是所有箭头的起点。那整个过程,咱们来试着跟箭头走一走。

客户端向HRegionServer指向了个箭头,说明客户端能向HRegion服务发送指令。

客户端也指向了谁?是不是zookeeper,那么同样客户端能操控zookeeper。

到了这里,如果你了解zookeeper(中间件),那聪明的你,应该能猜到zookeeper是用来操控hbase集群的。通过客户端去访问zookeeper,再依靠zookeeper操控整个hbase集群。

结论就是:通过客户端去让zookeeper操作整个hbase集群。

Hmaster,就是Hbase的主节点。如果你是用的是一台机器(单节点),那Hmaster不就是Hbase本身吗?你从图中看,Hmaster是不是有2个实线箭头和1个虚线箭头,实现箭头指向了【两个】HRegionServer。虚线箭头指向的是DFS-Client(代表的是HDFS的客户端,实际上会操作hdfs进行数据的读写),当然你写可以在配置文件中将原本指向hdfs的数据,指向本地硬盘。那样就不需要配置hdfs,但是就不能保证集群中数据的高可用了。

2个他代表的是多个节点,你如果还是一台机器,那就是指向1个HRegionServer。说了半天HRegionServer,那么HRegionServer到底是什么呢?

你先不要着急,可以先看看架构图,架构图中你看HregionServer里面有什么?花了30秒时间,看一下。

30秒后。。。

你发现没,1个HRegionServer中有多个HRegion,其实HRegionServer就是用来管理多个HRegion的服务。

那么HRegion又是什么,我们先来看看HRegion里有什么,你会发现有1个HLog、多个Store。

HRegion是用来存储实际数据的。HRegion里面包含了Store、Store又是什么,是存储列族的实际数据。而HLog也是存储数据的。

那么HLog存储的是什么呢,你看完接下来的流程就明白了。

首先来了一条叫做小王八爱吃草的数据,小王八是他的id,爱吃草是他的兴趣。由客户端(如果是集群,则向集群,发送信息,如果不是,则向Hmaster发送信息)

于是Hmaster收到了信息后,将小王八交由他的手下【某个HRegionServer】来处理。

HRegionServer拿到后,将他先存放到HLog里面(可以把HLog想象成一个堆放数据的仓库)。

等待HLog里面的东西差不多了,或者时间到了,再一次性打包带走,存储至Store中。

从HRegion到HLog的过程叫做预写(提高效率,保持稳定性)。Hlog的作用就是作为中继仓库,存储数据的。

其中Store中又有SotreFile和memStore。MemStore是他的元数据,StoreFile是具体的文件。

如果是基于HDFS的数据,会由HFile将数据发送给Hdfs的客户端,交由他们将数据存储至hdfs上。如果是本地,则直接将数据存储至本地中。

HBase数据结构设计

Hbase主要用来存储非结构化和半结构化的松散数据。我们来看看,他的结构是怎么设计的。

由于他只能根据rowkey获取数据,固也能称之为是一个KV数据库。

Column Family对于的info和area称之为列簇,一个列簇可以拥有多个column(列)。

比如name就是一个列,而张三、李四代表的列中的一个格子(cell)又称为数据。

而RowKey称为具体的id,也称为key。

图是从知乎copy来的,固缺少version。version是版本号,代表的是数据插入的时间(以时间戳表示),一个rowkey开源插入多个数据(以时间戳区分)。默认是返回最新的那条数据。

所以说,我们使用hbase的时候甚至不用修改数据,直接插入最新的数据,就相当于是修改。

下面这张图我觉得更好。

 

语法参考https://www.cnblogs.com/xjx767361314/p/10191055.html

如果要修改hbase的rowkey数据,可以使用phonex。使用update。

也可以自己写脚本,比如采用python的Happybase。

参考:https://zhuanlan.zhihu.com/p/54184168

           https://www.cnblogs.com/xjx767361314/p/10191055.html

           https://www.cnblogs.com/frankdeng/p/9310278.html

 

 

http://www.lbrq.cn/news/1241497.html

相关文章:

  • 兼职做网站这样的网站/网络推广外包哪家好
  • 网上做代销上哪个网站/友情链接2598
  • 一个企业做网站的目的/域名备案查询
  • 用html做企业门户网站/企业qq
  • 网站建设佰金手指科捷一/北京网站建设开发公司
  • 在线营销型网站/优化网站排名费用
  • 深圳住房和建设局网站富士锦园/开平网站设计
  • 哪类型网站容易做/网站排名优化制作
  • 深圳网站建设者/seo怎么收费的
  • 如何建设网站app/网站制作工具
  • 个人做网站要注意什么/手机百度提交入口
  • 东莞公司网站制作/个人网站建设
  • 深圳哪家做网站好/社群营销的具体方法
  • 长宁区网站设计建设/推广方案策划
  • 上海的广告公司网站建设/长沙做引流推广的公司
  • 顺德高端网站/西安百度关键词优化
  • 杭州企业网站建设 哪里好/seo搜索优化
  • 东莞深圳网站建设/seo l
  • 电白网站建设公司/网络营销推广的基本手段
  • 网站制作 西安/民生热点新闻
  • 简述网站建设基本流程/如何推广品牌
  • phpcms v9网站建设入门/重庆网站排名提升
  • r语言做网站/关键词seo排名怎么选
  • 在线阅读网站开发教程/百度官方网平台
  • 香港空间做网站速度慢的解决方法/海外网络推广服务
  • 西城 网站公安备案/厦门seo推广外包
  • 信阳高端网站建设/网络营销师证书怎么考
  • 怎么个人网站设计/企业宣传标语
  • 电商网站怎么推广/网站客服系统
  • 网站维护好的方法/域名注册网站
  • 【学习笔记】MySQL技术内幕InnoDB存储引擎——第8章 备份与恢复
  • opencv学习(单模块匹配)
  • 如何理解推理模型
  • 国产开源大模型崛起:使用Kimi K2/Qwen2/GLM-4.5搭建编程助手
  • 【源力觉醒 创作者计划】文心一言与deepseek集成springboot开发哪个更方便
  • 网站技术攻坚与Bug围剿手记