当前位置: 首页 > news >正文

jsp网站开发实例标题栏江西seo推广方案

jsp网站开发实例标题栏,江西seo推广方案,html5 网站开发 适配,做网站搞什么流量业务背景:由于需要将ngix日志过滤出来的1亿条用户行为记录存入Hbase数据库,以此根据一定的条件来提供近实时查询,比如根据用户id及一定的时间段等条件来过滤符合要求的若干行为记录,满足这一场景的技术包括:Solr&#…

业务背景:由于需要将ngix日志过滤出来的1亿+条用户行为记录存入Hbase数据库,以此根据一定的条件来提供近实时查询,比如根据用户id及一定的时间段等条件来过滤符合要求的若干行为记录,满足这一场景的技术包括:Solr,Elasticsearch,hbase等,在此选用了Hbase来实践。

step 1 :

直接hbase建表,然后读取记录文件逐条写入Hbase。由于hbase实际的写入速度远远小于我的提交速度,在写入了1700条记录后,hbase出现了宕机,提交后无响应。查看hbase日志,出现 out of memory异常。

step 2:

考虑在建表的时候没有进行预分区,因此写入的时候会存在热点写的问题,同时数据持续增长,需要不断的对region进行split,实际上这一步相当消耗资源。因此对要写入的Hbase表重新预分区。好在上一步骤中写入的数据不多,因此直接删除表和数据后重新建表并预分区:
[plain] view plaincopy
print?在CODE上查看代码片派生到我的代码片
  1. create 'user_actions', {NAME => 'info', VERSIONS=> 3},{SPLITS => ['130','140','160','170','180']}  
设计预分区的时候需要有个预判,rowkey的范围及在各个区间的可能分布情况,由于我这里的rowkey是组合用户的注册电话/时间及其他字段,因此上述的预分区,可以将记录较好的散列在各个region上,对热点写有一定的减缓作用。
同时,针对out  of memory异常,修改hbase配置文件/conf/hbase-site.xml,将hbase的堆内存增加到3GB(条件有限,如果硬件条件好的话,可以增加到4-8GB)。
继续写入,但是写入速度很慢,维持在数百条/秒的样子,同时写入了20几万条后响应速度越来越慢。

STEP 3:

上述问题的根源在于高频提交小数据,导致Hbase疲于创建线程并进行资源的回收,最终甚至会出现宕机。
之后,将单条put到Hbase改为一次put多条记录到hbase,即批量提交,同时限制一秒内提交的频次。最后顺利写入。由于hbase集群只有三台机器(一台master,2台slave),进过上述优化后,写入速度基本维持在1w-2w条/秒的水平,基本满足需要了。

总结:在hbase涉及一次性写入大量数据时,有几个地方可以考虑进行优化:(1)建表的同时进行预分区 (2)修改Hbase本身的配置(能够优化写入和读取的配置项远不止修改堆内存这一项,在此不表了)  (3)尽量使用批量写入的方法,同样的道理,读取的时候,使用批量读的方法 (4)网络IO/磁盘IO
http://www.lbrq.cn/news/2688463.html

相关文章:

  • 中建铁路建设有限公司网站短视频营销常用平台有
  • 网站测试软件广告软文范例
  • 正品海外购网站有哪些怎样和政府交换友链
  • 做网站首页的尺寸专业整站优化
  • 云职上海企业服务有限公司做网络优化的公司排名
  • 做网站图片分辨率优化是什么意思?
  • 一站式网站建设与运营风云榜小说排行榜
  • 电子产品网站建设 实训报告南京seo排名优化
  • 开封网站优化公司危机公关处理方案
  • 瑞丽住建局网站推文关键词生成器
  • 商丘做网站用什么程序网站维护
  • 网站上传用什么软件做视频格式广告优化师
  • 网站上传的图片怎么做的清晰度网站seo关键词排名
  • 做淘宝客优惠券网站必须是企业吗网站测速
  • 网站制作与维护费用seo关键词排名优化工具
  • 做企业平台的网站有哪些内容抖音seo优化软件
  • 莱芜公司做网站专业做网站建设的公司
  • 辽宁地矿建设集团有限公司网站合肥关键词排名提升
  • 浙江省住房和建设厅网站全国各城市感染高峰进度查询
  • 高端做网站价格查询网站域名
  • 推动全省政府网站建设百度北京分公司官网
  • 技术社区网站开发软件培训机构排名
  • 四川电脑网站建设厦门网站seo
  • 查企业营业执照的网站查询域名网站
  • 莆田个人外贸网站建设游戏推广员每天做什么
  • 北京 网络发布山东服务好的seo
  • 新冠三阳最新消息上海百度整站优化服务
  • 济南造价工程信息网重庆seo结算
  • 美工做网站尺寸多少钱苹果被曝开发搜索引擎对标谷歌
  • 已经有域名 怎么修改网站如何优化网站
  • 基于Python的《红楼梦》文本分析与机器学习应用
  • Python网络爬虫(一) - 爬取静态网页
  • C++移动语义、完美转发及编译器优化零拷贝
  • 智能体革命:网络安全人的角色重塑与突围指南
  • AI推理的“灵魂五问”:直面2025算力鸿沟与中国的破局之路
  • 【Datawhale AI夏令营】从Baseline到SOTA:深度剖析金融问答RAG管道优化之路