当前位置: 首页 > news >正文

好的企业型网站模板交换友链是什么意思

好的企业型网站模板,交换友链是什么意思,免费网站制作新闻,wordpress速度没织梦快2019独角兽企业重金招聘Python工程师标准>>> 介绍 工作中常常会遇到这种情形,需要将hdfs中的大批量数据导入HBase。本文使用SparkHBase的方式将RDD中的数据导入 HBase中。没有使用官网提供的newAPIHadoopRDD接口的方式。使用本文的方式将数据导入HBase, …

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

介绍

  工作中常常会遇到这种情形,需要将hdfs中的大批量数据导入HBase。本文使用Spark+HBase的方式将RDD中的数据导入 HBase中。没有使用官网提供的newAPIHadoopRDD接口的方式。使用本文的方式将数据导入HBase, 7000W条数据,花费时间大概20分钟左右,本文Spark可用核数量为20。

本文使用spark版本为1.3.0,hbase版本为0.98.1

hbase表结构为:表名table,列族Family,列为qualifier。

代码如下:

val readFile = sc.textFile("/path/to/file").map(x => x.split(","))
val tableName = "table"
readFile.foreachPartition{x=> {val myConf = HBaseConfiguration.create()myConf.set("hbase.zookeeper.quorum", "web102,web101,web100")myConf.set("hbase.zookeeper.property.clientPort", "2181")myConf.set("hbase.defaults.for.version.skip", "true")val myTable = new HTable(myConf, TableName.valueOf(tableName))myTable.setAutoFlush(false, false)//关键点1myTable.setWriteBufferSize(3*1024*1024)//关键点2x.foreach { y => {println(y(0) + ":::" + y(1))val p = new Put(Bytes.toBytes(y(0)))p.add("Family".getBytes, "qualifier".getBytes, Bytes.toBytes(y(1)))myTable.put(p)}}myTable.flushCommits()//关键点3}
}

此程序是使用了RDD的foreachPartition函数,在此程序中有三个比较关键的地方。
关键点1_:将自动提交关闭,如果不关闭,每写一条数据都会进行提交,是导入数据较慢的做主要因素。
关键点2:设置缓存大小,当缓存大于设置值时,hbase会自动提交。此处可自己尝试大小,一般对大数据量,设置为5M即可,本文设置为3M。
关键点3:每一个分片结束后都进行flushCommits(),如果不执行,当hbase最后缓存小于上面设定值时,不会进行提交,导致数据丢失。

:此外如果想提高Spark写数据如Hbase速度,可以增加Spark可用核数量。

转载于:https://my.oschina.net/sniperLi/blog/719140

http://www.lbrq.cn/news/2693305.html

相关文章:

  • 问卷调查微信小程序怎么做江门seo
  • 公司品牌网站建设价格糕点烘焙专业培训学校
  • 在百度上做网站seo服务是什么
  • b2c的平台有哪些谷歌搜索优化
  • 最便宜做公司网站广州网站开发多少钱
  • 网站制作 长沙b2b网站平台有哪些
  • 电商网站设计工作内容seo搜索引擎优化到底是什么
  • 成都网站建设推广投放广告的渠道有哪些
  • 厦门微信网站开发百度ai助手入口
  • b2c商城网站建设及运营方案网站推广的方式
  • 网站做ddns解析网站域名查询ip
  • 网业协同重庆企业网站排名优化
  • 中小企业的网站建设论文推广资源seo
  • wordpress插件 ftp银徽seo
  • 网站建设试题品牌推广策略怎么写
  • 私服网站空间seo整站优化费用
  • wordpress 商城 app上海网站推广优化
  • 专门做辅助的扎金花网站seo教程下载
  • 网站建设制作设计优化如何推广小程序
  • 技术难度高的网站开发北京网站优化方式
  • 新公司注册后需要办理哪些好搜seo软件
  • 四川旅游seo整站优化站优化seo价格是多少
  • 网站建设代理多少钱seo推广的公司
  • 电影网站建设公司seo排名优化关键词
  • 化妆品网站建设可行性分析sem推广和seo的区别
  • 潍坊诸城疫情window优化大师官网
  • 泰安医院网站建设企业查询网
  • 网站怎么做显得简洁美观需要推广的app在哪里找
  • 网站建设北京个人武汉疫情最新动态
  • 网站应该如何推广seo整站优化服务
  • Hive 创建事务表的方法
  • 串口通信学习
  • Java 工厂方法模式
  • 跨设备开发不再难:HarmonyOS 分布式任务管理应用全解析
  • 卫生间装修防水怎么做合适?
  • ncurses 6.5 交叉编译移植到OpenHarmomy