当前位置: 首页 > news >正文

用护卫神做网站友谊平台

用护卫神做网站,友谊平台,wordpress页面颜色,大连疫情最新情况最新消息大家都熟悉文件系统,在对HDFS进行分析前,我们并没有花非常多的时间去介绍HDFS的背景。毕竟大家对文件系统的还是有一定的理解的,并且也有非常好的文档。在分析Hadoop的MapReduce部分前,我们还是先了解系统是怎样工作的&#xff0c…
大家都熟悉文件系统,在对HDFS进行分析前,我们并没有花非常多的时间去介绍HDFS的背景。毕竟大家对文件系统的还是有一定的理解的,并且也有非常好的文档。在分析Hadoop的MapReduce部分前,我们还是先了解系统是怎样工作的,然后再进入我们的分析部分。

以下的图来自

http://horicky.blogspot.com/2008/11/hadoop-mapreduce-implementation.html,是我看到的讲MapReduce最好的图。



 

以Hadoop带的wordcount为样例(以下是启动行):
hadoop jar hadoop-0.19.0-examples.jar wordcount /usr/input/usr/output
用户提交一个任务以后,该任务由JobTracker协调,先运行Map阶段(图中M1,M2和M3),然后运行Reduce阶段(图中R1和R2)。

Map阶段和Reduce阶段动作都受TaskTracker监控。并运行在独立于TaskTracker的Java虚拟机中。


我们的输入和输出都是HDFS上的文件夹(如上图所看到的)。输入由InputFormat接口描写叙述,它的实现如ASCII文件,JDBC数据库等。分别处理对于的数据源,并提供了数据的一些特征。通过InputFormat实现,能够获取InputSplit接口的实现,这个实现用于对数据进行划分(图中的splite1到splite5。就是划分以后的结果)。同一时候从InputFormat也能够获取RecordReader接口的实现。并从输入中生成<k,v>对。有了<k,v>,就能够開始做map操作了。


map操作通过context.collect(终于通过OutputCollector. collect)将结果写到context中。当Mapper的输出被收集后,它们会被Partitioner类以指定的方式区分地写出到输出文件中。我们能够为Mapper提供Combiner,在Mapper输出它的<k,v>时,键值对不会被立即写到输出里。他们会被收集在list里(一个key值一个list)。当写入一定数量的键值对时。这部分缓冲会被Combiner中进行合并,然后再输出到Partitioner中(图中M1的黄颜色部分相应着Combiner和Partitioner)。
Map的动作做完以后。进入Reduce阶段。这个阶段分3个步骤:混洗(Shuffle),排序(sort)和reduce。


混洗阶段,Hadoop的MapReduce框架会依据Map结果中的key,将相关的结果传输到某一个Reducer上(多个Mapper产生的同一个key的中间结果分布在不同的机器上,这一步结束后,他们传输都到了处理这个key的Reducer的机器上)。这个步骤中的文件传输使用了HTTP协议。
排序和混洗是一块进行的,这个阶段将来自不同Mapper具有同样key值的<key,value>对合并到一起。


Reduce阶段。上面通过Shuffle和sort后得到的<key, (list of values)>会送到Reducer. reduce方法中处理,输出的结果通过OutputFormat。输出到DFS中。

很多其它精彩内容请关注:http://bbs.superwu.cn 

关注超人学院微信二维码:

关注超人学院java免费学习交流群:

http://www.lbrq.cn/news/2805553.html

相关文章:

  • 麻烦各位童鞋视频优化是什么意思
  • 做什么网站营销型网站建设模板
  • 定制化网站建设个人免费建站软件
  • 建设企业网站的时间百度热搜广告位
  • 苗木网站建设短视频seo优化排名
  • 成全免费观看在线看站内seo优化
  • 外贸做企业什么网站建设关键词搜索指数
  • 动物园网站建设的可行性分析app推广实名认证接单平台
  • 做logo的比赛网站管理方面的培训课程
  • 五屏网站建设如何论坛推广怎么做
  • wordpress企业官网主题下载网络优化工程师前景如何
  • 鞍山做网站的慧聪网seo页面优化
  • 网站图文列表济南seo整站优化价格
  • 网页设计与网站建设第05章在线测试客户推广渠道有哪些
  • 用ps做网站画布一般建多大百度广告代理商查询
  • 网站模板带有sql后台下载百度指数官网查询
  • 网站关键词怎么做排名靠前线上培训机构排名前十
  • 重庆制作手机网站公司网页制作模板
  • asp室内装修装潢网站源码河源市seo点击排名软件价格
  • 深圳几百元做网站seo网站优化建议
  • 360搜索建站公司湖南网站推广公司
  • 浙江网站建设推广公司哪家权威重庆百度竞价开户
  • 企业宣传网站案例产品推广计划
  • 天津站建站时间河南seo
  • 申请免费网站注册如何做网页链接
  • 重庆汽车网站建设跨境电商有哪些平台
  • 双十一网站建设活动西安seo工作室
  • 凤翔网站开发软文广告经典案例300
  • 怎样做娱乐网站色盲测试卡
  • 去哪儿网站做宣传多少钱上海网站建设制作
  • 一、Python IDLE安装(python官网下的环境安装)
  • Linux之Ubuntu入门:Vmware中虚拟机中的Ubuntu中的shell命令-常用命令
  • 高通Camx相机dump yuv和raw图的抓取方式和查看
  • 高压、高功率时代,飞机电气系统如何保障安全?
  • 数据工程师——ETL
  • Jmeter自动化性能测试常见问题汇总