当前位置: 首页 > news >正文

站长工具seo综合查询排名/seo网页优化培训

站长工具seo综合查询排名,seo网页优化培训,个人网站做淘宝客商城,如何做医美机构网站观察分析导读:本文介绍了Hadoop和MapReduce的概念以及工作原理,并分析了它们在未来的商业智能系统中所扮演的角色。 关键词:Hadoop MapReduce 大数据 商业智能 数据库 NoSQL 【TechTarget中国原创】现在,当人们提到大数据的时候首先…
导读:本文介绍了Hadoop和MapReduce的概念以及工作原理,并分析了它们在未来的商业智能系统中所扮演的角色。

关键词:Hadoop MapReduce 大数据 商业智能 数据库 NoSQL

【TechTarget中国原创】现在,当人们提到大数据的时候首先想起的技术往往是Hadoop MapReduce,像Hadoop这样的分布式架构在10年之前的运用是非常少的——互联网发展刚刚起步,从地球诞生到2003年的全球数据量一共是5EB,而我们现在每两天就能生成5EB的数据。传统的交易数据库在应对数据激增的挑战时已经显现出不足,企业越来越多地开始部署数据仓库、商业智能系统来进行数据分析等工作。随着Hadoop MapReduce在大数据方面起到了越来越重要的作用,那么我们今天就在这里了解一下什么是Hadoop MapReduce,它们对如今的IT起着怎样的作用。

  什么是Hadoop?

  Hadoop是一个分布式系统架构,它可以用来应对海量数据的存储,而这样的数据量往往是以PB甚至ZB来计算的。Hadoop的存储系统我们称作Hadoop Distributed File System(HDFS),它是由Doug Cutting创建的,其灵感来源于Google的一篇学术论文。Doug Cutting是谁呢?著名Apache开源项目Lucene和Nutch的作者。重要的是Hadoop也是开源的。

Hadoop项目创始人Doug Cutting

  什么是MapReduce?

  拿新浪微博来举个例子,用户每分钟都会生成几万甚至几十万条信息,这个数据量是非常大的。新浪的数据中心有大量的服务器在生成数据,那么我们如何能够快速地访问这些数据?Hadoop使用的就是MapReduce,它的概念第一次出现也是在Google的论文中。MapReduce遵循“分治法”,数据以KeyValue对来组织。它以并行的方式来处理一个计算节点中的数据,这些数据会分布在许多不同的系统当中。对数据进行整理分类之后进行处理。

  Hadoop MapReduce的影响

  针对一个标准PC服务器,Hadoop将连接到所有的服务器然后将数据分布到这些节点当中。它将所有的节点视为一个大的文件系统,对数据进行存储和处理,因此它是一个100%的分布式文件系统。如果数据量增加到之前系统无法承受的情况,我们还可以增加额外的节点,让整个系统的扩展性更好。Hadoop MapReduce在成本方面同商业软硬系统相比具有一定优势,因为其开源的属性。随着Hadoop的逐渐普及,相信技术人员成本也会进一步降低,Hadoop的价值也将凸显出来。此外,Hadoop还是NoSQL数据库的主要部署架构之一。

  目前,Hadoop项目已经由Yahoo公司转移到了Hortonworks,这是一家硅谷风投公司Benchmark Capital与前者合资组建的公司,他们将继续开发该技术。雅虎软件工程副总裁Eric Baldeschwieler将担任Hortonworks公司CEO。而最近,Hadoop的支持者之一社交网站Facebook也迁移了30 PB的Hadoop集群。除了开源社区的支持,Hadoop也得到了商业软件供应商的青睐,据笔者了解,越来越多的传统数据库厂商也在他们的产品中逐渐增加Hadoop特性,其中包括了Oracle、Teradata等。以下厂商的数据仓库和BI产品已经添加了对Hadoop和MapReduce的支持:

  •   Greenplum
  •   Informatica
  •   Teradata(AsterData)
  •   Pentaho
  •   Talend

  总之,如果Hadoop MapReduce以及NoSQL等技术得到广泛运用的话,传统SQL数据库系统不能解决的非结构化数据将不再成为问题。而大数据概念不断推广,Hadoop与商业系统的搭配将成为一种必然的趋势,数据集成软件也将在数据挖掘等场景中扮演重要的角色。


http://www.lbrq.cn/news/837559.html

相关文章:

  • 著名的设计网站/杭州seo整站优化
  • 做游戏的网站的公司/百度官方网首页
  • sap和国家网站做接口/seo职业技能培训班
  • 智联招聘网站怎么做两份简历模板/中山seo排名
  • 做受免费网站/西安百度关键词推广
  • 做美妆的网站/网站推广的四个阶段
  • 推广网站利润/google浏览器下载安装
  • 如何让自己的网站排名靠前/全国疫情实时资讯
  • 网站gif小图标/怎么自己制作一个网站
  • 建站平台是给谁用的/网络营销策略主要包括
  • 公众号开发信息开发者密码是什么/电子商务seo是什么意思
  • 在那个网站做直播好赚钱吗/谷歌搜索入口
  • tplink虚拟服务器做网站/公司运营策划方案
  • 专业网站建设微信网站定制/做一个电商平台大概需要多少钱
  • 如何搭建网站教程视频/长春网站优化指导
  • 做教育类网站一般流程/百度竞价有点击无转化
  • 深圳市住房和城乡建设局网站首页/深圳网络营销推广招聘网
  • 不备案怎么做淘宝客网站吗/南宁seo推广优化
  • 南山医院网站建设/凡科建站登录官网
  • wordpress重新生成标签/seo对网站优化
  • 威海网站建设兼职/站优云seo优化
  • 做网站能力介绍/营销策略包括哪些内容
  • 汽车网站更新怎么做/百度推广是怎么做的
  • wordpress建站的案例/网络推广优化方案
  • 阜宁网站制作费用/免费国外ddos网站
  • 公司网站高端网站建设/真正免费的网站建站平台运营
  • 化妆品做的不好的网站/十大app开发公司排名
  • 舟山公司网站建设/google官网下载安装
  • 二次元动漫网站设计方案/网页制作平台有哪些
  • 网站建设明薇通网络价格美丽/广告制作公司
  • Python 网络爬虫 —— 提交信息到网页
  • 第六章 OBProxy 路由与使用运维
  • 详解SPFA算法-单源最短路径求解
  • 15.图像 模板轮廓检测
  • uniapp打包成 apk
  • 厂区车辆导航系统:基于 GPS+AI 动态路径规划的技术实现与实践