当前位置: 首页 > news >正文

网站是怎么做的怎么做市场营销和推广

网站是怎么做的,怎么做市场营销和推广,做杂志的模板下载网站,做网站会什么问题一、背景介绍 生产环境中,Hadoop的版本选择是一个公司架构之时,很重要的一个考虑因素。这篇文章根据就谈谈现在主流的Hadoop版本的比较。如果有不同意见,或者指正,希望大家能交流。 Apache hadoop:Apache Hadoop是一款…

一、背景介绍

生产环境中,Hadoop的版本选择是一个公司架构之时,很重要的一个考虑因素。这篇文章根据就谈谈现在主流的Hadoop版本的比较。如果有不同意见,或者指正,希望大家能交流。


Apache hadoopApache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。Hadoop是根据Google公司发表的MapReduceGoogle档案系统的论文自行实作而成。称为社区版Hadoop

 

第三方发行版HadoopHadoop遵从Apache开源协议,用户可以免费地任意使用和修改Hadoop,也正因此,市面上出现了很多Hadoop版本。其中有很多厂家在Apache Hadoop的基础上开发自己的Hadoop产品,比如ClouderaCDHHortonworksHDPMapRMapR产品等。

 

二、社区版本与第三方发行版本的比较

Apache社区版本

优点:

  1. 完全开源免费。
  2. 社区活跃
  3. 文档、资料详实

 

缺点:

  1. 复杂的版本管理。版本管理比较混乱的,各种版本层出不穷,让很多使用者不知所措。
  2. 复杂的集群部署、安装、配置。通常按照集群需要编写大量的配置文件,分发到每一台节点上,容易出错,效率低下。
  3. 复杂的集群运维。对集群的监控,运维,需要安装第三方的其他软件,如ganglianagois等,运维难度较大。
  4. 复杂的生态环境。在Hadoop生态圈中,组件的选择、使用,比如HiveMahoutSqoopFlumeSparkOozie等等,需要大量考虑兼容性的问题,版本是否兼容,组件是否有冲突,编译是否能通过等。经常会浪费大量的时间去编译组件,解决版本冲突问题。

 

第三方发行版本(如CDHHDPMapR等)

优点:

  1. 基于Apache协议,100%开源。
  2. 版本管理清晰。比如ClouderaCDH1CDH2CDH3CDH4等,后面加上补丁版本,如CDH4.1.0 patch level 923.142,表示在原生态Apache Hadoop 0.20.2基础上添加了1065patch
  3. Apache Hadoop在兼容性、安全性、稳定性上有增强。第三方发行版通常都经过了大量的测试验证,有众多部署实例,大量的运行到各种生产环境。
  4. 版本更新快。通常情况,比如CDH每个季度会有一个update,每一年会有一个release
  5. 基于稳定版本Apache Hadoop,并应用了最新Bug修复或Featurepatch
  6. 提供了部署、安装、配置工具,大大提高了集群部署的效率,可以在几个小时内部署好集群。
  7. 运维简单。提供了管理、监控、诊断、配置修改的工具,管理配置方便,定位问题快速、准确,使运维工作简单,有效。

 

缺点:

  1. 涉及到厂商锁定的问题。(可以通过技术解决)

 

 

三、第三方发行版本的比较

Cloudera:最成型的发行版本,拥有最多的部署案例。提供强大的部署、管理和监控工具。Cloudera开发并贡献了可实时处理大数据的Impala项目。


 

Hortonworks:不拥有任何私有(非开源)修改地使用了100%开源Apache Hadoop的唯一提供商。Hortonworks是第一家使用了Apache HCatalog的元数据服务特性的提供商。并且,它们的Stinger开创性地极大地优化了Hive项目。Hortonworks为入门提供了一个非常好的,易于使用的沙盒。Hortonworks开发了很多增强特性并提交至核心主干,这使得Apache Hadoop能够在包括Windows ServerWindows Azure在内的Microsft Windows平台上本地运行。


 

MapR:与竞争者相比,它使用了一些不同的概念,特别是为了获取更好的性能和易用性而支持本地Unix文件系统而不是HDFS(使用非开源的组件)。可以使用本地Unix命令来代替Hadoop命令。除此之外,MapR还凭借诸如快照、镜像或有状态的故障恢复之类的高可用性特性来与其他竞争者相区别。该公司也领导着Apache Drill项目,本项目是GoogleDremel的开源项目的重新实现,目的是在Hadoop数据上执行类似SQL的查询以提供实时处理。


 

Amazon Elastic Map ReduceEMR:区别于其他提供商的是,这是一个托管的解决方案,其运行在由Amazon Elastic Compute CloudAmazon EC2)和Amzon Simple Strorage ServiceAmzon S3)组成的网络规模的基础设施之上。除了Amazon的发行版本之外,你也可以在EMR上使用MapR。临时集群是主要的使用情形。如果你需要一次性的或不常见的大数据处理,EMR可能会为你节省大笔开支。然而,这也存在不利之处。其只包含了Hadoop生态系统中Pighive项目,在默认情况下不包含其他很多项目。并且,EMR是高度优化成与S3中的数据一起工作的,这种方式会有较高的延时并且不会定位位于你的计算节点上的数据。所以处于EMR上的文件IO相比于你自己的Hadoop集群或你的私有EC2集群来说会慢很多,并有更大的延时。

 

以上为具有代表性的第三方发行版,另外的发行版则不一一列举了。

 

四、选择决定

当我们决定是否采用某个软件用于开源环境时,通常需要考虑以下几个因素:

1)是否为开源软件,即是否免费。

2) 是否有稳定版,这个一般软件官方网站会给出说明。

3) 是否经实践验证,这个可通过检查是否有一些大点的公司已经在生产环境中使用知道。

4) 是否有强大的社区支持,当出现一个问题时,能够通过社区、论坛等网络资源快速获取解决方法。

 

综上所述,考虑到大数据平台高效的部署和安装,中心化的配置管理,使用过程中的稳定性、兼容性、扩展性,以及未来较为简单、高效的运维,遇到问题低廉的解决成本。

个人建议使用第三方发行版本。


原创文章,欢迎转载,转载请标明出处  http://blog.csdn.NET/shifenglov/article/details/40376105

http://blog.csdn.net/lichangzai/article/details/51564873

http://www.lbrq.cn/news/2737657.html

相关文章:

  • 域名查询网站建站平台
  • 充值网站建设seo发外链工具
  • 有什么网站可以做商品展示的吗百度关键词排名十大排名
  • 手机wap网站建设企业搜索引擎优化
  • 网站优化怎么做外链做网站需要准备什么
  • 茌平微网站建设北京外包seo公司
  • 怎么知道网站哪家公司做的关键词排名哪里查
  • 广告设计就业前景东莞搜索网络优化
  • 做视频网站推广交易链接
  • 吉安市网站制作推广普通话手抄报文字内容
  • wordpress附件下载网站整站优化推广方案
  • html 网站 模板中文seo基础入门视频教程
  • 青海高端网站建设价格百度搜索广告推广
  • 禁止wordpress自动更新优化关键词排名软件
  • 厦门做网站找哪家公司sem广告投放是做什么的
  • 出入库管理软件 免费seo流量优化
  • 如何搭建一个企业子账号网站独立站seo怎么做
  • 寻乌建设局网站邀请推广app
  • 网站怎么做才吸引人百度网站网址是多少
  • 武汉市内做网站的公司品牌建设
  • 文明网站建设方案及管理制度教育培训网站大全
  • 人社系统网站一体化建设方案seo是什么牌子
  • 老外做的汉语网站如何自己做一个网址
  • 网站可以做伦理片吗好省推广100种方法
  • 西安网站运营免费的外贸网站推广方法
  • 十四冶建设集团技工学校网站软文写作的技巧
  • 大理网站建设怎么在百度上发帖推广
  • 网站策划的重要性千牛怎么做免费推广引流
  • mvc5做博客网站百度搜索关键词排名靠前
  • 本地网站可以做吗如何创建微信小程序
  • 广东省省考备考(第七十八天8.16)——资料分析、判断推理(强化训练)
  • 基于Python3.10.6与jieba库的中文分词模型接口在Windows Server 2022上的实现与部署教程
  • pdf合并代码
  • 数据结构初阶:排序算法(二)交换排序
  • 【自动驾驶】自动驾驶概述 ② ( 自动驾驶技术路径 | L0 ~ L5 级别自动驾驶 )
  • 【Docker】安装kafka案例