当前位置: 首页 > news >正文

java官方网站开发/seo云优化如何

java官方网站开发,seo云优化如何,医药企业网站建设要哪些备案,网站建设题目以及答案为什么80%的码农都做不了架构师?>>> Spark 1.4 新特性概述 2015-06-12 陈 超 scala 微信号ChinaScala 功能介绍Scala & Apache Spark 经过4个RC版本,Spark 1.4最终还是赶在Spark Summit前发布了,本文简单谈下本版本中那些…

为什么80%的码农都做不了架构师?>>>   hot3.png


Spark 1.4 新特性概述

2015-06-12 陈 超 scala 

微信号ChinaScala

功能介绍Scala & Apache Spark

经过4个RC版本,Spark 1.4最终还是赶在Spark Summit前发布了,本文简单谈下本版本中那些非常重要的新feature和improvement.


SparkR就不细说了,于data scientists而言,简直是望眼欲穿,千呼万唤始出来........ 这显然要用单独一篇文章来说下 : )


Spark Core:

现在大家最关心什么?性能和运维呀! 什么最影响性能?必须shuffle呀!什么是运维第一要务?必须是监控呀(就先不扯alert了)!1.4在这两点都做足了功夫。 1.4中,Spark为应用提供了REST API来获取各种信息(jobs / stages / tasks / storage info),使用这个API搭建个自己的监控简直是分分钟的事情,不止于此,DAG现在也能可视化了,不清楚Spark的DAGScheduler怎么运作的同学,现在也能非常轻易地知道DAG细节了。再来说说shuffle, 大家都知道,从1.2开始sort-based shuffle已经成为默认的shuffe策略了,基于sort的shuffle不需要同时打开很多文件,并且也能减少中间文件的生成,但是带来的问题是在JVM的heap中留了大量的java对象,1.4开始,shuffle的map阶段的输出会被序列化,这会带来两个好处:1、spill到磁盘上的文件变小了 2、GC效率大增 ,有人又会说,序列化反序列化会产生额外的cpu开销啊,事实上,shuffle过程往往都是IO密集型的操作,带来的这点cpu开销,是可以接受。


大家期待的钨丝计划(Project Tungsten)也在1.4初露锋芒,引入了新的shuffle manager “UnsafeShuffleManager”, 来提供缓存友好的排序算法,及其它一些改进,目的是降低shuffle过程中的内存使用量,并且加速排序过程。 钨丝计划必定会成为接下来两个版本(1.5,1.6)重点关注的地方。


Spark Streaming:

Streaming在这个版本中增加了新的UI, 简直是Streaming用户的福音啊,各种详细信息尽收眼底。话说Spark中国峰会,TD当时坐我旁边review这部分的code,悄悄对说我”this is awesome”。对了,这部分主要是由朱诗雄做的,虽然诗雄在峰会上放了我鸽子,但必须感谢他给我们带来了这么好的特性!另外此版本也支持了0.8.2.x的Kafka版本。


Spark SQL(DataFrame)

支持老牌的ORCFile了,虽然比Parquet年轻,但是人家bug少啊 : ) 1.4提供了类似于Hive中的window function,还是比较实用的。本次对于join的优化还是比较给力的,特别是针对那种比较大的join,大家可以体会下。JDBC Server的用户肯定非常开心了,因为终于有UI可以看了呀。


Spark ML/MLlib

ML pipelines从alpha毕业了,大家对于ML pipelines的热情还真的蛮高的啊。我对Personalized PageRank with GraphX倒是蛮感兴趣的,与之相关的是recommendAll in matrix factorization model。 事实上大多数公司还是会在Spark上实现自己的算法。



先写到这,后续会写一写钨丝计划及SparkR的相关文章。


对了,求靠谱前端工程师一枚,要求看我置顶微博(CrazyJvm),同时也招收若干优秀实习生。 七牛欢迎你!



转载于:https://my.oschina.net/itnms/blog/466194

http://www.lbrq.cn/news/944749.html

相关文章:

  • 做带v头像的网站/app拉新接单平台
  • asp.net4.5网站开发/网站快速被百度收录
  • 江苏中益建设官方网站/万网域名购买
  • 网站建设开发模式h5/seo点击排名工具有用吗
  • 德阳做网站的/百度站长工具官网
  • 驾校网站建设方案/百度seo建议
  • 网站设计的企业/百度广告搜索引擎
  • 哪个网站可以下载做多日剧/石家庄seo推广公司
  • 做ppt赚钱的网站/百度关键词热度
  • 全国住房城乡建设厅网站/汕头seo全网营销
  • 营销公司业务范围/windows优化软件哪个好
  • 代做网站多少钱/无锡seo网站排名
  • 如何做企业网站建设/seo教学培训
  • 百度信息流网站可以做落地页吗/网络营销促销方案
  • 做网站视频教程/网页设计个人主页模板
  • 云南做网站公司/如何优化网络环境
  • 手机版做网站/快速seo关键词优化方案
  • 历下区网站建设公司/一台电脑赚钱的门路
  • 品牌网购哪个网站哪个好/线上营销渠道主要有哪些
  • 网站项目建设策划书流程/福州百度seo
  • c .net怎么做网站/关键词搜索引擎工具
  • 华为建站模板/怎么免费建公司网站
  • 怎样克隆别人的网站/东莞疫情最新消息今天中高风险区
  • 文章视频类网站怎么做测试/东莞网站关键词优化排名
  • 网站开发技术项目代码搜索/福建seo
  • linux上传wordpress/seo优化效果
  • html5网站app开发/新手怎么做电商
  • 佛山网站建设公司排行/杭州网站seo
  • python做网站比php/数据分析网官网
  • 网站建设qinnet/营业推广经典案例
  • Python编程:初入Python魔法世界
  • C++___快速入门(上)
  • 泰山派GPIO编译 ADB下载 万用表测量GPIO电压
  • 一些常见的网络攻击方式
  • DeepSeek FlashMLA 技术拆解,AI 推理迎来颠覆性突破
  • uniapp小程序上传图片并压缩