当前位置: 首页 > news >正文

近期热点舆情事件/seo广州工作好吗

近期热点舆情事件,seo广州工作好吗,wordpress 表单 验证,网页设计与网站建设第02章在线测试文章目录概述安全下载运行例子在集群上启动学习参考路线编程指南API 文档部署指南其他文件扩展资源概述 Apache Spark是一种快速通用的集群计算系统。它提供Java,Scala,Python和R 的高级API,以及支持通用执行图的优化引擎。它还支持一组丰富…

文章目录

  • 概述
  • 安全
  • 下载
  • 运行例子
  • 在集群上启动
  • 学习参考路线
    • 编程指南
    • API 文档
    • 部署指南
    • 其他文件
    • 扩展资源

概述

Apache Spark是一种快速通用的集群计算系统。它提供Java,Scala,Python和R 的高级API,以及支持通用执行图的优化引擎。它还支持一组丰富的更高级别的工具,包括Spark SQL用于SQL和结构化数据的处理,MLlib机器学习,GraphX用于图形处理和Spark Streaming。

安全

Spark中的安全性默认为OFF。这可能意味着您很容易受到默认攻击。在下载和运行Spark之前,请参阅Spark Security。

下载

从项目网站获取spark,本文档适用于Spark版本2.4.3。Spark使用Hadoop的客户端库来实现HDFS和YARN。下载是针对少数流行的Hadoop版本预先打包的。还可以通过下载Hadoop免费二进制文件并使用任何Hadoop版本运行Spark 。Scala和Java用户可以使用Maven坐标在他们的项目中包含Spark,并且将来Python用户也可以从PyPI安装Spark。

也可以通过源码构建spark

spark 运行在Windows和类UNIX系统(例如Linux,Mac OS)的笔记本上运行也是很容易的。只需要安装java 配置PATH,或者JAVA_HOME指向Java安装的环境变量即可。

Spark运行在Java 8 +,Python 2.7 + / 3.4 +和R 3.1+上。对于Scala API,Spark 2.4.3使用Scala 2.12。您需要使用兼容的Scala版本(2.12.x)。

注意:spark2.2.0版本移除了Java 7, Python 2.6 and Hadoop 2.6.5 之前版本的支持。spark2.3.0版本移除了scala2.10的支持。spark2.4.1 废弃了Scala2.11 将在spark3.0中移除。

运行例子

Spark附带了几个示例程序。Scala,Java,Python和R示例都在 examples/src/main目录中。要运行其中一个Java或Scala示例程序,请 bin/run-example [params]在顶级Spark目录中使用。

/bin/run-example SparkPi 10

还可以通过Scala shell的修改版本以交互方式运行Spark。这是学习框架的好方法。

./bin/spark-shell --master local[2]

该–master选项指定分布式集群的 主URL,或者local使用一个线程local[1]在本地运行,或者使用N个线程在本地运行 。有关选项的完整列表,如下表

Master Url含义
local使用一个工作线程在本地运行Spark(即根本没有并行性)。
local[K]使用K个工作线程在本地运行Spark(理想情况下,将其设置为计算机上的核心数)。
local[K,F]使用K个工作线程和F maxFailures在本地运行Spark(有关此变量的说明,请参阅spark.task.maxFailures)
local[*]使用与计算机上的逻辑核心一样多的工作线程在本地运行Spark。
local[*,F]使用与计算机和F maxFailures上的逻辑核心一样多的工作线程在本地运行Spark
spark://HOST:PORT连接到给定的Spark独立集群主服务器。端口必须是主服务器配置使用的端口,默认为7077。
spark://HOST1:PORT1,HOST2:PORT2连接到给zookeeper集群,这个列表需要包含所有的zookeeper主机。默认端口7077
mesos://HOST:PORT连接到给定的Mesos群集
yarn连接到yarn
k8s://HOST:PORT连接到k8s集群

Spark还提供了一个Python API。要在Python解释器中以交互方式运行Spark,请使用 bin/pyspark:

./bin/pyspark --master local[2]

Python中也提供了示例应用程序。例如,

./bin/spark-submit examples/src/main/python/pi.py 10

Spark还提供了R 的API

./bin/sparkR --master local[2]

对应的例子

./bin/spark-submit examples/src/main/r/dataframe.R

在集群上启动

spark 可以单独运行、通过集群管理器运行。目前有一下几种部署方式

  1. Standalone Mode
  2. Apache Mesos
  3. Hadoop YARN
  4. Kubernetes

学习参考路线

编程指南

  1. spark 快速入门API
  2. RDD 编程指南
  3. Spark SQL,Datasets和DataFrames 比RDD更新的API
  4. Structured Streaming
  5. Spark Streaming
  6. MLlib
  7. GraphX

API 文档

  1. Spark Scala API (Scaladoc)
  2. Spark Java API (Javadoc)
  3. Spark Python API (Sphinx)
  4. Spark R API (Roxygen2)
  5. Spark SQL, Built-in Functions (MkDocs)

部署指南

  1. 群集概述:在群集上运行时概念和组件的概述
  2. 提交应用程序

其他文件

  1. 配置
  2. 监控
  3. 调优指南
  4. 作业调度
  5. 安全性
  6. 硬件配置
  7. 与其他存储系统集成
    7.1 云基础架构
    7.2 OpenStack Swift
  8. 构建Spark
  9. 为Spark做贡献
  10. 第三方项目

扩展资源

  1. Spark主页
  2. Spark社区
  3. StackOverflow tag apache-spark
  4. 邮件列表:在这里询问有关Spark的问题
  5. AMP Camps:加州大学伯克利分校的一系列训练营,包括有关Spark,Spark Streaming,Mesos等的演讲和练习。视频, 幻灯片和练习可在线免费获取。
  6. 代码示例:examplesSpark(Scala, Java, Python, R)的子文件夹中也提供了更多内容
http://www.lbrq.cn/news/770995.html

相关文章:

  • 池州网站建设费用/天津优化代理
  • 开发公司支付前期物业开办费包括哪些内容/菏泽地网站seo
  • 九江企业网站制作/seo教程搜索引擎优化入门与进阶
  • 有什么国外的黄网站/百度指数查询工具
  • 做网站先做前端好还是先做逻辑/淘客推广怎么做
  • asp.net 如何设置网站首页/网站流量排行
  • 郑州做网站公司电话/查关键词热度的网站
  • 河北网站建设价格大全/利尔化学股票
  • 小米果怎么做视频网站/低价刷粉网站推广
  • 公司网站集群系统架构及建设思路/苏州seo网站公司
  • 卡密提取网站怎么做/杭州seo网站优化公司
  • 菏泽做网站的/网络广告案例以及分析
  • 餐饮公司最好的网站建设/权威seo技术
  • 网站编辑及seo招聘/网站搭建费用
  • 网络科技公司网站建设策划/免费下载百度
  • 自己做企业网站服务器/杭州seo公司哪家好
  • ps做游戏下载网站/企业官方网站怎么申请
  • 泉州网站建设工程/传媒公司
  • 建筑网大全/win7优化极致性能
  • 家装网站自己做的/互联网营销的特点
  • 室内设计找工作网站/郑州seo培训
  • 南昌做网站的流程/seo兼职外包
  • 网站搭建怎么收费/seo外链优化策略
  • 如何加强网站管理的队伍建设/广告联盟app下载
  • 自动发货网站怎么做/企业网站代运营
  • 武汉做网站网络公司/百度一下你就知道了
  • 北京网站的建设/营销策划书范文案例
  • 上虞网站建设文广网络/朝阳区seo技术
  • 手机企业网站多少钱/互联网营销师怎么报名
  • 惠喵WordPress/百度关键词优化
  • 更改webpack默认配置项
  • 如何使用 Ollama 在本地设置并运行 Qwen3
  • 从0开始配置conda环境并在PyCharm中使用
  • C语言(06)——二、八、十、十六进制的相互转换
  • 5G NR NTN 在 PHY 层和 MAC 层实现 OAI
  • MFC C++ 使用ODBC方式调用Oracle数据库的详细步骤