当前位置: 首页 > news >正文

做爰全过程免费网站的视频/html网页制作代码大全

做爰全过程免费网站的视频,html网页制作代码大全,网站如何制作注册,关于做奶妈的视频网站原文地址:http://blog.csdn.net/a358463121/article/details/50541242 本文的运行环境是ubuntu,在阅读这篇文章前,请先保证你已经成功配置了Spark, 并设置好了全局变量 SPARK_HOME以及 PATH ,能够成功运行Spark.(如果你在终端输入sparkR 运行成功的话就证明你成功了…

原文地址:http://blog.csdn.net/a358463121/article/details/50541242


本文的运行环境是ubuntu,在阅读这篇文章前,请先保证你已经成功配置了Spark, 并设置好了全局变量 SPARK_HOME以及 PATH ,能够成功运行Spark.(如果你在终端输入sparkR 运行成功的话就证明你成功了) 
如果还没有配置成功的话,参考这里,安装SPARK只需三步

1.下载示例数据

MovieLens 100k数据集 
它包含了用户和电影信息,以及10万次用户对电影的评价,将其解压,后可以看到各个文件的形式如下:

$ head -5 u.user
1|24|M|technician|85711
2|53|F|other|94043
3|23|M|writer|32067
4|24|M|technician|43537
5|33|F|other|15213$ head -5 u.item
1|Toy Story (1995)|01-Jan-1995||http://us.imdb.com/M/title-exact?Toy%20Story%20(1995)|0|0|0|1|1|1|0|0|0|0|0|0|0|0|0|0|0|0|0
2|GoldenEye (1995)|01-Jan-1995||http://us.imdb.com/M/title-exact?GoldenEye%20(1995)|0|1|1|0|0|0|0|0|0|0|0|0|0|0|0|0|1|0|0
3|Four Rooms (1995)|01-Jan-1995||http://us.imdb.com/M/title-exact?Four%20Rooms%20(1995)|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|1|0|0
4|Get Shorty (1995)|01-Jan-1995||http://us.imdb.com/M/title-exact?Get%20Shorty%20(1995)|0|1|0|0|0|1|0|0|1|0|0|0|0|0|0|0|0|0|0
5|Copycat (1995)|01-Jan-1995||http://us.imdb.com/M/title-exact?Copycat%20(1995)|0|0|0|0|0|0|1|0|1|0|0|0|0|0|0|0|1|0|0$ head -5 u.data
196 242 3   881250949
186 302 3   891717742
22  377 1   878887116
244 51  2   880606923
166 346 1   886397596
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21

2. 通过Rstudio启动SparkR

请保证你的环境变量SPARK_HOME设置正确,如果你没有设好的话,在下面代码”你的spark的路径”处填上你的路径

if (nchar(Sys.getenv("SPARK_HOME")) < 1) {Sys.setenv(SPARK_HOME = "你的spark的路径")
}
library(SparkR, lib.loc = c(file.path(Sys.getenv("SPARK_HOME"), "R", "lib")))
sc <- sparkR.init(master = "local[*]", sparkEnvir = list(spark.driver.memory="2g"))
sqlContext <- sparkRSQL.init(sc)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

如果你看到类似以下这图的话,表示启动成功了. 
这里写图片描述

3.简单的数据探索与可视化

先读取数据,这里为了方便起见,我直接用了r的函数读取了数据,然后再转换为Spark的DataFrame格式,一般使用SparkR读取数据的方法有从Hive读取,或使用read.df函数读取.

> df<-read.table("/home/qj/Desktop/ml-100k/u.user",sep="|")
> userdata <- createDataFrame(sqlContext, df)
> names(userdata)<-c("id","age","gender","occupation","ZIPcode")
> head(userdata)id age gender occupation ZIPcode
1  1  24      M technician   85711
2  2  53      F      other   94043
3  3  23      M     writer   32067
4  4  24      M technician   43537
5  5  33      F      other   15213
6  6  42      M  executive   98101
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12

当然,我们也可以利用RDD API来导入数据,不过目前RDD API 并没有对外开放,所以使用这些函数时必须要加上SparkR:::

> lines<-SparkR:::textFile(sc,"/home/qj/Desktop/ml-100k/u.user")
> items<-SparkR:::map(lines,function(line){strsplit(line,"[|]")[[1]]
})
> userdata<-createDataFrame(sqlContext, items)
> names(userdata)<-c("id","age","gender","occupation","ZIPcode")
> head(userdata)id age gender occupation ZIPcode
1  1  24      M technician   85711
2  2  53      F      other   94043
3  3  23      M     writer   32067
4  4  24      M technician   43537
5  5  33      F      other   15213
6  6  42      M  executive   98101
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16

对年龄进行分组统计其数量,看看用户的年龄分布,并使用ggplot2作出条形图

> ages<-collect(summarize(groupBy(userdata, userdata$age), count = n(userdata$age)))
> head(ages)age count
1  31    25
2  32    28
3  33    26
4  34    17
5  35    27
6  36    21
> ggplot(ages,aes(x=age,y=count))+geom_bar(stat="identity")
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

这里写图片描述

可以看到,用户的年龄主要集中在20到30岁之间.

进一步学习

  • SparkR官方指南
  • SparkR API文档

http://www.lbrq.cn/news/1365931.html

相关文章:

  • 网页设计建网站流程/深圳网站设计公司排行
  • 苏州制作网站的公司/免费源码下载网站
  • 免费开网站/北京网站seo费用
  • 盐城做网站多少钱/免费卖货平台
  • 做项目接任务的网站/网络营销怎么做推广
  • 正能量视频免费网站免下载/网络营销工具分析
  • 微信公众号里怎么做网站/宁波网站推广公司报价
  • 速递物流系网站建设与维护/seo的范畴是什么
  • 网站开发工作分解结构/seo网站优化优化排名
  • 杭州优化公司多少钱/班级优化大师下载
  • 最新的网站建设软件有哪些/seo优化培训多少钱
  • 桂林漓江自由行攻略/windows优化大师官方下载
  • 做商务网站需要什么资料/搜狗网
  • 视频网站程序/海外发布新闻
  • 国际外贸网站/b站黄页推广
  • 怎么用国外的服务器做网站/最好用的磁力搜索器
  • 网站可以做动态背景吗/湖南中高风险地区
  • 响应式网站建设平台/最新注册域名查询
  • 怎么样做微网站/代写文章哪里找写手
  • 网页设计学校网站制作/网络营销ppt
  • WordPress招标采购/seo顾问服务咨询
  • 网站设计兼容模式/做优化的网站
  • 网站建设与网页设计是什么/seo的理解
  • 西安网站托管商家/域名交易中心
  • 网页做的很美的网站/搜索引擎网站推广如何优化
  • 做网站建设公司怎么样/谷歌网站优化
  • 免费招工人在哪个网站/seo优化员
  • 宁波网站建设运营/域名注册网站系统
  • 游戏攻略网站开发/优化关键词哪家好
  • 哪些网站做兼职可靠吗/seo优
  • ArcGIS的字段计算器生成随机数
  • Flask + HTML 项目开发思路
  • 动态置信度调优实战:YOLOv11多目标追踪精度跃迁方案(附完整代码)
  • 基于springboot的在线考试系统/考试信息管理平台
  • 接口测试用例的编写
  • GitLab 代码管理平台部署及使用