当前位置: 首页 > news >正文

政协网站 是政协信息化建设电脑培训班有哪些科目

政协网站 是政协信息化建设,电脑培训班有哪些科目,网站建设源码修改,手机应用软件开发培训班R通过RJDBC包连接Hive 目前Hive集群是可以通过跳板机来访问 HiveServer, 将Hive 中的批量数据读入R环境,并进行后续的模型和算法运算。 1. 登录跳板机后需要首先在Linux下进行配置 从root权限切换到bzsys用户,才能够通过验证读取Hive。首先需…

R通过RJDBC包连接Hive

目前Hive集群是可以通过跳板机来访问 HiveServer, 将Hive 中的批量数据读入R环境,并进行后续的模型和算法运算。

1. 登录跳板机后需要首先在Linux下进行配置

从root权限切换到bzsys用户,才能够通过验证读取Hive。首先需要配置Hadoop的临时环境变量CLASSPATH路径

su bzsys
export CLASSPATH=$CLASSPATH:/etc/hadoop/conf

2. 下载并安装RJDBC包

Linux下直接运行R的install 函数通常不成功,建议下载预编译的包通过命令行安装,如下载文件 RJDBC_0.2-6.tar.gz (http://www.rforge.net/RJDBC/)

切换到下载包所在的文件夹下,如 /etc/usr/R-patched/packages (替换为自己的目录),在终端运行R的命令行,完成安装。

R CMD INSTALL RJDBC_0.2-6.tar.gz

3. 进入R环境

library(RJDBC) # 载入RJDBC包
# 设置R连接时类的路径 CLASSPATH,注意一定要引hive/hadoop这三个路径下的所有包才可以通过认证
cp = c(list.files("/usr/lib/hive/lib", pattern = "[.]jar", full.names=TRUE, recursive=TRUE),
list.files("/usr/lib/hadoop", pattern = "[.]jar", full.names=TRUE, recursive=TRUE),
list.files("/etc/hadoop/conf", full.names=TRUE, recursive=TRUE),
recursive=TRUE
)
# 新建RJDBC的 Driver
drv <- JDBC(driverClass = "org.apache.hive.jdbc.HiveDriver", classPath = cp)
# 建立连接Connection
# 常见错误: 注意路径是jdbc:hive2:而不是jdbc:hive:, 因为新版Hive启用了 HiveServer2,替代了之前的HiveServer变量
# "hadoop-jy-backupserver:10000" 为济阳集群的URL和默认端口PORT 10000, "principal=" 为需要的特殊认证Authentication
hiveconnection <- dbConnect(drv,"jdbc:hive2://hadoop-jy-backupserver:10000/default;principal=hive/hadoop-jy-backupserver@HADOOP.QIYI.COM",user="*******", password="*******")   # *** 替换为相应用户名和密码

4. R操作 Hive数据表范例

library(RJDBC)
cp = c(list.files("/usr/lib/hive/lib", pattern = "[.]jar", full.names=TRUE, recursive=TRUE),
list.files("/usr/lib/hadoop", pattern = "[.]jar", full.names=TRUE, recursive=TRUE),
list.files("/etc/hadoop/conf", full.names=TRUE, recursive=TRUE),
recursive=TRUE
)
drv = JDBC(driverClass = "org.apache.hive.jdbc.HiveDriver", classPath = cp)
hiveconnection = dbConnect(drv,"jdbc:hive2://hadoop-jy-backupserver:10000/default;principal=hive/hadoop-jy-backupserver@HADOOP.QIYI.COM",user="*******", password="*******")   # *** 替换为相应用户名密码
# 从BAIDU_INDEX 表中查询记录的个数,存入DataFrame
count = dbGetQuery(hiveconnection,"SELECT count(*) FROM cpr.baidu_index"# 开始执行MapReduce任务
 
# 非查询Query的语句,如创建表CREATE, dbSendUpdate 函数执行所有非查询Query的语句
sqlCreateTbl = "CREATE TABLE IF NOT EXISTS cpr.person_correlation_graph_temp(rownames STRING,ibao_person_id_x STRING, ibao_person_id_y STRING,
    cor_index DOUBLE,start_date STRING,end_date STRING)"
result=dbSendUpdate(hiveconnection,sqlCreateTbl)
 
# 将数据写入Hive数据库
dfToLoad = data.frame(rownames=c('1','2'),ibao_person_id_x=c('盗墓笔记','盗墓笔记'),
ibao_person_id_y=c('李易峰','杨洋'),cor_index=c(0.8900,0.5100))
dbWriteTable(hiveconnection, "cpr.person_correlation_graph", dfToLoad, overwrite=TRUE)
 
# R中执行其他Hive SQL的函数
dbListTables(hiveconnection, "%qiyu%")
df = dbReadTable(hiveConn, "iris")

转载于:https://www.cnblogs.com/xinping-study/p/6897897.html

http://www.lbrq.cn/news/2527003.html

相关文章:

  • 淄博哪家公司做网站最好所有代刷平台推广
  • 网站建设合同的性质优化大师电脑版官网
  • 网站维护和制作怎么做会计分录google站长工具
  • 平面设计大赛网站爱网
  • 制作小程序营销平台seo咨询河北
  • 北海做网站哪家好小红书信息流广告
  • 评论 wordpress免费培训seo
  • 宁波网站设计建站服务公司建站工具有哪些
  • 企业建设网站有哪些网站优化软件
  • 投票网站制作单词优化和整站优化
  • 重生主角做视频网站的小说湖南网站推广优化
  • 武汉app网站开发国际新闻头条最新消息
  • 小说网站开发实录百度商城app下载
  • 无锡做百度网站电商运营主要负责什么
  • 北京建网站价格seo前景
  • 做性的网站有哪些个人seo怎么赚钱
  • 湖州网站开发公司网络营销策划书范文模板
  • 国内哪个网站是做电子元器件的营销网站建设选择
  • 建设一个网站项目预算百度信息流开户多少钱
  • 怎样做网站网推渠道
  • app store免费下载小红书seo排名帝搜软件
  • wordpress页面内搜索引擎优化要考虑哪些方面
  • 做前端网站要注意哪些上海网络推广渠道
  • 教育培训网站建设方案西地那非片能延时多久有副作用吗
  • 阿里巴巴建站多少钱青岛 google seo
  • wordpress的ftp設置搜索引擎优化的概念
  • 金华企业网站建设公司互联网金融营销案例
  • 网站伪静态规则网盟推广
  • 模板 网站在线crm
  • 做外贸网站那家专业山西优化公司
  • 2025年财税行业拓客破局:小蓝本财税版AI拓客系统助力高效拓客
  • elk部署加日志收集
  • RabbitMQ 消费者确认 (Ack/Nack) (With Spring Boot)
  • VMware16安装Ubuntu-22.04.X版本(并使用桥接模式实现局域网下使用ssh远程操作Ubuntu系统)
  • 【IDEA】JavaWeb自定义servlet模板
  • Spring Boot音乐服务器项目-查询喜欢的音乐模块