当前位置: 首页 > news >正文

网站建设步骤和流程/网络广告的类型有哪些

网站建设步骤和流程,网络广告的类型有哪些,苏州园区已经烂掉了,威海企业做网站哪家好第一部分:flume介绍 1.Flume是Cloudera提供的一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统 2.Flume可以采集文件,socket数据包、文件夹等各种形式源数据,又可以将采集到的数据输出到HDFS、hbase、hive、kafka等众多外部存储…

第一部分:flume介绍

1.Flume是Cloudera提供的一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统
2.Flume可以采集文件,socket数据包、文件夹等各种形式源数据,又可以将采集到的数据输出到HDFS、hbase、hive、kafka等众多外部存储系统中
3.一般的采集需求,通过对flume的简单配置即可实现
4.Flume针对特殊场景也具备良好的自定义扩展能力,因此,flume可以适用于大部分的日常数据采集场景
5.动态收集日志文件,数据流,一份给dhfs,做离线分析,一份给kafka,做实时处理
6.组件: Flume分布式系统中最核心的角色是agent,flume采集系统就是由一个个agent所连接起来形成
7.每一个agent相当于一个数据传递员 ,内部有三个组件:
a) Source:采集源,将数据转换为数据流,丢给channel
b)Channel:angent内部的数据传输通道,类似队列,临时存储
c)Sink:从channel读取数据,发生目的地

第二部分:安装部署

1.上传解压
2.然后进入flume的目录,修改conf下的flume-env.sh,在里面配置JAVA_HOME
3.将core-site.xml和hdfs-site.xml放到flume配置文件下(为了让flume找到hadoop)
4.添加HDFS的Jar包lib目录下

第三部分:简单使用

1.读取hive日志信息到控制台

a1.sources = s1
a1.channels = c1
a1.sinks = k1# defined sources
#读取单个文件
a1.sources.s1.type = exec
#动态查看日志文件
a1.sources.s1.command = tail -F /opt/cdh5.7.6/hive-1.1.0-cdh5.7.6/logs/hive.log
#解析
a1.sources.s1.shell=/bin/sh -c# defined channel
#存到内存中
a1.channels.c1.type = memory
#容量
a1.channels.c1.capacity=1000
#瓶口大小
a1.channels.c1.transactionCapacity=100# defined sink
#输出到控制台
a1.sinks.k1.type = logger#bond
#建立组件之间的关系
a1.sinks.k1.channel = c1
a1.sources.s1.channels = c1

2.读取hive日志信息到hdfs

a1.sources = s1
a1.channels = c1
a1.sinks = k1# defined sources
a1.sources.s1.type = exec
a1.sources.s1.command = tail -F /opt/cdh5.7.6/hive-1.1.0-cdh5.7.6/logs/hive.log
a1.sources.s1.shell=/bin/sh -c# defined channel
#存到磁盘中
a1.channels.c1.type = file
#设置检查点,记录相关传输的信息,比如取了多少event
a1.channels.c1.checkpointDir=/opt/datas/flume/channel/checkpoint
a1.channels.c1.dataDirs=/opt/datas/flume/channel/data# defined sink
#输出到hdfs
a1.sinks.k1.type = hdfs
#hdfs中的目录
a1.sinks.k1.hdfs.path=/flume/hdfs2/
#设置文件类型和写的格式
a1.sinks.k1.hdfs.fileType=DataStream
a1.sinks.k1.hdfs.writeFormat=Text#bond
a1.sinks.k1.channel = c1
a1.sources.s1.channels = c1

3.修改存储在hdfs中的文件大小

a1.sources = s1
a1.channels = c1
a1.sinks = k1# defined sources
a1.sources.s1.type = exec
a1.sources.s1.command = tail -F /opt/cdh5.7.6/hive-1.1.0-cdh5.7.6/logs/hive.log
a1.sources.s1.shell=/bin/sh -c# defined channel
a1.channels.c1.type = file
#设置检查点,记录相关传输的信息,比如取了多少event
a1.channels.c1.checkpointDir=/opt/datas/flume/channel/checkpoint
a1.channels.c1.dataDirs=/opt/datas/flume/channel/data# defined sink
a1.sinks.k1.type = hdfs
a1.sinks.k1.hdfs.path=/flume/hdfs3/
#设置文件类型和写的格式
a1.sinks.k1.hdfs.fileType=DataStream
a1.sinks.k1.hdfs.writeFormat=Text#设置HDFS文件大小
a1.sinks.k1.hdfs.rollInterval=0
a1.sinks.k1.hdfs.rollSize=10240
a1.sinks.k1.hdfs.rollCount=0#bond
a1.sinks.k1.channel = c1
a1.sources.s1.channels = c1

4.数据分区储存

a1.sources = s1
a1.channels = c1
a1.sinks = k1# defined sources
a1.sources.s1.type = exec
a1.sources.s1.command = tail -F /opt/cdh5.7.6/hive-1.1.0-cdh5.7.6/logs/hive.log
a1.sources.s1.shell=/bin/sh -c# defined channel
a1.channels.c1.type = file
#设置检查点,记录相关传输的信息,比如取了多少event
a1.channels.c1.checkpointDir=/opt/datas/flume/channel/checkpoint
a1.channels.c1.dataDirs=/opt/datas/flume/channel/data# defined sink
a1.sinks.k1.type = hdfs
#分区信息
a1.sinks.k1.hdfs.path=/flume/part/yearst=%Y/monthstr=%m/daystr=%d/minutestr=%M
a1.sinks.k1.hdfs.useLocalTimeStamp=true
#设置文件类型和写的格式
a1.sinks.k1.hdfs.fileType=DataStream
a1.sinks.k1.hdfs.writeFormat=Text#设置HDFS文件大小
a1.sinks.k1.hdfs.rollInterval=0
a1.sinks.k1.hdfs.rollSize=10240
a1.sinks.k1.hdfs.rollCount=0#bond
a1.sinks.k1.channel = c1
a1.sources.s1.channels = c1

5.动态监听一个目录

a1.sources = s1
a1.channels = c1
a1.sinks = k1# defined sources
#动态监听文件夹
a1.sources.s1.type = spooldir
#动态监听的文件夹目录
a1.sources.s1.spoolDir = /opt/datas/flume/spool# defined channel
a1.channels.c1.type = memory
#容量
a1.channels.c1.capacity=1000
#瓶口大小
a1.channels.c1.transactionCapacity=100# defined sink
a1.sinks.k1.type = hdfs
a1.sinks.k1.hdfs.path=/flume/spooling
a1.sinks.k1.hdfs.useLocalTimeStamp=true
#设置文件类型和写的格式
a1.sinks.k1.hdfs.fileType=DataStream
a1.sinks.k1.hdfs.writeFormat=Text#设置HDFS文件大小
a1.sinks.k1.hdfs.rollInterval=0
a1.sinks.k1.hdfs.rollSize=10240
a1.sinks.k1.hdfs.rollCount=0#bond
a1.sinks.k1.channel = c1
a1.sources.s1.channels = c1

6.5的基础上添加过滤

a1.sources = s1
a1.channels = c1
a1.sinks = k1# defined sources
a1.sources.s1.type = spooldir
a1.sources.s1.spoolDir = /opt/datas/flume/spool
#不编程后缀是.tmp的文件
a1.sources.s1.ignorePattern=([^ ]*\.tmp)# defined channel
a1.channels.c1.type = memory
#容量
a1.channels.c1.capacity=1000
#瓶口大小
a1.channels.c1.transactionCapacity=100# defined sink
a1.sinks.k1.type = hdfs
a1.sinks.k1.hdfs.path=/flume/spooling
a1.sinks.k1.hdfs.useLocalTimeStamp=true
#设置文件类型和写的格式
a1.sinks.k1.hdfs.fileType=DataStream
a1.sinks.k1.hdfs.writeFormat=Text#设置HDFS文件大小
a1.sinks.k1.hdfs.rollInterval=0
a1.sinks.k1.hdfs.rollSize=10240
a1.sinks.k1.hdfs.rollCount=0#bond
a1.sinks.k1.channel = c1
a1.sources.s1.channels = c1

7.多日志文件实时采集

a1.sources = s1
a1.channels = c1
a1.sinks = k1# defined sources
#如果是自己编译的类,这里写类的全路径
a1.sources.s1.type = TAILDIR
a1.sources.s1.positionFile =/opt/cdh5.7.6/flume-1.6.0-cdh5.7.6-bin/position/taildir_position.json
a1.sources.s1.filegroups = f1 f2#文件
a1.sources.s1.filegroups.f1 = /opt/datas/flume/taildir/hd.txt
a1.sources.s1.headers.f1.age = 17#文件夹
a1.sources.s1.filegroups.f2 = /opt/datas/flume/taildir/huadian/.*
a1.sources.s1.headers.f2.age = 18
a1.sources.s1.headers.f2.type = aa# defined channel
a1.channels.c1.type = memory
#容量
a1.channels.c1.capacity=1000
#瓶口大小
a1.channels.c1.transactionCapacity=100# defined sink
a1.sinks.k1.type = hdfs
a1.sinks.k1.hdfs.path=/flume/taildir
a1.sinks.k1.hdfs.useLocalTimeStamp=true
#设置文件类型和写的格式
a1.sinks.k1.hdfs.fileType=DataStream
a1.sinks.k1.hdfs.writeFormat=Text#设置HDFS文件大小
a1.sinks.k1.hdfs.rollInterval=0
a1.sinks.k1.hdfs.rollSize=10240
a1.sinks.k1.hdfs.rollCount=0#bond
a1.sinks.k1.channel = c1
a1.sources.s1.channels = c1
http://www.lbrq.cn/news/1423441.html

相关文章:

  • 成都网站制作工作室/网店代运营公司靠谱吗
  • 四川专门做招聘酒的网站/做网站的平台
  • 网站安全认证去哪做/太极seo
  • 网站建设的论文参考文献/郑州seo顾问热狗
  • wordpress存放图片/白帽seo是什么
  • 湛江网站建设外包/百度关键词优化大师
  • 怎么给做的网站做百度搜索/南昌seo搜索优化
  • 个人可以做自媒体网站吗/最好的bt种子搜索神器
  • 东台网站建设找哪家好/郑州网络推广代理顾问
  • 开发电商网站多少钱/公司产品推广文案
  • 编程网校/吉林seo推广
  • 网站建设的特点/一句简短走心文案
  • 兰州企业网络推广方法/万秀服务不错的seo推广
  • html交易网站设计实例/三个关键词介绍自己
  • 公司的网站建设费做什么费用/站长之家seo查找
  • 泉州网站关键词优化/抖音关键词用户搜索排名靠前
  • 松岗做网站/怎么查搜索关键词排名
  • 网站开发最适合语言/网络营销方式有几种
  • 网站开发创建画布/百度百科优化
  • 哈尔滨市建设工程信息网官网/郑州seo优化培训
  • 网站建设怎么开发客户/企业如何建立网站
  • 网站加在线qq/体验营销策略有哪些
  • 汕头网站设计哪家好/竞价托管推广
  • 建设网站找网络公司/熊猫关键词工具
  • 评价一个网站的好坏/十大计算机培训机构排名
  • 如何创建网站推广产品/引擎优化seo怎么做
  • 重庆做网站 帮助中心/廊坊网站排名优化公司哪家好
  • 株洲市住房和城乡建设局门户网站/深圳优化公司高粱seo较
  • 广州网站建设团队/服务营销论文
  • 哪几个网站适合自己做外贸/cba最新积分榜
  • 启发式合并 + 莫队 恋恋的心跳大冒险
  • 正点原子【第四期】Linux之驱动开发篇学习笔记-1.1 Linux驱动开发与裸机开发的区别
  • 《Attention-driven GUI Grounding》论文精读笔记
  • 达梦数据库使用控制台disql执行脚本
  • 5G赋能井下“毛细血管”:巴拉素煤矿零散排水点智能监控系统
  • 【Vibe Coding 工程之 StockAnalyzerPro 记录】- EP1.先写 PRD