flume如何监控多个动态变化的日志文件


同时监控多个文件并下沉到hdfs配置的agent:

这种功能应用场景:是对历史文件进行迁移使用,并不适用实时收集场景,只能通过拆分日志实现准实时,而且必须要把要存储的文件扔进被flume监控的文件夹才能被自动监控并发送到hdfs中存储起来。整个文件数据传输完毕后,文件后缀会被更改成后缀为.COMPLETED的文件。此后缀在设置source时可以通过其fileSuffix关键字自定义,默认是COMPLETED

采集源,即source——监控文件目录 : spooldir

下沉目标,即sink——HDFS文件系统 : hdfs sink

source和sink之间的传递通道——channel,可用file channel 也可以用内存channel

配置文件名称:spooldir-memory-hdfs.conf

# Name the components on this agent

spooldir-memory-hdfs.sources = spooldir-source

spooldir-memory-hdfs.sinks = hdfs-sink

spooldir-memory-hdfs.channels = memory-channel

# Describe/configure the source

##注意:不能往监控目中重复丢同名文件

## 通过spooldir来监控文件内容的变化

spooldir-memory-hdfs.sources.spooldir-source.type = spooldir

##监控日志文件所在的目录

spooldir-memory-hdfs.sources.spooldir-source.spoolDir =/usr/logtest

spooldir-memory-hdfs.sources.spooldir-source.fileHeader = true

spooldir-memory-hdfs.sources.spooldir-source.ignorePattern=^(.)*\\.out$

# Describe the sink

## 表示下沉到hdfs,下面配置的类型不同,type下面的参数就不同

spooldir-memory-hdfs.sinks.hdfs-sink.type = hdfs

#sinks.k1只能连接一个channel,source可以配置多个

spooldir-memory-hdfs.sinks.hdfs-sink.channel = memory-channel

#下面的配置告诉用hdfs去写文件的时候写到什么位置,下面的表示不是写死的,而是动态变化的。表示输出的目录名称是可变的

spooldir-memory-hdfs.sinks.hdfs-sink.hdfs.path =hdfs://192.168.32.129:9000/xcx/%y-%m-%d/%H%M/

#表示文件的前缀

spooldir-memory-hdfs.sinks.hdfs-sink.hdfs.filePrefix = xcx-

spooldir-memory-hdfs.sinks.hdfs-sink.hdfs.fileSuffix =.lzo     ###存储文件后缀,推荐lzo

spooldir-memory-hdfs.sinks.hdfs-sink.hdfs.codeC=lzo      ###压缩格式可选值gzip, bzip2, lzo, lzop, snappy

spooldir-memory-hdfs.sinks.hdfs-sink.hdfs.writeFormat=Text                                    ###书写格式

spooldir-memory-hdfs.sinks.hdfs-sink.hdfs.codeC=lzo  ###压缩格式

#表示到了需要触发的时间时,是否要更新文件夹,true:表示要更新

spooldir-memory-hdfs.sinks.hdfs-sink.hdfs.round = true

##表示每隔10分钟改变一下文件夹

spooldir-memory-hdfs.sinks.hdfs-sink.hdfs.roundValue = 10

##切换文件的时候单位是分钟

spooldir-memory-hdfs.sinks.hdfs-sink.hdfs.roundUnit = minute

##表示只要过了3秒钟,就切换生成一个新的文件

##spooldir-memory-hdfs.sinks.hdfs-sink.hdfs.rollInterval = 3

##如果记录的文件大于200(字节)时切换一次

spooldir-memory-hdfs.sinks.hdfs-sink.hdfs.rollSize = 200

##当写了5个事件时触发,如果让此项失效,设置为0

spooldir-memory-hdfs.sinks.hdfs-sink.hdfs.rollCount = 5

##收到了多少条消息往hdfs中追加内容

spooldir-memory-hdfs.sinks.hdfs-sink.hdfs.batchSize = 1

#使用本地时间戳

spooldir-memory-hdfs.sinks.hdfs-sink.hdfs.useLocalTimeStamp = true

# Use a channel which buffers events in memory

##使用内存的方式

spooldir-memory-hdfs.channels.memory-channel.type = memory

spooldir-memory-hdfs.channels.memory-channel.capacity = 1000

spooldir-memory-hdfs.channels.memory-channel.transactionCapacity = 100

# Bind the source and sink to the channel

spooldir-memory-hdfs.sources.spooldir-source.channels = memory-channel

spooldir-memory-hdfs.sinks.hdfs-sink.channel = memory-channel

屏蔽无需flume监控的文件

在传输新文件到监控的文件夹时,需要让Spooing Directory Source忽略这个正在传输的文件,等传输完毕后在触发。可以使用ignorePattern属性来避免。

spooldir-memory-hdfs.sources.spooldir-source.ignorePattern=^(.)*\\.out$

临时方式启动:

bin/flume-ng agent --conf $FLUME_HOME/conf --conf-file $FLUME_HOME/conf/spooldir-memory-hdfs.conf --name spooldir-memory-hdfs -Dflume.root.logger=INFO,console

后台方式启动:

nohup bin/flume-ng agent --conf $FLUME_HOME/conf --conf-file $FLUME_HOME/conf/spooldir-memory-hdfs.conf --name spooldir-memory-hdfs &

改动文件后flume监控的目录下文件都会

扔了之后,现象是 

1、/usr/logtest/文件夹下的文件加了一个后缀.COMPLETED


©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,236评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,867评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,715评论 0 340
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,899评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,895评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,733评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,085评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,722评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,025评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,696评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,816评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,447评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,057评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,009评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,254评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,204评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,561评论 2 343

推荐阅读更多精彩内容

  • 我的体会字数开始变得多了一点,开始从观察的东西表象,去想背后的故事。事物之间的关联,即是因果关系。因果循环,善因得...
    思思培阅读 216评论 0 0
  • 多数人不太习惯表达情绪,不表达情绪的后果是最后用疾病来表达, 如果你对中医了解得更深,很多疾病都是情志病, 多年的...
    张德佳2阅读 293评论 0 0
  • 2016年7月14日,我第一次知道了你,简书,可能比很多人晚了一些... 喜欢这个名字,简单、纯净,希望会有很多的...
    不想诉说的秘密阅读 254评论 1 1
  • 今天上午孩子给我打电话,说这几天上午和下午都要安排排练,问我可不可以不写作业了。我选择了一项很容易完成的作业让她做...
    董涛_1dcd阅读 125评论 0 0