Logstash filter插件开发

Logstash是一个具有实时管线能力的开源数据收集引擎。在ELK Stack中,通常选择更轻量级的Filebeat收集日志,然后将日志输出到Logstash进行加工处理,再将处理后的日志输出到指定的目标(ElasticSearch,Kafka等)当中。
Logstash事件的处理管线是inputs → filters → outputs,三个阶段都可以自定义插件,本文主要介绍如何开发自定义需求最多的filter插件。
Logstash的安装就不详细介绍了,下载传送门:https://www.elastic.co/downloads/logstash

生成filter插件

cd到Logstash的跟目录,使用bin/logstash-plugin生成filter插件模板,如下:

bin/logstash-plugin generate --type filter --name test  --path vendor/localgems

vendor/localgems可修改为你自己的路径。
查看filter插件的目录结构,如下:

$ tree logstash-filter-test
├── Gemfile
├── LICENSE
├── README.md
├── Rakefile
├── lib
│   └── logstash
│       └── filters
│           └── test.rb
├── logstash-filter-test.gemspec
└── spec
    └── filters
        └── test_spec.rb
    └── spec_helper.rb

filter插件初探

代码结构

Logstash插件是用ruby写的,查看lib/logstash/filters/test.rb文件,如下:

# encoding: utf-8
require "logstash/filters/base"
require "logstash/namespace"

# This  filter will replace the contents of the default 
# message field with whatever you specify in the configuration.
#
# It is only intended to be used as an .
class LogStash::Filters::Test < LogStash::Filters::Base

  # Setting the config_name here is required. This is how you
  # configure this filter from your Logstash config.
  #
  # filter {
  #    {
  #     message => "My message..."
  #   }
  # }
  #
  config_name "test"
  
  # Replace the message with this value.
  config :message, :validate => :string, :default => "Hello World!"
  

  public
  def register
    # Add instance variables 
  end # def register

  public
  def filter(event)

    if @message
      # Replace the event message with our message as configured in the
      # config file.
      event.set("message", @message)
    end

    # filter_matched should go in the last line of our successful code
    filter_matched(event)
  end # def filter
end # class LogStash::Filters::Test

UTF-8编码

Logstash依赖于UTF-8编码,需要在插件代码开始出添加:

# encoding: utf-8

require

模板代码里面默认require"logstash/filters/base""logstash/namespace",如果需要依赖其它代码或者gems就在这添加,可以参考后面在插件中查询MySql的代码。

插件名称配置

插件名称配置代码如下:

config_name "test"

test就是插件名称,在Logstash配置的filter块中使用。

插件参数配置

插件参数配置代码如下:

config :message, :validate => :string, :default => "Hello World!"

message是插件test的可选参数,默认值是"Hello World!"。下面是参数的通用配置代码:

config :variable_name, :validate => :variable_type, :default => "Default value", :required => boolean, :deprecated => boolean, :obsolete => string
  • :variable_name:参数名称
  • :validate:验证参数类型,如:string, :password, :boolean, :number, :array, :hash, :path
  • :required:是否必须配置
  • :default:默认值
  • :deprecated:是否废弃
  • :obsolete:声明该配置不再使用,通常提供升级方案

插件方法

Logstash插件必须实现两个方法:registerfilter
register方法代码如下:

  public
  def register
    # Add instance variables 
  end # def register

register方法相当于初始化方法,不需要手动调用,可以在这个方法里面调用配置变量,如@message,也可以初始化自己的实例变量。
filter方法代码如下:

  public
  def filter(event)

    if @message
      # Replace the event message with our message as configured in the
      # config file.
      event.set("message", @message)
    end

    # filter_matched should go in the last line of our successful code
    filter_matched(event)
  end # def filter

filter方法是插件的数据处理逻辑,其中event变量封装了数据流,可以通过接口访问event中的内容,具体参见https://www.elastic.co/guide/en/logstash/5.1/event-api.html。最后一句调用了filter_matched,这个方法用于保证Logstash的配置add_field, remove_field, add_tagremove_tag会被正确执行。

在插件中使用其它类库

这里以在插件中查询MySql为例进行说明,使用jdbc操作MySql,需要安装jdbc-mysql,操作如下:
添加Logstash的环境变量:

export LOGSTASH_HOME=/opt/logstash-5.2.1
export PATH=$PATH:$LOGSTASH_HOME/vendor/jruby/bin

安装jdbc-mysql

gem install jdbc-mysql

使用sequel(代码和文档请查看vendor/bundle/jruby/1.9/gems/sequel-4.43.0)操作MySql,首先需要在logstash-filter-test.gemspec配置文件中添加对sequel的依赖,如下:

# Gem dependencies
s.add_runtime_dependency "logstash-core-plugin-api", "~> 2.0"
s.add_runtime_dependency 'sequel'
s.add_development_dependency 'logstash-devutils'

然后在test.rbrequire相关代码:

require "sequel"
require "sequel/adapters/jdbc"

test.rb中添加:jdbc_driver_library配置参数,用于配置jdbc驱动库的path,我这的路径是"/usr/local/lib/ruby/gems/2.3.0/gems/jdbc-mysql-5.1.40/lib/mysql-connector-java-5.1.40-bin.jar"

config :jdbc_driver_library, :validate => :string, :required => true

register方法中做了两件事,一是初始化了几个实例变量,二是require依赖的jdbc库。简单说明下实例变量的用途,@logger用于输出日志,@connection_retry_attempts@connection_retry_attempts_wait_time用于数据库连接重试,@connection_wait_timeout用于设置MySql的session超时时间,避免与MySql连接过多,这是一个双保险策略,正常情况下MySql会设置全局的超时时间,并且查询完成之后我们会主动断开连接(见fetch_info方法),在断开失败且MySql的超时时间过长时@connection_wait_timeout才会起作用。

public
def register
  # Add instance variables 
  @logger = self.logger
  @connection_retry_attempts = 5
  @connection_retry_attempts_wait_time = 1
  @connection_wait_timeout = 10
  begin
    require @jdbc_driver_library
  rescue => e
    @logger.error("Failed to load #{@jdbc_driver_library}", :exception => e)
  end
end # def register

创建db实例:

private 
def create_db(conn_str)
  db = nil
  retry_attempts = @connection_retry_attempts
  while retry_attempts > 0 do
    retry_attempts -= 1
    begin
      tmp_db = Sequel.connect(conn_str)
    rescue Sequel::PoolTimeout => e
      if retry_attempts <= 0
        @logger.error("Failed to connect to database. 5 second timeout exceeded. Tried #{@connection_retry_attempts} times.")
        raise e
      else
        @logger.error("Failed to connect to database. 5 second timeout exceeded. Trying again.")  
      end
    rescue Sequel::Error => e
      if retry_attempts <= 0
        @logger.error("Unable to connect to database. Tried #{@connection_retry_attempts} times", :error_message => e.message)
        raise e
      else
        @logger.error("Unable to connect to database. Trying again", :error_message => e.message)
      end
    else
      db = tmp_db
      break
    end
    sleep(@connection_retry_attempts_wait_time)
  end
  db
end

查询数据:

private
def fetch_info(db, sql, key)
  all_info = {}
  retry_attempts = @connection_retry_attempts
  while retry_attempts > 0 do
    retry_attempts -= 1
    begin
      db.fetch(sql) do |row|
        all_info[row[key]] = row
      end
      db.run "set wait_timeout = " + @connection_wait_timeout.to_s
    rescue Sequel::DatabaseConnectionError, Sequel::DatabaseError => e
      if retry_attempts <= 0
        @logger.warn("Exception when executing JDBC query", :exception => e)
        raise e
      else
        @logger.error("Failed to execute query. Trying again.", :error_message => e.message)
      end
    else
      break
    end
    sleep(@connection_retry_attempts_wait_time)
  end
  db.disconnect()
  all_info
end

接下来就可以根据需要在registerfilter中使用create_dbfetch_info方法了。
注意:这里只是以查询MySql为例进行说明,处理Logstash事件时需要考虑对性能和吞吐量的影响。

在Logstash中配置定制的插件

cd到Logstash根目录下,在Gemfile添加以下配置:

gem "logstash-filter-test", :path => "vendor/localgems/logstash-filter-test"

启动Logstash

启动Logstash,配置我们定制的test插件,如下:

bin/logstash -e 'input { beats { port => "5043" } } filter { test { jdbc_driver_library => "/usr/local/lib/ruby/gems/2.3.0/gems/jdbc-mysql-5.1.40/lib/mysql-connector-java-5.1.40-bin.jar" } } output { stdout { codec => rubydebug }}'

也可以写配置文件,与上面的-e参数内容一致,然后使用配置文件启动Logstash。
启动Logstash的传送门:https://www.elastic.co/guide/en/logstash/5.1/running-logstash-command-line.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,214评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,307评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,543评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,221评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,224评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,007评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,313评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,956评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,441评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,925评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,018评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,685评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,234评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,240评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,464评论 1 261
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,467评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,762评论 2 345

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,599评论 18 139
  • Spring Boot 参考指南 介绍 转载自:https://www.gitbook.com/book/qbgb...
    毛宇鹏阅读 46,748评论 6 342
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,581评论 18 399
  • 青海湖,给我的感觉是天空很蓝,白云很清晰,没有雾霾,看到的一切都很新鲜。你们喜欢吗?喜欢的话点个赞哟。
    别踩影子呀阅读 478评论 2 14
  • 不知不觉,大学就快结束了。从一开始,信誓旦旦要怎么样怎么样的幼稚,变成可以这样那样的思考解决问题;从怎么办啊,学长...
    人间的帅哥阅读 618评论 0 0