logstash+kafka收集hue日志,分析用户下载数据情况

1.文档编写目的

主要是为了给大家提供一种监控某个服务运行情况或者是针对该服务日志进行一些其他分析功能的技术选型方式。本篇文档将针对大数据集群的hue组件,用户在使用hue查询hive数据后会有一个下载数据的操作,这个操作将严重影响hue服务的稳定性。所以我们决定通过logstash+kafka的方式分析hue日志,监控下载数据的操作。

  • 内容概述
  1. 环境描述
  2. 利用logstash收集hue日志并发送到kafka
  3. 编写python代码消费Kafka消息,并分析日志,最后发送钉钉报警
  4. 验证报警机制
  • 前提条件
  1. logstash已安装并能正常运行
  2. Kafka已创建相关topic

2.环境描述

  1. hue的日志都分布在.........*上的/var/log/hue/目录下。
  2. logstash版本logstash-6.2.3(里面有个坑:这个版本必须用java8才能使用,由于生产环境都是jdk1.7的所以这里要单独配置环境:编辑bin/logstash 添加jdk1.8的路径)
  3. kafka地址:.........**,端口都是9092(由于版本较新不需要zookeeper的相关信息)。topic信息:hue-download-group。

3.logstash收集hue日志

  • 配置logstash文件
input {
  file {
    path => ["/var/log/hue/access.log","/var/log/hue/access.log.1"]
    stat_interval => 5
  }
}
output {
  kafka {
    topic_id => "hue-access-log"
    bootstrap_servers => "**.*.**.***:9092;**.*.**.***:9092;**.*.**.***:9092"
  }
}
  • 启动logstash服务:
    这里要修改一下启动脚本logstash:添加环境变量export JAVA_HOME=/opt/soft/java/jdk1.8.0_111/
    启动命令:nohup bin/logstash -f confs/hue-download-monitor.conf >>hue_download.log 2&1 &
  • 可以开启一个Kafka console comsumer看看是否收到日志消息:
    进到kafka服务器,bin/kafka-console-consumer.sh --topic hue-access-log --bootstrap-server localhost:9092

4.代码编写

from kafka import KafkaConsumer
import re
import requests
import json

dingTalkProdURL = '*****'
def findDownload(inputMessage):
    #一条日志中包含‘download’就是在下载数据
    if 'download' in inputMessage:
        print inputMessage
        elements = re.split(r"[ ]+", inputMessage)
        # server ip , time , user ip , user name
        return (elements[1],elements[3],elements[6],elements[7])

def postToDingTalk(monitorMessage):
    #封装发送的消息
    messageBody = {}
    messageBody["msgtype"] = "markdown"
    messageBody["markdown"] = {}
    messageBody["markdown"]["title"] = "Hue Download Monitor"
    messageBody["markdown"]["text"] = "### Download User Name: " + monitorMessage[3] + "\n" + \
                                      "1. User IP: " + monitorMessage[2] + "\n" + \
                                      "2. Download Time: " + monitorMessage[1] + "\n" + \
                                      "3. Hue Server: " + monitorMessage[0] + "\n"
    messageBody["at"] = {}
    messageBody["at"]["atMobiles"] = []
    messageBody["at"]["isAtAll"] = 'false'
    header = {}
    header["Content-Type"] = "application/json; charset=utf-8"
    print json.dumps(messageBody)
    r = requests.post(dingTalkProdURL, json.dumps(messageBody), headers=header)
    print r.status_code
    print r.reason
if __name__ == '__main__':
    # To consume latest messages and auto-commit offsets
    consumer = KafkaConsumer('hue-access-log',
                             group_id='hue-download-group',
                             bootstrap_servers=['**.*.**.***:9092', '**.*.**.***:9092', '**.*.**.***:9092'])
    for message in consumer:
        # message value and key are raw bytes -- decode if necessary!
        # e.g., for unicode: `message.value.decode('utf-8')`
        # print ("%s:%d:%d: key=%s value=%s" % (message.topic, message.partition,
        #                                       message.offset, message.key,
        #                                       message.value))
        elementTuple = findDownload(message.value)
        if elementTuple != None:
            #将报警信息封装好后post到钉钉的接口
            postToDingTalk(elementTuple)

5.验证报警机制的准确性

  • 登录到hue页面,查询hive数据,然后点击下载ecxl表格
  • 钉钉出现报警,验证完毕!

6.总结

  • 利用logstash收集日志,将日志打到kafka,最后再在代码中消费kafka消息是大数据中解决实时报警的基本方式。同时这也是解决一些需要处理实时数据的重要手段。
  • 这里采用logstash而不是flume收集日志主要是logstash配置相对简单,适合轻量级的应用。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,189评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,577评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,857评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,703评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,705评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,620评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,995评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,656评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,898评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,639评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,720评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,395评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,982评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,953评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,195评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,907评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,472评论 2 342

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,594评论 18 139
  • 本人陆陆续续接触了ELK的1.4,2.0,2.4,5.0,5.2版本,可以说前面使用当中一直没有太多感触,最近使用...
    三杯水Plus阅读 4,083评论 0 12
  • 概述 监控预警平台, eagle + eye (鹰眼)的合体词, 寓意可以快速发现问题, 并及时作出响应,Eagl...
    Kungfu猫熊阅读 7,362评论 0 52
  • 我们的父亲在浓雾中注目 他的手被高楼的避雷针刺中 他濛濛的目光水般泄下 我们在羊水中开始早熟 随着一双骨架往北方延...
    唐啵儿阅读 119评论 1 2
  • 中午吃什么?媳妇没在家,凑合一口吧。 晚上吃什么?嗨,减肥呢,凑合一口吧。 有一种生活,叫凑合着过。 你都用什么凑...
    檀香海盐阅读 637评论 1 0