Splunk官方培训笔记

前言

Splunk作为一款成熟的商业化日志处理分析产品无论在功能上还是用户体验上都是令人满意的,而开源方案ELK(Elasticsearch+Logstash+Kibana)相信也有很多朋友考虑或者正在使用,我在这里不想讨论孰优孰劣因为不同的业务场景出发点不同,共存也是不错的选择。文章通过1天的Splunk官方培训记录相关基础概念和动手实验,Splunk上手速度灰常快不过也需要掌握正则表达式,欢迎大家一起学习哈。

Splunk智能运维,挖掘数据的价值

更新记录

2016年03月22日 - 初稿

阅读原文 - http://wsgzao.github.io/post/splunk/

扩展阅读

Splunk - http://www.splunk.com/
正则表达式30分钟入门教程 - http://deerchao.net/tutorials/regex/regex.htm

机器数据

机器数据中包含客户、用户、交易、应用程序、服务器、网络和手机设备所有活动和行为的明确记录。不仅仅包含日志。还包括配置、API 中的数据、消息队列、更改事件、诊断命令输出、工业系统呼叫详细信息记录和传感器数据等。

计算机数以未知格式的阵列存储,监测和分析工具的传统集并未为多样性、速率、数据量、可变性设计。一个专为此独特类型数据设计的全新方法,必须可以快速诊断服务问题、检测复杂信息安全威胁、远程设备的健康状况和性能,以及说明合规性。

机器数据源

每个环境都有独特的机器数据空间,以下是一些示例。

数据类型 位置 它可以告诉您什么
应用日志 本地日志文件、log4j、log4net、Weblogic、WebSphere、JBoss、.NET、PHP 用户活动、欺诈检测、应用性能
业务流程日志 业务流程管理日志 跨渠道客户活动、购买、帐户变更以及问题报表
呼叫详细信息记录 呼叫详细信息记录 (CDR)、计费数据记录、事件数据记录均由电信和网络交换机所记录。 计费、收入保证、客户保证、合作伙伴结算,营销智能
点击流数据 Web 服务器、路由器、代理服务器和广告服务器 可用性分析、数字市场营销和一般调查
配置文件 系统配置文件 如何设置基础设施、调试故障、后门攻击、"定时炸弹"病毒
数据库审计日志 数据库日志文件、审计表 如何根据时间修改数据库数据以及如何确定修改人
文件系统审计日志 敏感数据存储在共享文件系统中 监测并审计敏感数据读取权限
管理并记录 API 通过 OPSEC Log Export API (OPSEC LEA) 和其他 VMware 和 Citrix 供应商特定 API 的 Checkpoint 防火墙 管理数据和日志事件
消息队列 JMS、RabbitMQ 和 AquaLogic 调试复杂应用中的问题,并作为记录应用架构基础
操作系统度量、状态和诊断命令 通过命令行实用程序(例如 Unix 和 Linux 上的 ps 与 iostat 以及 Windows 上的性能监视器)显示的 CPU、内存利用率和状态信息 故障排除、分析趋势以发现潜在问题并调查安全事件
数据包/流量数据 tcpdump 和 tcpflow 可生成 pcap 或流量数据以及其他有用的数据包级和会话级信息 性能降级、超时、瓶颈或可疑活动可表明网络被入侵或者受到远程攻击
SCADA 数据 监视控制与数据采集 (SCADA) 识别 SCADA 基础结构中的趋势、模式和异常情况,并用于实现客户价值
传感器数据 传感器设备可以根据监测环境条件生成数据,例如气温、声音、压力、功率以及水位 水位监测、机器健康状态监测和智能家居监测
Syslog 路由器、交换机和网络设备上的 Syslog 故障排除、分析、安全审计
Web 访问日志 Web 访问日志会报告 Web 服务器处理的每个请求 Web 市场营销分析报表
Web 代理日志 Web 代理记录用户通过代理发出的每个 Web 请求 监测并调查服务条款以及数据泄露事件
Windows 事件 Windows 应用、安全和系统事件日志 使用业务关键应用、安全信息和使用模式检测问题。
线上数据 DNS 查找和记录,协议级信息,包括标头、内容以及流记录 主动监测应用性能和可用性、最终客户体验、事件调查、网络、威胁检测、监控和合规性

实验准备

免费版每天最多可对 500 MB 数据建立索引

Splunk Enterprise - http://www.splunk.com/zh-hans_cn/download/splunk-enterprise.html

file://C:\Users\wsgzao\Desktop\splunk_workshop  (2 folders, 3 files, 26.20 MB, 48.25 MB in total.)
│  sampledata-selected.zip   323.36 KB
│  splunk.pdf    24.02 MB
│  tutorialdata.zip  1.86 MB
├─sampledata-selected   (0 folders, 3 files, 4.07 MB, 4.07 MB in total.)
│      access.log  4.06 MB
│      http_status.csv 1.34 KB
│      prices.csv  630 bytes
└─tutorialdata  (5 folders, 0 files, 0 bytes, 17.99 MB in total.)
    ├─mailsv  (0 folders, 1 files, 1.06 MB, 1.06 MB in total.)
    │      secure.log    1.06 MB
    ├─vendor_sales    (0 folders, 1 files, 1.96 MB, 1.96 MB in total.)
    │      vendor_sales.log  1.96 MB
    ├─www1    (0 folders, 2 files, 5.18 MB, 5.18 MB in total.)
    │      access.log    4.06 MB
    │      secure.log    1.12 MB
    ├─www2    (0 folders, 2 files, 4.87 MB, 4.87 MB in total.)
    │      access.log    3.85 MB
    │      secure.log    1.02 MB
    └─www3    (0 folders, 2 files, 4.91 MB, 4.91 MB in total.)
            access.log    3.86 MB
            secure.log    1.05 MB

<iframe src="https://www.slideshare.net/slideshow/embed_code/key/dQlrUNPu3JNYjp" width="427" height="356" frameborder="0" marginwidth="0" marginheight="0" scrolling="no" style="border:1px solid #CCC; border-width:1px; margin-bottom:5px; max-width: 100%;" allowfullscreen> </iframe>

浏览slideshare可能要翻墙,如需帮助可参考《GFW翻墙小结》

动手实验

安装Splunk极其简单,这里以Windows为例

http://localhost:8000/zh-CN/
http://localhost:8000/en-US/

Search App:数据导入,了解splunk搜索界面,执行基本搜索
Field:了解Splunk字段含义;字段提取;字段对照
SPL:使用SPL(SplunkSearchProcessingLanguage)指令实现目标场景
Businessused cases:场景实现,自定义仪表盘制作

Objectives of workshop

  • Learn how to start indexing machine data in Splunk.
  • Leverage these machine data for reporting and learn some of the common reporting commands.
  • Learn to use searches to pull out data of importance.
  • Get an idea on an unique Splunk feature called "schema-on-the-fly", and understand how to apply such “Fields” to machine data to make IT and business sense.
  • Learn how to build and share dashboards during the class.
  • Get an idea how to create data model and create pivot reports*
  • You can re-run the whole workshop after this session anywhere
  • Q&A

实验过程

我觉得操作都很简单,大家可以多参考官方的Splunk Documentation

http://docs.splunk.com/Documentation
http://docs.splunk.com/Documentation/Splunk/latest/Translated/SimplifiedChinesemanuals

正则表达式30分钟入门教程 - http://deerchao.net/tutorials/regex/regex.htm

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,711评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,932评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,770评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,799评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,697评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,069评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,535评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,200评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,353评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,290评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,331评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,020评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,610评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,694评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,927评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,330评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,904评论 2 341

推荐阅读更多精彩内容

  • 还有两天就是我哥去世的百日,享年九十六岁的大妈昨天走了,大妈的葬礼将和我哥的百日祭一起举行。 大妈一生只有我哥一个...
    且行且珍惜知足常乐阅读 422评论 8 7
  • 杨威 度量衡,指在日常生活中用于计量物体长短、容积、轻重的物体的统称。其中计量长短的器具...
    杨威1974阅读 3,129评论 1 4
  • 1. 标准的盒子模型(W3C)?与低版本IE盒子模型有什么差异? 区别是标准盒子的宽高就是纯粹的content内容...
    起风了_点点阅读 480评论 0 1