《ELK Stack权威指南》第1章　入门示例

xiaoxiao2024-04-16 30

本节书摘来自华章出版社《ELK Stack权威指南》一书中的第1章，第1节，作者饶琛琳，更多章节内容可以访问云栖社区“华章计算机”公众号查看。

入门示例

什么是Logstash？为什么要用Logstash？怎么用Logstash？这是本章将要介绍的内容。本章从最基础的知识着手，从以下几步介绍Logstash的必备知识。1）下载安装。介绍Logstash软件的多种安装部署方式，并给出推荐的方式。2）初次运行。通过Hello World示例，演示Logstash最简单的运用，解释其逻辑上的基础原理。3）配置语法。介绍Logstash的DSL设计，Logstash命令的运行参数。4）插件安装。灵活和丰富的插件是Logstash最重要的优势。本节会介绍Logstash插件的安装方式。5）长期运行方式。从初次终端测试到长期后台稳定运行，本节会介绍几种不同方案，供读者根据实际场景选择。

1.1　下载安装

1.下载

Logstash从1.5版本开始，将核心代码和插件代码完全剥离，并重构了插件架构逻辑，所有插件都以标准的Ruby Gem包形式发布。

下载官方软件包的方式有以下几种：

压缩包方式

https://artifacts.elastic.co/downloads/logstash/logstash-5.1.1.tar.gz

Debian平台

https://artifacts.elastic.co/downloads/logstash/logstash-5.1.1.deb

Redhat平台

https://artifacts.elastic.co/downloads/logstash/logstash-5.1.1.rpm

2.安装

在上面这些包中，你可能更偏向使用rpm、dpkg等软件包管理工具来安装Logstash，开发者在软件包里预定义了一些依赖。比如，logstash-5.0.2就依赖于jre包。

另外，软件包里还包含有一些很有用的脚本程序，比如/etc/init.d/logstash。

如果你必须在一些很老的操作系统上运行Logstash，那你只能用源代码包部署了，记住要自己提前安装好Java：

yum install openjdk-jre

export JAVA_HOME=/usr/java

tar zxvf logstash-5.0.2.tar.gz

3.最佳实践

但是真正的建议是：如果可以，请用Elasticsearch官方仓库来直接安装Logstash！

Debian平台

wget -qO - https://artifacts.elastic.co/GPG-KEY-elasticsearch | sudo apt-key add -

sudo apt-get install apt-transport-https

echo "deb https://artifacts.elastic.co/packages/5.x/apt stable main" | sudo tee -a /etc/apt/sources.list.d/elastic-5.x.list

sudo apt-get update && sudo apt-get install logstash

Redhat平台

sudo rpm --import

https://artifacts.elastic.co/GPG-KEY-elasticsearch

sudo cat > /etc/yum.repos.d/elk.repo <<EOF

[logstash-5.x]

name=Elastic repository for 5.x packages

baseurl=https://artifacts.elastic.co/packages/5.x/yum

gpgcheck=1

gpgkey=https://artifacts.elastic.co/GPG-KEY-elasticsearch

enabled=1

autorefresh=1

type=rpm-md

EOF

sudo yum install -y logstash

enabled=1

EOF

yum clean all

yum install logstash

1.2　Hello World

与绝大多数IT技术介绍一样，我们也以一个输出“Hello World”的形式开始学习Logstash。

1.命令行运行

在终端中，像下面这样运行命令来启动 Logstash 进程：

# bin/logstash -e 'input{stdin{}}output{stdout{codec=>rubydebug}}'

首先看到终端输出一段进程启动过程的提示输出。提示以"Successfully started Logstash API endpoint {:port=>9600}"结束。

然后你会发现终端在等待你的输入。没问题，敲入Hello World，回车，看看会返回什么结果！

{

"message" =>"Hello World",

"@version" =>"1",

"@timestamp" =>"2014-08-07T10:30:59.937Z",

"host" =>"raochenlindeMacBook-Air.local",

}

没错！就是这么简单。

2.完整示例

命令行运行当然不是什么特别方便的用法，所以绝大多数情况下，我们都是采用额外定义一个logstash.conf配置文件的方式来启动Logstash。下面是我们的第一个完整版logstash.conf的示例：

input {

stdin { }

}

output {

stdout {

codec => rubydebug {}

}

elasticsearch {

Rost=>["127.0.0.1"]

}

因为在5.0版本中，Elasticsearch和Kibana都是独立服务。如果你按照上一节的最佳实践配置好了yum的话，通过如下命令启动服务即可：

# service elasticsearch start && service kibana start

然后在终端上这样运行：

# bin/logstash -f logstash.conf

同样，还是输入一次Hello World。你会看到和上一次一样的一段Ruby对象输出。但事实上，这个完整示例可不止如此。打开另一个终端，输入下面一行命令：

# curl http://127.0.0.1:9200/_search?q=hello

你会看到终端上输出下面这么一段内容：

{"took":15,"timed_out":false,"_shards":{"total":27,"successful":27,"failed":0},"hits":{"total":1,"max_score":0.095891505,"hits":[{"_index":"logstash-2015.08.22","_type":"logs","_id":"AU90s1eNgg_P5-w7SB32","_score":0.095891505,"_source":{"message":"Hello World","@version":"1","@timestamp":"2014-08-07T10:30:59.937Z","host":"raochenlindeMacBook-Air.local"}}]}}

这时候你打开浏览器，访问http://127.0.0.1:5601地址，按照提示完成index pattern配置（正常的话只需要点击一下Create按钮），即可点击Discover页面看到如图1-1所示的效果。你在终端上输入的数据，可以从这个页面上任意搜索了。

图1-1　Kibana上搜索的hello world

对index pattern配置有疑惑的读者，可以阅读本书第三部分关于Kibana的章节。

3.解释

每位系统管理员都肯定写过很多类似这样的命令：cat randdata | awk '{print $2}' | sort | uniq -c | tee sortdata。这个管道符|可以算是Linux世界最伟大的发明之一（另一个是“一切皆文件”）。

Logstash就像管道符一样！

输入（就像命令行的cat）数据，然后处理过滤（就像awk或者uniq之类）数据，最后输出（就像tee）到其他地方。

当然实际上，Logstash是用不同的线程来实现这些的。如果你运行top命令然后按下H键，你就可以看到下面这样的输出：

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

21401 root 16 0 1249m 303m 10m S 18.6 0.2 866:25.46 |worker

21467 root 15 0 1249m 303m 10m S 3.7 0.2 129:25.59 >elasticsearch.

21468 root 15 0 1249m 303m 10m S 3.7 0.2 128:53.39 >elasticsearch.

21400 root 15 0 1249m 303m 10m S 2.7 0.2 108:35.80 <file

21403 root 15 0 1249m 303m 10m S 1.3 0.2 49:31.89 >output

21470 root 15 0 1249m 303m 10m S 1.0 0.2 56:24.24 >elasticsearch.

如上例所示，Logstash很温馨地给每类线程都取了名字，输入的叫<xx，过滤的叫|xx，输出的叫>xx。

数据在线程之间以事件的形式流传。不要叫行，因为Logstash可以处理多行事件。

Logstash会给事件添加一些额外信息。最重要的就是@timestamp，用来标记事件的发生时间。因为这个字段涉及Logstash的内部流转，所以必须是一个joda对象，如果你尝试自己给一个字符串字段重命名为@timestamp的话，Logstash会直接报错。所以，请使用logstash-filter-date插件来管理这个特殊字段。

此外，大多数时候，还可以见到另外几个：

host标记事件发生在哪里。

type标记事件的唯一类型。

tags标记事件的某方面属性。这是一个数组，一个事件可以有多个标签。

你可以随意给事件添加字段或者从事件里删除字段。事实上事件就是一个Ruby对象，或者更简单地理解为就是一个哈希也行。

每个Logstash过滤插件，都会有四个方法叫add_tag、remove_tag、add_field和remove_field，它们在插件过滤匹配成功时生效。

《ELK Stack权威指南 》第1章 入门示例

《ELK Stack权威指南》第1章　入门示例