Logstash和DataPipeline

pipeline是什么？

Pipeline，中文意为管线，意义等同于流水线。最典型的就是Gpu渲染管线，它指明渲染一个画面需要经过多少道工序。还有就是应用于爬虫框架里面。它就是指某个项目或者框架里面需要用到流水线的设计来简化设计，降低复杂度并提高性能。是一种设计方法，是我们将现实中的社会分工借鉴并运用到计算机编程的例子。

以上是知乎作者Acoris[7] 的回答。

Pipeline是亚当·斯密分工论的体现，分工可以提高效率，很有名的例子就是20世纪初亨利·福特把生产一辆车分成了8772个工时。分工论成为统治企业管理的主要模式。[6]

Acoris的回答中，Pipeline的含义更接近assembly line 或者 production line。

image

图 - assembly line 朗文

将Pipeline回归原始意义[1]：

image

图 - pipeline 朗文

Pipeline原意的重点其实是transport，物理世界中，物体的transport是空间属性的的变化。

而在计算机世界中，数据的传输本质是复制。

image

图 -transport

数据管道（Data Pipeline）是实现系统之间数据迁移的载体，因此包括数据的采集、传输链路、存储队列、消费/转储等都属于数据管道的范畴[8]。在迁移的过程中还会有数据的转换（不是完全的复制）

Logstash

Logstash 项目诞生于 2009 年 8 月 2 日。其作者是世界著名的运维工程师乔丹西塞(JordanSissel)。[2]，显然这个项目的初衷是日志收集。但是随着项目发展，已经可以支持非常丰富的数据源。

Logstash由log和stash两个词组合而成：

image

图 - stash 朗文

在git中也有“git stash”这个命令，用于暂存当前工作区的内容。

Logstash 是开源的服务器端数据处理管道，能够同时从多个来源采集数据，转换数据，然后将数据发送到您最喜欢的“存储库”中[3]。

image

图 - logstash官网图

Logstash的一款“函数式”的工具，支持丰富的input，output和filter插件，编辑好配置文件即可使用。

image

图 - logstash“函数”

Logstash可以单独完成Pipeline，也可以作为整个Pipeline上一个Pipe。

Logstash的资源消耗比较大，启动一个logstash就需要消耗500M左右的内存；所以其不太适合以agent的角色部署在每一台机器上。以Filebeat[5]为例，两者资源消耗存在数量级的区别。

image

图- Logstash和Filebeat在8G内存机器上的资源消耗对比

FKLEK-日志收集和分析Pipeline

目前比较流行的一种架构方案：

(1)利用Filebeat去监控日志文件，将Kafka作为Filebeat的输出端，

(2)Kafka实时接收到Filebeat后以Logstash作为输出端输出，

(3)通过Logstash的一些插件对数据进行过滤最后达到想要的数据格式，并以ElasticSearch作为输出端输出，

(4)在ElasticSearch就可以进行检索和聚合分析，

(5)借助Kibana的数据可视化能力，可以生成丰富的报表。

整个架构的搭建可参考[4]

image

图- Filebeat-Kafka-Logstash-Elasticsearch-Kibana

[1]longman

[2]Logstash介绍

[3]Logstash官网

[4]Filebeat+Kafka+Logstash+ElasticSearch+Kibana搭建完整版

[5]轻量型日志采集器

[6]亚当斯密的分工理论

[7]知乎-pipeline是什么？Acoris的答案

[8]五年双十一：SLS数据管道发展之路

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 212,222评论 6赞 493
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,455评论 3赞 385
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 157,720评论 0赞 348
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,568评论 1赞 284
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,696评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,879评论 1赞 290
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,028评论 3赞 409
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,773评论 0赞 268
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,220评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,550评论 2赞 327
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,697评论 1赞 341
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,360评论 4赞 332
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,002评论 3赞 315
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,782评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,010评论 1赞 266
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,433评论 2赞 360
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,587评论 2赞 350

Logstash和DataPipeline

推荐阅读更多精彩内容