临时_01e2 - 简书

临时_01e2

IP属地：四川

十七.Hadoop部分问题思考
1.关于切片的时候保证数据完整性的问题 MapReduce在进行切片的时候有几个参数，一个是最小切片大小(mapred.min.split.si...

260 0 0
关于IDEA配置文件和代码的路径
Sources Root：告诉idea这个文件夹及其子文件夹中包含源代码，是需要编译构建的一部分 Test Sources Root：测试源文件...

2608 0 1

三.Flink集群搭建
Flink可以选择的部署方式有： Local、Standalone（资源利用率低）、Yarn、Mesos、Docker、Kubernetes、A...

1078 0 0
二.Flink基本架构
2.0 JobManager与TaskManager Flink运行时包含了两种类型的处理器： JobManager处理器：也称之为Master...

417 0 0
一.Flink概述
1.1 技术演变流处理语义 At most once（最多一次）：每条数据记录最多被处理一次，潜台词也表明数据会有丢失（没被处理掉）的可能 A...

413 0 0
六.Kibana
Kibana是一个开源的分析和可视化平台，设计用于和Elasticsearch一起工作。你用Kibana来搜索，查看，并和存储在Elastic...

429 0 0
五.Logstash
5.1 Logstash简介 Logstash is a tool for managing events and logs. You can ...

717 0 0

四.IK分词器
针对词条查询（TermQuery）,查看默认中文分词器的效果: [itstar@hadoop105 elasticsearch]$ curl -...

317 0 0
三.Java API操作
Elasticsearch的Java客户端非常强大；它可以建立一个嵌入式实例并在必要时运行管理任务。运行一个Java应用程序和Elastics...

508 0 0