虚拟机克隆及大数据之hadoop学习笔记

快照 ---还原点

克隆注意点

1.修改主机名 vi /etc/sysconfig/network

2.修改mac地址 vi /etc/sysconfig/network-scripts/ifcfg-eth0

HWADDR=00:0C:29:CD:79:8C ---删掉

UUID=57d4.... --删掉

vi /etc/udev/rules.d/70-persistent-net.rules

-- 删除错误的mac地址所在的行

3.重启网络服务

# service network restart

Hadoop -----大数据基础平台

Lucene 开源的高性能全文检索工具包

Nutch 开源的Web搜索引擎

--Doug Couting

谷歌公司(三大论文):

MapReduce -- 计算框架模型(分而治之) ----->MapReduce

GFS --存储数据 -->HDFS(hadoop distributed file system)

BigTable --存储数据

---->MapReduce,HDFS加入apache 基金会 ,合并后也就是今天的Hadoop

大数据定义:海量数据里面挖掘/发现/采集/分析有价值的信息.

Hadoop 四个重要组成部分

common ---基础模块

HDFS --存储数据 (读-写) 一次写入,多次读取

--namenode 存储元数据(数据存储的位置)

--datanode 数据

Yarn -- 资源管理(CPU/内存/虚拟代码)(2.x版本新增)

--ResourceManager

--NodeManger

MapReduce --计算模型(分而治之) key/value

-- 分 map

--合 reduce

Hadoop 生态系统

单机模式

伪分布式模式 --用于开发测试

分布式模式

伪分布式模式搭建:

环境准备-----

1.系统的主机名(root用户)

#vi /etc/sysconfig/network

hadoop-senior.summer.com(不要用下划线)

2.创建普通用hadoop(后期都使用这个用户)

修改密码# echo 123456 | passwd --stdin hadoop

3.把ip地址设置成静态ip

#setup --console(虚拟机图形化界面)

或者

vi /etc/sysconfig/network-scripts/ifcfg-eth0

BOOTPROTO=none

IPADDR=192.168.153.128

NETMASK=255.255.255.0

GATEWAY=192.168.153.2

DNS1=202.96.209.5

DNS2=8.8.8.8

4.关闭防火墙和selinux

service iptables stop

chkconfig iptables off

vi /etc/sysconfig/selinux

SELINUX=disabled (进去默认是enforing)

5 修改host

vi /etc/sysconfig/selinux

[root@localhost ~]# vi /etc/hosts

6.重启服务器

目录准备

[root@hadoop-senior ~]# mkdir /opt/modules(root用户才能执行)

[root@hadoop-senior ~]# mkdir /opt/softwares(root用户才能执行)

更改权限

[root@hadoop-senior ~]# chown -R hadoop:hadoop /opt/(hadoop用户能执行)

软件包准备

上传到softwares

安装jdk 到modules

用root用户修改vi /etc/profile 配置java_

#JAVA HOME

JAVA_HOME=/opt/modules/jdk1.7.0_67

PATH=$PATH:$JAVA_HOME/bin

hadoop用户下执行 $ source /etc/profile

用root用户删除之前本身自带的java 包

# rpm -e --nodeps java-1.6.0-openjdk-1.6.0.0-1.50.1.11.5.el6_3.x86_64 tzdata-java-2012j- 1.el6.noarch java-1.7.0-openjdk-1.7.0.9-2.3.4.1.el6_3.x86_64

用hadoop用户安装hadoop

$ tar zxvf hadoop-2.5.0.tar.gz -C /opt/modules/

使用notepad++工具修改配置

配置HDFS 相关:

/opt/modules/hadoop-2.5.0/etc/hadoop

hadoop-env.sh :

-- export JAVA_HOME=/opt/modules/jdk1.7.0_67

yarn-env.sh:

--export JAVA_HOME=/opt/modules/jdk1.7.0_67

mapred-env.sh:

--export JAVA_HOME=/opt/modules/jdk1.7.0_67

core-site.xml:

fs.defaultFS

hdfs://hadoop-senior.summer.com:8020

hdfs-site.xml:

dfs.replication

启动hdfs --->>(第一次启动hdfs服务要格式化)format ---->start

bin/hdfs namenode -format

先启动namenode

$ sbin/hadoop-daemon.sh start namenode

在启动datanode

$ sbin/hadoop-daemon.sh start datanode

查看 jps (查看java进程命令 )

3379 Jps

3306 DataNode

3231 NameNode

测试上传文件

$ bin/hdfs -help (查看帮助)

步骤:

----bin/hdfs dfs -mkdir /input 在集群下创建input目录

bin/hdfs dfs -put /etc/yum.conf /input 上传/etc/yum.conf 到input目录下

bin/hdfs dfs -ls /input 列出input目录

bin/hdfs dfs -cat /input/yum.conf 查看input目录下的yun.conf

tips :可以通过浏览器查看

http://192.168.153.128:50070

配置Yarn相关:

配置

yarn-site.xml

yarn.nodemanager.aux-services

mapreduce_shuffle

mapred-site.xml

mapreduce.framework.name

yarn

$ sbin/yarn-daemon.sh start resourcemanager

$ sbin/yarn-daemon.sh start nodemanager

[hadoop@hadoop-senior hadoop-2.5.0]$ jps

3855 NodeManager

3912 Jps

3788 ResourceManager

3306 DataNode

3231 NameNode

通过浏览器浏览 192.168.153.128:8088

简单的mapreduce 测试

创建一个文件 vi sort.txt

上传到hdfs目录input下bin/hdfs dfs -put sort.txt /input

执行jar包中的命令bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar wordcount /input/sort.txt /output

总结

配置的所有文件:

hadoop-env.sh core-site.xml hdfs-site.xml

yarn-env.sh mapred-env.sh

yarn-site.xml mapred-site.xml

日志:

.log:通过log4j,记录大部分应用程序的日志信息

.out:记录标准输出和标准错误日志

Hadoop 常用shell命令:

$ bin/hdfs dfs

-put /ect/passwd / 上传文件passwd 到 /根目录

-ls

-cat -text 查看文件内容

-mkdir [-p] 创建目录

-mv 移动文件

-cp 复制

-du 统计

-chmod 修改权限

Hadoop 比较重要的配置选项:

namenode:元数据?

datanode: 数据存储目录?

系统默认:

文件名:core-default.xml /hdfs-default.xml /yarn-default.xml

位置存在/hadoop-2.5/share/hadoop/对应的模块的jar包中

自定义的:

位置:$HADOOP_HOME/etc/hadoop

文件名:core-site.xml /hdfs-site.xml/yarn-site.xml/

自定义namenode 节点 datanode 节点

hdfs-sitem.xml --声明namenode 节点所在的服务器

dfs.namenode.http-address

hdfs://hadoop-senior.summer.com:50070

core-sitem.xml-- 定义datanode 数据存放的目录

hadoop.temp.dir

/opt/modules/hadoop-2.5.0/data

yarn-sitem.xml -- 声明哪台服务器存resoucemanager

yarn.resourcemanager.hostname

hadoop-senior.summer.com

修改配置文件后停止服务,重新格式化namenode,,在重启

283 sbin/hadoop-daemon.sh stop namenode

284 sbin/hadoop-daemon.sh stop datanode

285 sbin/yarn-daemon.sh stop resourcemanager

286 sbin/yarn-daemon.sh stop nodemanager

287 jps

288 bin/hdfs dfs namenode -format

291 sbin/hadoop-daemon.sh start namenode

292 sbin/hadoop-daemon.sh start datanode

293 sbin/yarn-daemon.sh start resourcemanager

294 sbin/yarn-daemon.sh start nodemanager

日志聚合

--- 日志上传到HDFS

yarn-site.xml

yarn.log-aggregation-enable

true

yarn.log-aggregation.retain-seconds

8640

mapred-site.xml

mapreduce.jobhistory.webapp.address

hadoop-senior.summer.com:19888

启动服务 (查看job history服务)

$ sbin/mr-jobhistory-daemon.sh start historyserver

最后一共启动的服务

[hadoop@hadoop-senior hadoop-2.5.0]$ jps

5032 DataNode

6656 Jps

5571 ResourceManager

4949 NameNode

5820 NodeManager

5957 JobHistoryServer

最后编辑于：2017.12.06 00:47:36

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 205,565评论 6赞 479
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,021评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,003评论 0赞 341
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,015评论 1赞 278
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,020评论 5赞 370
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,856评论 1赞 283
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,178评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,824评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,264评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,788评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,913评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,535评论 4赞 322
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,130评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,102评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,334评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,298评论 2赞 352
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,622评论 2赞 343

虚拟机克隆及大数据之hadoop学习笔记

推荐阅读更多精彩内容