虚拟机克隆及大数据之hadoop学习笔记

快照  ---还原点

克隆注意点

1.修改主机名    vi  /etc/sysconfig/network

2.修改mac地址    vi /etc/sysconfig/network-scripts/ifcfg-eth0

HWADDR=00:0C:29:CD:79:8C  ---删掉

UUID=57d4....                            --删掉

vi /etc/udev/rules.d/70-persistent-net.rules

--  删除错误的mac地址所在的行

3.重启网络服务

# service network restart

Hadoop  -----大数据基础平台

Lucene  开源的高性能全文检索工具包

Nutch    开源的Web搜索引擎

--Doug Couting

谷歌公司(三大论文):

MapReduce  -- 计算框架模型(分而治之)            ----->MapReduce

GFS                --存储数据    -->HDFS(hadoop distributed file system)

BigTable       --存储数据

---->MapReduce,HDFS加入apache 基金会  ,合并后也就是今天的Hadoop

大数据定义:海量数据里面挖掘/发现/采集/分析有价值的信息.

Hadoop  四个重要组成部分

common  ---基础模块

HDFS        --存储数据 (读-写)  一次写入,多次读取

--namenode  存储元数据(数据存储的位置)

--datanode    数据

Yarn          -- 资源管理(CPU/内存/虚拟代码)(2.x版本新增)

--ResourceManager

--NodeManger

MapReduce  --计算模型(分而治之)    key/value

-- 分  map

--合    reduce

Hadoop 生态系统

单机模式

伪分布式模式  --用于开发测试

分布式模式

伪分布式模式搭建:

环境准备-----

1.系统的主机名(root用户)

#vi  /etc/sysconfig/network

hadoop-senior.summer.com(不要用下划线)

2.创建普通用hadoop(后期都使用这个用户)

修改密码# echo 123456 | passwd --stdin hadoop

3.把ip地址设置成静态ip

#setup  --console(虚拟机图形化界面)

或者

vi /etc/sysconfig/network-scripts/ifcfg-eth0

BOOTPROTO=none

IPADDR=192.168.153.128

NETMASK=255.255.255.0

GATEWAY=192.168.153.2

DNS1=202.96.209.5

DNS2=8.8.8.8

4.关闭防火墙和selinux

service iptables stop

chkconfig iptables off

vi /etc/sysconfig/selinux

SELINUX=disabled (进去默认是enforing)

5 修改host

vi /etc/sysconfig/selinux

[root@localhost ~]# vi /etc/hosts

6.重启服务器

目录准备

[root@hadoop-senior ~]# mkdir /opt/modules(root用户才能执行)

[root@hadoop-senior ~]# mkdir /opt/softwares(root用户才能执行)

更改权限

[root@hadoop-senior ~]# chown -R hadoop:hadoop /opt/(hadoop用户能执行)

软件包准备

上传 到softwares

安装jdk 到modules

用root用户修改vi /etc/profile 配置java_

#JAVA HOME

JAVA_HOME=/opt/modules/jdk1.7.0_67

PATH=$PATH:$JAVA_HOME/bin

hadoop用户下 执行  $ source /etc/profile

用root用户删除之前本身自带的java 包

# rpm -e --nodeps java-1.6.0-openjdk-1.6.0.0-1.50.1.11.5.el6_3.x86_64 tzdata-java-2012j-       1.el6.noarch java-1.7.0-openjdk-1.7.0.9-2.3.4.1.el6_3.x86_64

用hadoop用户安装hadoop

$ tar zxvf hadoop-2.5.0.tar.gz  -C /opt/modules/

使用notepad++工具修改配置

配置HDFS 相关:

/opt/modules/hadoop-2.5.0/etc/hadoop

hadoop-env.sh :

-- export JAVA_HOME=/opt/modules/jdk1.7.0_67

yarn-env.sh:

--export JAVA_HOME=/opt/modules/jdk1.7.0_67

mapred-env.sh:

--export JAVA_HOME=/opt/modules/jdk1.7.0_67

core-site.xml:

fs.defaultFS

hdfs://hadoop-senior.summer.com:8020

hdfs-site.xml:

dfs.replication

1

启动hdfs --->>(第一次启动hdfs服务要格式化)format  ---->start

bin/hdfs namenode -format

先启动namenode

$ sbin/hadoop-daemon.sh start namenode

在启动datanode

$ sbin/hadoop-daemon.sh start datanode

查看 jps (查看java进程命令 )

3379 Jps

3306 DataNode

3231 NameNode

测试上传文件

$ bin/hdfs -help (查看帮助)

步骤:

----bin/hdfs dfs -mkdir /input  在集群下创建input目录

bin/hdfs dfs -put /etc/yum.conf  /input  上传/etc/yum.conf 到input目录下

bin/hdfs dfs -ls /input  列出input目录

bin/hdfs dfs -cat /input/yum.conf  查看input目录下的yun.conf

tips :可以通过浏览器查看

http://192.168.153.128:50070

配置Yarn相关:

配置

yarn-site.xml

yarn.nodemanager.aux-services

mapreduce_shuffle

mapred-site.xml

mapreduce.framework.name

yarn

$ sbin/yarn-daemon.sh  start resourcemanager

$ sbin/yarn-daemon.sh  start nodemanager

[hadoop@hadoop-senior hadoop-2.5.0]$ jps

3855 NodeManager

3912 Jps

3788 ResourceManager

3306 DataNode

3231 NameNode

通过浏览器浏览  192.168.153.128:8088

简单的mapreduce 测试

创建一个 文件 vi sort.txt

上传到hdfs目录input下bin/hdfs dfs -put sort.txt  /input

执行jar包中的命令bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar  wordcount /input/sort.txt /output

总结

配置的所有文件:

hadoop-env.sh    core-site.xml  hdfs-site.xml

yarn-env.sh    mapred-env.sh

yarn-site.xml  mapred-site.xml

日志:

.log:通过log4j,记录大部分应用程序的日志信息

.out:记录标准输出和标准错误日志

Hadoop 常用shell命令:

$ bin/hdfs dfs

-put  /ect/passwd      /  上传文件passwd 到 /根目录

-ls

-cat    -text 查看文件内容

-mkdir [-p]  创建目录

-mv  移动文件

-cp  复制

-du  统计

-chmod 修改权限

Hadoop 比较重要的配置选项:

namenode:元数据?

datanode: 数据存储目录?

系统默认:

文件名:core-default.xml /hdfs-default.xml /yarn-default.xml

位置存在/hadoop-2.5/share/hadoop/对应的模块的jar包中

自定义的:

位置:$HADOOP_HOME/etc/hadoop

文件名:core-site.xml /hdfs-site.xml/yarn-site.xml/

自定义namenode 节点  datanode 节点

hdfs-sitem.xml  --声明namenode 节点所在的服务器

dfs.namenode.http-address

hdfs://hadoop-senior.summer.com:50070

core-sitem.xml-- 定义datanode 数据存放的目录

hadoop.temp.dir

/opt/modules/hadoop-2.5.0/data

yarn-sitem.xml    -- 声明哪台服务器存resoucemanager

yarn.resourcemanager.hostname

hadoop-senior.summer.com

修改配置文件后停止服务,重新格式化namenode,,在重启

283  sbin/hadoop-daemon.sh stop namenode

284  sbin/hadoop-daemon.sh stop datanode

285  sbin/yarn-daemon.sh stop resourcemanager

286  sbin/yarn-daemon.sh stop nodemanager

287  jps

288  bin/hdfs dfs namenode -format

291  sbin/hadoop-daemon.sh  start namenode

292  sbin/hadoop-daemon.sh  start datanode

293  sbin/yarn-daemon.sh start resourcemanager

294  sbin/yarn-daemon.sh start nodemanager

日志聚合

---  日志上传到HDFS

yarn-site.xml

yarn.log-aggregation-enable

true

yarn.log-aggregation.retain-seconds

8640

mapred-site.xml

mapreduce.jobhistory.webapp.address

hadoop-senior.summer.com:19888

启动服务 (查看job history服务)

$ sbin/mr-jobhistory-daemon.sh  start historyserver

最后一共启动的服务

[hadoop@hadoop-senior hadoop-2.5.0]$ jps

5032 DataNode

6656 Jps

5571 ResourceManager

4949 NameNode

5820 NodeManager

5957 JobHistoryServer

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,565评论 6 479
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,021评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,003评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,015评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,020评论 5 370
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,856评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,178评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,824评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,264评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,788评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,913评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,535评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,130评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,102评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,334评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,298评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,622评论 2 343

推荐阅读更多精彩内容