Hadoop(一)初识大数据和Hadoop


原文地址:http://www.cnblogs.com/zhangyinhua/p/7647334.html
注:本系列为Hadoop学习笔记,非原创

大数据基础

一、什么是大数据?

(1) 一种规模大到在获取、存储、管理、分析方面都大大超 过传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低的四大特征。
(2)大数据技术的战略不在于掌握庞大的数据信息,而在于对含有意义的数据进行专业化处理。

二、大数据的基本特征?

容量(Volume)、种类(Variety)、价值(Value)、速度(Velocity)

三、大数据的架构

大数据系统架构.png

四、大数据处理平台

大数据平台.png

五、大数据的几个概念

集群(Cluster)数据密集型(DIC)计算密集型(CIC)
向上扩展(Scale-up):对硬件的扩展。主要是对cpu、内存、磁盘的扩展。
向外扩展(Scale-out):通过计算机群的方式来提高计算能力。主要是对服务器个数的扩展。
机器学习(Machine Learning)
云计算(Cloud Coumputing):通过互联网来提供动态易扩展且虚拟化的资源


Hadoop概述

一、什么是hadoop?

(1)一种分布式系统基础框架;
(2)核心设计:分布式文件系统HDFS和分布式处理框架MapReduce。HDFS为海量数据提供分布式存储,MapReduce为海量数据提供分布式计算;

二、Hadoop发展历程

hadoop发展历程.png

三、Hadoop生态圈

(1)核心项目
Hadoop common(如系统配置工具Configuration、远程过程调用RPC序列化机制、抽象文件系统FileSytem等)
MapReduce、HDFS
(2)其他项目
面向具体领域或应用:mahout、X-Rime、Crissbow、lvory等
数据交换、工作流等外围支持系统:Chukwa、Flume、Sqoop、Ooize等
Hbase:
1、一个分布式的面向列的数据库;
2、构建在HDFS之上;
3、适用于Hadoop应用需要实时读写随机访问非常大型数据集。
Zookeeper:
1、一个分布式服务框架,解决分布式计算的一致性问题(如统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等);
2、其他Hadoop相关项目的主要组件。
Apache Pig:
1、一种数据流语言和运行环境,用于检索非常大量的数据;
2、运行于HDFS和MapReduce集群上。
Apache Hive:
1、最早Facebook设计,建立在Hadoop基础上的数据仓库框架;
2、管理HDFS中存储的数据,并提供SQL语言查询数据。
Apache Flume:
1、一个高可用、高可靠、分布式的海量数据采集、聚合和传输的系统,经常用于日志采集器。
Apache Sqoop:
1、SQL-to-Hadoop的缩写,主要用于结构化数据存储和Hadoop间的数据转换;
2、一种在数据库和HDFS间高效传输数据的工具。
mahout:
1、一个机器学习和数据挖掘的库,用于聚类、回归测试和统计建模等常见算法的MapReduce的实现。
Ambari:
1、Hadoop管理工具,用于监控、部署、管理集群。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 210,914评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 89,935评论 2 383
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,531评论 0 345
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,309评论 1 282
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,381评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,730评论 1 289
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,882评论 3 404
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,643评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,095评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,448评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,566评论 1 339
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,253评论 4 328
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,829评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,715评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,945评论 1 264
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,248评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,440评论 2 348