2020-04-13

大数据之Hive

一.Hive基本概念

1.什么是Hive
  • Hive是Facebook开源用于处理 海量 结构化 日志的数据统计
  • Hive是基于Hadoop的一个数据仓库工具,将结构化数据文件映射成一张表,并提供类SQL语句
  • 本质是HQL转换为MapReduce程序
    • 【1】数据存储在HDFS
    • 【2】分析数据底层的默认实现是MapReduce
    • 【3】执行程序在Yarn上
  • Hive区别于大数据中其他计算框架最大的不同是,它是单机的,其他的是分布式的,因为它的存储,运算都是基于Hadoop,相当于一个客户端
2.Hive优缺点
  • 优点
    • 【1】实现采用类SQL语句,开发速度快,学习成本低
    • 【2】Hive用于 大数据量 离线 分析,适合实时性要求不高的场合
    • 【3】支持用户自定义函数
  • 缺点
    • 【1】HQL表达能力有限(迭代运算无法表达;数据挖掘方面不擅长)
    • 【2】执行效率低(基于MapReduce,执行延迟高;调优粒度粗)
3.Hive架构原理
Hive架构原理.jpg
  • 用户接口:Client CLI(hive shell)、JDBC/ODBC(java 访问 hive)、WEBUI(浏览器访问 hive)
  • 元数据(Meta store):数据表信息及数据实际存储信息(默认存储在自带的 derby 数据库中,推荐使用 MySQL 存储 Metastore )
  • 驱动器:Driver
    • 【1】SQL解析器:将 SQL 字符串转换成抽象语法树 AST,这一步一般都用第三方工具库完成,比如 antlr;对 AST 进行语法分析,比如表是否存在、字段是否存在、SQL 语义是否有误
    • 【2】编译器:将 AST 编译生成逻辑执行计划
    • 【3】优化器:对逻辑执行计划进行优化
    • 【4】执行器:把逻辑执行计划转换成可以运行的物理计划(如 MR/Spark)
4.Hive与数据库比较
  • 查询语言(HQL SQL)
  • 数据存储位置(Hive存储在HDFS上 ,数据库一般在块设备或本地系统)
  • 数据更新(Hive不适合数据修改,数据库更注重与用户的交互)
  • 可扩展性(Hive可扩展性是和 Hadoop 的可扩展性是一致的 ,数据库扩展能力有限)
  • 执行延迟(Hive适合大数据量的分析,执行延迟高,对于数据量较少的场景,数据库的优势更高)

二.Hive的安装和环境准备

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 210,914评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 89,935评论 2 383
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,531评论 0 345
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,309评论 1 282
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,381评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,730评论 1 289
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,882评论 3 404
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,643评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,095评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,448评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,566评论 1 339
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,253评论 4 328
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,829评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,715评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,945评论 1 264
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,248评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,440评论 2 348

推荐阅读更多精彩内容