IP属地:广东
TodoList: Be busy living Pamper's Blog
安装完Ubuntu系统后 配置一个国内镜像: 安装搜狗输入法:先下载搜狗输入发for linux的deb包 打开系统设置,点击语言支持,键盘输入...
离线计算批量获取数据、批量传输数据、周期性批量计算数据、数据展示(报表)代表技术:sqoop批量导入数据、hdfs批量存储数据、mapreduc...
大数据及分析环境 bigdata主要体现在:量,速度,多样性数据量,数据流速度(实时,批量,串流),数据多样性(结构化,半结构化(弹性内容),非...
下载ubuntu系统,下载Ultraiso制作u盘为启动盘 进入bios,设置u盘优先启动。重启安装,按照提示操作。 安装完成后我们再次进入wi...
hbase的数据模型 行键,时间戳,列簇。列簇是表schema的一部分,而列不是,所以动态加列可以不用改变表结构。每一个列簇生成一个文件,就相当...
列式数据库与行式数据库 从上面可以看出,列式数据库和行式数据库各自有着自己的优点。传统数据库如:oracle、mysql都是行式。它们适合用于实...
wordcount 关于切片划分maptask任务,由客户端(提交job)完成,写入文件交给mr appmaster。这里的任务切片是一个逻辑片...
mapreduce是hadoop的核心部分之一。是分布式运算程序的编程框架。相对于hdfs,mapreduce就是一个客户端。hdfs:name...