240 发简信
IP属地:北京
  • 卷积神经网络手写字体识别-高级API

    使用Estimators、Experiment高级API 原生版Tensorflow训练模型

  • 基于Mysql表结构生成Hive表结构

    背景 业务系统库数据迁移到Hadoop平台做分析要涉及到所有迁入的表结构要类型和表结构语句的更改,部分表字段可能两三百个字段,对程序员来说捉行手...

  • Resize,w 360,h 240
    Spark整合ElasticSearch

    spark整合elasticsearch两种方式 1.自己生成_id等元数据2.使用ES默认生成 引入对应依赖 生成元数据方式 ES-UI界面 ...

  • Resize,w 360,h 240
    开源调度工具Zeus环境搭建

    下载源码 从github上poll代码到本地 打包 项目部署 上传大好的zeus-web.war 到 tomcat主目录下webapps子目录,...

  • sqoop增量数据迁移

    背景 业务系统库数据包含了大量历史数据,核心的表超过千万级甚至亿级后,传统在业务库上做数据分析已不合时宜,需要迁移至大数据平台(hive/spa...

  • SparkSQL操作RDD两种方式对比案例

    前言 GitHub地址:https://github.com/guofei1219 背景 统计新渠道进件数量 SparkSQL操作RDD两种方式...

  • Resize,w 360,h 240
    Spark实时统计订单量

    前言 本人GitHub地址:https://github.com/guofei1219QQ : 86608625咨询项目相关问题的请直接说明问题...

    0.1 4836 1 14
  • Resize,w 360,h 240
    离线技术处理总结

    前言 大数据处理技术应用: [x] 电信运营商 数据营销:房地产营销、运营商时代(汇聚用户行为) [x] 互联网用户行为分析 数据驱动运营:漏斗...

    0.1 4369 0 16
  • Resize,w 360,h 240
    Spark-Streaming Windows开发环境案例搭建运行(图文)

    前言 最近在专注Spark开发,记录下自己的工作和学习路程,希望能跟大家互相交流成长具体代码可参考本人GitHub地址:https://gith...