240 发简信
IP属地:内蒙古
  • Faw-Volkswagen

    一、中文面试 1.遇到的最大的挫折2.大学中最成功的事3.大学中最失败的事,如果再给你一次机会,你会怎么改进4.优缺点5.对自己的评价6.别人对自己的评价7.为什么选择汽车行...

  • 120
    走进大数据之Hive入门2

    一、Hive数据类型 1.基本数据类型 整数类型:tinyint/smallint/int/bigint 浮点数类型: float/double 布尔类型: boolean ...

  • 120
    走进大数据之Hive入门

    学习目标 Hive是构建在Hadoop之上的数据仓库,它的本质是就是一个数据库 ① Hive和一般意义上的数据库有什么区别② 如何搭建数据库③ 创建的过程是什么④ 如何把数据...

  • 阿里数据分析师面试

    阿里数据分析师面试 一面 帮助了解简历,基本是自己在说,学校,专业,实习经历,收获及感悟。最后可以问两个问题:1.阿里数据分析师的主要职责及所需的工作技能?2.入职后有没有相...

  • 统计建模与R软件

    1.which.min(x) 返回x中最小值的下标 which.max(x)2.sort(x, na.last=TRUE, decreasing=FALSE)3.seq(f...

  • 120
    服饰品类数据挖掘

    逻辑是服饰内衣首单购买在2015年1月1日到2015年6月30日的用户,首单后至今无类目复购,且全京东订单大于5单,最后购买的时间在2016年1月1日到2016年4月30日。...

  • 数据分析笔试题

    ARCH模型(Autoregressive conditional heteroskedasticity model) 按照英文直译是 自回归条件异方差模型。粗略地说,该模型...

  • 用户画像

    基本概念 用户画像 人口属性: 性别,年龄,婚否,教育程度, 行为属性: 浏览行为,购物行为,购物车行为 静态数据动态数据 用户画像的用途 统计分析精准营销数据挖掘,关联...

  • 120
    Hadoop大数据平台架构与实践-基础篇

    一、Hadoop两大核心组成 1.HDFS 分布式文件系统:存储2.MapReduce: 并行计算 二、HDFS基本概念 block 块:固定大小为64M的逻辑单元,HDFS...

  • Kmeans算法的Python实现

    Kmeans聚类 K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的...

  • 阿里达摩盘

    一. 首页 1.认知用户:近90天有店铺访问,收藏,加入购物车,并近180天没有购买的用户群体2.现有用户:近90天有购买行为的用户3.沉默用户:近180天有购买行为,但近9...

  • 120
    Scrapy抓取Ajax动态页面

    一般来说爬虫类框架抓取Ajax动态页面都是通过一些第三方的webkit库去手动执行html页面中的js代码, 最后将生产的html代码交给spider分析。本篇文章则是通过浏...

  • R基本统计分析

    一、描述性统计分析 基本描述性统计 summary( ) 比fivenum 多一个均值 fivenum( ) 最大最小值外加三个分位数 Hmisc::describe( ...

  • 120
    献给写作者的 Markdown 新手指南

    「简书」作为一款「写作软件」在诞生之初就支持了 Markdown,Markdown 是一种「电子邮件」风格的「标记语言」,我们强烈推荐所有写作者学习和掌握该语言。为什么?可以...

个人介绍
Life is short, I use python.