之前看《数据化营销》的时候,只是粗略的把内容过了一遍。今天把书的车品觉写的序言看了一遍,看完之后觉得深有感触,业务分析永远都是在问题中产生的,是有问题才有分析。我打算摘录一些...
IP属地:浙江
之前看《数据化营销》的时候,只是粗略的把内容过了一遍。今天把书的车品觉写的序言看了一遍,看完之后觉得深有感触,业务分析永远都是在问题中产生的,是有问题才有分析。我打算摘录一些...
简述 最近和第三方数据接触较多,数据量也开始陡增,从一开始的1KW行,最大到了1亿行,这让我这个常年处理‘小数据’的人有点捉襟见肘。本来数据放在hive中也是可以操作的,但是...
一、市场定义流失率的几种方式? 1、资讯行业,一段时间内(30天内)未访问或登录过网站的用户 2、电商行业,一段时间内(90-180天内)没有任何交易行为的用户 备注:时间周...
写过Python程序的人大都知道,Python日期和时间的处理非常繁琐和麻烦,主要有以下几个问题: 有众多的package,类和方法,包括time,datetime,pytz...
隐藏代码code 修改安装路径 cmd中输入jupyter notebook --generate-config,->输入"N" 打开jupyter_notebook_con...
参考资料:Git教程 创建一个空目录 通过git init命令把这个目录变成Git可以管理的仓库 把文件添加到仓库 修改文件内容并提交: 查看修改的历史记录 退回到上一个版本...
1、软件准备 jdk spark hadoop winutils 2、软件安装、解压,其中hadoop包的解压需要管理员权限 3、系统环境变量配置 需要新建的变量 需要在变量...
导入库 创建RDD .collect()函数:执行把全部数据集送回驱动的操作 索引其中某一个数值 读入压缩包文件 .take():读取指定行数 示例函数 map()转换:对每...