IP属地:江苏
题目: AB两个数组,正int,不重复,且A是B的子集,求A的每个元素在B中的下一个比它大的值,如果没有则结果为-1eg:A:(4, 2, 5,...
spark 很多时候我们需要把一些参数保存在文件里,等程序运行时动态加载,分享两种scala调用的方式:1.Typesafe的Config库 2...
随笔 Git介绍 Git是一个开源的分布式版本控制系统,可以有效、高速地处理从很小到非常大的项目版本管理。Git组成部分: SVN是集中式的,G...
spark 皮尔森、斯皮尔曼(pearson spearman)计算相关系数
spark 问题描述 在商品推荐的业务逻辑计算时,遇到一个计算商品偏好权重的问题:实时权重要和离线权重结合,其中key相同的商品权重求和,不相同...
hive hive相关笔记记录 注释部分: 描述任务和表; 结果表定义字段类型和字段含义; 任务上游依赖事件或者应用了某些源表; 开发人,工号,...
spark 算法原理 协同过滤是用来对用户的兴趣偏好做预测的一种方法。在Spark中实现的是基于潜在因子模型的协同过滤。用户对特定物品的偏好往往...
spark 余弦相似度 在推荐系统中,基于物品的协同过滤算法是业界应用最多的算法,它的思想是给用户推荐那些和他们喜欢的物品相似的物品,主要分为两...
python tensorflow 数据 Python代码 预测结果