240 发简信
IP属地:江苏
  • 货拉拉面试题

    题目: AB两个数组,正int,不重复,且A是B的子集,求A的每个元素在B中的下一个比它大的值,如果没有则结果为-1eg:A:(4, 2, 5,...

  • Resize,w 360,h 240
    Spark笔记(5):scala两种配置参数的方法

    spark 很多时候我们需要把一些参数保存在文件里,等程序运行时动态加载,分享两种scala调用的方式:1.Typesafe的Config库 2...

  • Resize,w 360,h 240
    IDEA配置Git进行代码管理

    随笔 Git介绍 Git是一个开源的分布式版本控制系统,可以有效、高速地处理从很小到非常大的项目版本管理。Git组成部分: SVN是集中式的,G...

  • Spark笔记(4):计算dataframe中两列的相关系数

    spark 皮尔森、斯皮尔曼(pearson spearman)计算相关系数

  • Spark笔记(3):一行代码处理key相同时value相加

    spark 问题描述 在商品推荐的业务逻辑计算时,遇到一个计算商品偏好权重的问题:实时权重要和离线权重结合,其中key相同的商品权重求和,不相同...

  • hive笔记

    hive hive相关笔记记录 注释部分: 描述任务和表; 结果表定义字段类型和字段含义; 任务上游依赖事件或者应用了某些源表; 开发人,工号,...

  • Resize,w 360,h 240
    Spark笔记(2):基于模型的协同过滤算法ALS简单实现

    spark 算法原理 协同过滤是用来对用户的兴趣偏好做预测的一种方法。在Spark中实现的是基于潜在因子模型的协同过滤。用户对特定物品的偏好往往...

  • Spark笔记(1) :余弦相似度计算

    spark 余弦相似度 在推荐系统中,基于物品的协同过滤算法是业界应用最多的算法,它的思想是给用户推荐那些和他们喜欢的物品相似的物品,主要分为两...

  • Resize,w 360,h 240
    LSTM预测访问流量

    python tensorflow 数据 Python代码 预测结果

个人介绍
犹豫就会败北,果断就会白给