240 发简信
IP属地:新疆
  • SparkSQL 中group by、grouping sets、rollup和cube方法详解

    在平时的工作中,经常有按照不同维度筛选和统计数据的需求。拿视频会员订单数据来说吧,运营人员要查看深圳市的成功下单数或则深圳市某一种产品的成功下单...

  • SparkSQL DataFrame与MySQL增删改查那些事儿

    在使用Spark中通过各种算子计算完后各种指标后,一般都需要将计算好的结果数据存放到关系型数据库,比如MySQL和PostgreSQL等,随后配...

  • Spark ML 特征工程之 One-Hot Encoding

    1.什么是One-Hot Encoding One-Hot Encoding 也就是独热码,直观来说就是有多少个状态就有多少比特,而且只有一个比...

    0.3 4776 3 8 2