240 发简信
IP属地:黑龙江
  • 零碎的笔记

    1.oracle数据库中查字段名称、类型及comment 2.查询owner 3.数据导出将txt转成csv 4.数仓建设的一些资料

  • hive not in 子查询踩坑

    在hive中使用not in 子查询时,一定要去掉null值;否则满足条件的数据会返回null值,而不是true,如下图所示是个例子

  • python数据分析系列1.5——map()&apply()&applymap()/sort()&sorted()&argsort()

    第二周的作业是熟悉Python基础,了解pandas数据结构,这些资料网上很全,所以本文打算总结一些"长得很像"的函数,关于概率分布将继续在下一...

  • python数据分析系列一——描述性统计

    这是python数据分析系列文章,从统计学基础知识到机器学习,将跟随居士的学习教程持续更新。这一篇主要描述数据集中趋势,离散程度以及分布形态等知...

  • hive进阶宝典二——hive 常用小技巧

    1.日期格式转换(将yyyymmdd转换为yyyy-mm-dd) 2.hive修改库名、表名注释、表属性 3..hive去掉字段中除字母和数字外...

  • hive进阶宝典一——hive常用参数设置

    1.hive并行执行 **2.增大hive memory--java heep space ** 3.mr读取递归目录设置hive执行引擎为mr...

  • hive lateral view explode (array()) array为null

    谈一下使用hive udtf 函数lateral view explode(array()) array为空时遇到的坑,这个UDTF转换的Ar...

  • Resize,w 360,h 240
    一次批量下载上交所公告pdf的尝试

    大家平时可能有需要批量下载pdf的场景,小编会分享一下第一次尝试批量下载上交所公告的尝试历程。 1.导入爬虫必备的常用包 2.构建list分别存...