Avatar notebook default
43篇文章 · 22528字 · 2人关注
  • Python 基于pyhive库操作hive

    背景 在大数据处理时,基本都是基于Hadoop集群进行操作,数据相关人员在开发数仓或做临时业务需求时,基本都是利用 hive,写 sql 进行数...

  • Resize,w 360,h 240
    Python pandas中重排列与列重名

    背景 把数据导出到Excel中时,有时需要对列的顺序进行调整,按业务需求进行排列,并且字段名字不能是英文,这样方便业务人员查看与理解数据,在 p...

  • Python 利用矢量化,计算2个经纬度之间的距离

    背景 假如全国所有的酒店/民宿经纬度信息已知的情况下,基于当前位置,怎么快速计算附近5KM内的酒店/民宿呢?现实中有大量的这种业务场景,需要快速...

  • Python中的Lambda匿名函数

    背景 Lambda匿名函数在Python中经常出现,小巧切灵活,使用起来特别方便,但是小编建议大家少使用,最好多写几行代码,自定义个函数。 既然...

  • Python pandas遍历行数据的2种方法

    背景 pandas在数据处理过程中,除了对整列字段进行处理之外,有时还需求对每一行进行遍历,来处理每行的数据。本篇文章介绍 2 种方法,来遍历p...

  • Python 常用的加解密算法实例应用

    背景 经过移动互联网的蓬勃发展后,促使数字化也进入大众视野,现阶段各个行业能数字化的基本都数字化,至于数字化后好用不好用是另一回事了 数字化就会...

  • Python 利用pandas对数据进行特定排序

    背景 小编最近在处理hive表存储大小时,需要对每个表的大小进行排序,因通过 hadoop fs -du -s -h /path/table 命...

  • Resize,w 360,h 240
    Python 利用aiohttp异步流式下载文件

    背景 本篇文章为小编翻译文章,小编在查找资料时看到的一篇文章,看了后感觉不错,就翻译过来,供大家参考学习 文章原文地址:https://www....

  • Resize,w 360,h 240
    Python 小知识系列(一)

    问题 请认真思考下这个问题,应该会输出什么呢? 答案 b. [1, 2, 3, 4] 解释 第1行:创建一个列表,变量 x 指向这个列表x = ...

文集作者