240 发简信
IP属地:辽宁
  • Python碎碎念(6):点符号

    问:如何理解python中的点符号(即".")?例如:sys.stderr.write("Error") 答:一旦导入一个模块比如sys,点符号就可以引用它包含的任何东西,也...

  • 120
    Python碎碎念(5):日期和时间

    转载请在文章起始处注明出处,谢谢。 本文转自日期和时间[https://github.com/iamseancheney/python_for_data_analysis_2...

  • conda channel的配置

    转载请在文章起始处注明出处,谢谢。 文章转自知乎[https://zhuanlan.zhihu.com/p/349081344],仅供方便自学查看。 默认的conda cha...

  • ok,能用就行了

    怎样方便的查看Markdown.md文件

    转载请在文章起始处注明出处,谢谢。 原文链接(推荐轻量级阅读时使用,一定要用3.3版本的,中文不会乱码) MarkdownPad下载链接(可以下载免费版,功能强大) 好用的 ...

  • lateral view explode的用法

    lateral view为侧视图,意义是为了配合UDTF来使用,把某一行数据拆分成多行数据。不加lateral view的UDTF只能提取单个字段拆分,并不能塞会原来数据表中...

  • 害,都是自己实操过的,希望多多交流哈

    jupyter notebook使用技巧(2):自动补全代码

    转载请在文章起始处注明出处,谢谢。 在jupyter notebook中补全要按tab键,不太方便。jupyter notebook有扩展插件jupyter_contrib_...

  • Hive碎碎念(10):任务常见问题与处理方法

    问题1、map/reduce过程中报错: 第一种报错:“java.lang.OutOfMemoryError: GC overhead limit exceeded“第二种报...

  • Hive小技巧

    转载请在文章起始处注明出处,谢谢。 1、取字符串某个位置的值 比如,我要取‘abcd’的b,有两种取法: 2、我要取a表的用户,b表的用户,还有a、b重复的用户 这里可以用s...

  • Hive碎碎念(9):HIVE前缀

    --1、配置MR任务结束后进行文件合并(合并小文件) 常用的set头如下:

  • Hive碎碎念(8):正则

    转载请在文章起始处注明出处,谢谢。 一、Hive常用的正则函数: 1、LIKE比较: LIKE 语法: A LIKE B操作类型: strings描述: 如果字符串A或者字符...

  • 120
    Hive碎碎念(7):高端函数

    转载请在文章起始处注明出处,谢谢。 1、 left semi joinLEFT SEMI JOIN (左半连接)是 IN/EXISTS 子查询的一种更高效的实现。 Hive ...

  • 不好意思,之前没上简书,回复不及时。我理解你的问题是取weight的value值吧,那就需要对数据做行转列处理,把fruit的值(也就是array数组),行转列。下面举例说明:

    create table dev.dev_xxlee_test_002 as select array('{"weight":8,"type":"apple"}', '{"weight":9,"type":"pear"}') as t

    select value from dev.dev_xxlee_test_002 lateral view explode(t) newb as value

    输出结果:
    value
    {"weight":8,"type":"apple"}
    {"weight":9,"type":"pear"}

    这样就变成了一个json数组,用get_json_object就可以取出。

    Hive碎碎念(5):解析json(get_json_object)

    转载请在文章起始处注明出处,谢谢。 原文转自CSDN get_json_object(string json_string, string path) 说明:第一个参数填写j...

  • 120
    彻底停用ffnews(FF新鲜事)

    Flash被捆绑了推送软件,很烦很流氓。。。 使用快捷键 WIN+R 或者在菜单右键选择 运行,输入 services.msc 找到 Flash Helper Service...

  • 120
    Hive踩坑合集

    转载请在文章起始处注明出处,谢谢。 坑1、split的时候,NULL和''的区别 如果字符串最后的#没拼接数据: 结果如下: 结果如下: 如果字符串最后的#拼接数据: 结果如...

  • Hive碎碎念(6):HIVE优化

    转载请在文章起始处注明出处,谢谢。 Hive是将符合SQL语法的字符串解析生成可以在Hadoop上执行的MapReduce的工具。使用Hive尽量按照分布式计算的一些特点来设...

  • :sweat_smile:照着实操一遍,其实还好吧

    Python碎碎念(4):10 Minutes to Pandas

    转载请在文章起始处注明出处,谢谢。 jupyter notebook 保存的md文件用markdownpad打开后,无法直接复制黏贴到简书,因为运行结果会乱码。用火狐插件打开...

  • @醉梦江湖_6aae 不好意思,刚看到你的信息。我在上海某电商大厂工作,现阶段行情不好,建议优先提高技能,骑驴找马。

    转行数据分析师要考虑的几个问题

    转载请在文章起始处注明出处,谢谢。 本文只用来聊聊本人转行数据分析的心得体会,不做任何课程推荐,请放心食用。(拖更了轻拍) 先说说我本人的情况,大学在上海读的,专业电子信息工...

  • 首先确认下第一步是不是安装成功了(我估计你是这个地方错了),第二步确认下输入jt -l(中间有个空格)是不是正确的。此外命令行都是在cmd里执行的。

    jupyter notebook使用技巧(1):更换主题

    转载请在文章起始处注明出处,谢谢。 jupyter notebook默认的主题为白色背景,长期使用眼睛差点亮瞎,正好看到可以更换主题,想来可以换个保护下视力。 打开cmder...

  • Hive碎碎念(5):解析json(get_json_object)

    转载请在文章起始处注明出处,谢谢。 原文转自CSDN get_json_object(string json_string, string path) 说明:第一个参数填写j...