240 发简信
IP属地:浙江
  • Excel+SQL进行件业务分析(二)PowerIB插件

    这篇笔记主要记录powerIB 四大插件的打开方及简单说插件的作用,excel2016: power Query:打开方式---点击‘数据选项卡...

  • Excel+SQL进行数据分析(一)

    以Excel+SQL命名的数据分析笔记主要是针对业务数据分析来做的,主要是为了提升当前工作的能力。因为是边学边记的,所以笔记中很多内容都是之后要...

  • Linux常用命令

    在学习Hadoop时接触到里Linux,刚刚学习linux,上网收集了一些觉得太零散了,找到一个比较全的,转载自:https://www.cnb...

  • Resize,w 360,h 240
    6.爬虫-Requests+正则表达式抓取猫眼电影Top100

    流程: 抓取单页内容:利用requests请求得到HTML页面代码,返回结果。 正则表达式分析:根据HTML代码的分析得到电影名称、主演、上映时...

  • Resize,w 360,h 240
    Centos7系统搭建Hadoop2.8.5

    1. 下载Hadoop 下载地址:https://www.apache.org/dyn/closer.cgi/hadoop/common/had...

  • Resize,w 360,h 240
    4.爬虫-PyQuery库详解

    初始化 字符串初始化 URL初始化 文件初始化 基本CSS选择器 ** 如果是class加点,如果是id加#,如果是标签什么都不加,如图cont...

  • Resize,w 360,h 240
    3.爬虫-BeautifulSoup

    解析库: 基本使用方法: .prettyify():把html调整为标准格式,如图可以观察到该html缺少 和 的闭合标签,而.prettify...

  • Resize,w 360,h 240
    2.爬虫-正则表达式

    正则表达式在线测试工具:http://tool.oschina.net/regex/# 常见匹配模式: 正则: 常规匹配: 泛匹配 . *: 匹...