240 发简信
IP属地:北京
  • MADlib——基于SQL的数据挖掘解决方案

    https://blog.csdn.net/wzy0623/column/info/15741 原 HAWQ与Hive查询性能对比测试 一、实验目的 本实验通过模拟一个...

  • HAWQ取代传统数仓实践

    1.为什么选择HAWQ 2.HAWQ技术解析(二) —— 安装部署 HAWQ取代传统数仓实践(十一)——维度表技术之维度合并 有一种合并维度的情况,就是本来属性相同的维度,因...

  • 120
    基于Spring+SpringMVC+Mybatis分布式敏捷开发系统架构

    技术名称官网 Spring Framework容器http://projects.spring.io/spring-framework/ SpringMVCMVC框架htt...

  • iOS应用架构谈 开篇

    缘由 之前安居客iOS app的第二版架构大部分内容是我做的,期间有总结了一些经验。在将近一年之后,前同事zzz在微信朋友圈上发了一个问题:假如问你一个iOS or Andr...

  • 教程

    一 入门系列 1. Scrapy爬虫入门教程二 官方提供Demo //www.greatytc.com/p/428cbd8d12ec 2.Scrapy-xpath用...

  • 120
    Spark生态圈概述与Hadoop对比

    Spark:快速的通用的分布式计算框架 概述和特点: 1)Speed,(开发和执行)速度快。基于内存的计算;DAG(有向无环图)的计算引擎;基于线程模型; 2)Easy of...

  • Scrapy 爬虫的几个例子

    1. 简单的爬虫 1)需要从网站上爬取文章,并上传至服务器,实现模拟用户发帖。 GitHub地址:https://github.com/JohonseZhang/Scrapy...

  • scrapy在采集网页时使用随机user-agent的方法

    默认情况下scrapy采集时只能使用一种user-agent,这样容易被网站屏蔽,下面的代码可以从预先定义的user-agent的列表中随机选择一个来采集不同的页面 Pyth...

  • Scrapy基础(十二)————异步导出Item数据到Mysql中

    Scrapy基础(十二)————异步导出Item数据到Mysql中 上次说过从Item中同步写入数据库,因为网络的下载速度和数据库的I/O速度是不一样的 所以有可能会发生下载...

  • 120
    分布式爬虫概述

    分布式爬虫概述 什么是分布式爬虫: 多个爬虫分布在不同的服务器上,通过状态管理器进行统一调度,达到像URL去重等功能的爬虫系统 分布式爬虫的优点 1) 充分利用多台机器的宽带...

  • Re 正则表达式

    元字符 注意匹配时要匹配原始字符串,避免发生冲突 用 r” . ^ $ * + ? {} [] () \ | .匹配除换行符以外的任意字符 \w匹配字母或数字或下划线或汉字 ...

  • 量化交易常见策略CASE

    Python入门: 量化分析师的python日记一;量化分析师的python日记二;量化分析师的python日记三 量化分析师的python日记四;量化分析师的python日...

  • 120
    量化交易主要有哪些经典的策略?

    量化交易起源于国外,在国外已经至少有长达几十年的发展历程,因此我们先看一下国外比较经典有效的一些策略。 中长线的交易策略: Aberration trading system...

  • RabbitMQ

    1.Mac OS安装RabbitMQ 1)brew安装: Homebrew简介和基本使用http://blog.csdn.net/andanlan/article/detai...

  • mac 终端 常用命令

    基本命令 1、列出文件 ls 参数 目录名例:看看驱动目录下有什么:ls /System/Library/Extensions 参数 -w 显示中文,-l 详细信息, -a ...