IP属地:陕西
1.安装 2.mongodb 服务sudo service mongod/mongodb startsudo service mongod/mo...
dashow dbs切换数据库:use dbname查看数据库信息:db.stats()删除:db.dropDatabase() 创建集合:cr...
爬虫代码基本步骤 第一步: 分析网站,寻找目标URL 第二步: 分析目标URL参数(get,post) get和post请求的区别: get请求...
大数库时代:数据如何产生?1. 打的公司打的企业:通过用户产生的数据2.大的数据平台:通过收集或者和其他企业或者公司合作3.国家政府/大的机构:...
爬虫代码基本步骤 第一步: 分析网站,寻找目标URL 第二步: 分析目标URL参数(get,post) get和post请求的区别: get请求...
正则的规则: 单字符匹配 . 除换行符之外的任意字符\d: 表示数字\D: 匹配非数字\w: 匹配单词字符[a-z,A-Z,0-9]\W: 匹配...
Scrapy_redis在scrapy的基础上实现了更多,更强大的功能,具体体现在:reqeust去重,爬虫持久化,和轻松实现分布式,安装命令如...
/bin 二进制可执行命令/dev 设备特殊文件/etc 系统管理和配置文件/etc/rc.d 启动的配置文件和脚本/home 用户主目录的基点...
1 2 3