Requests库入门 2020-04-19

安装第三方库requests库

测试requsets库

显示200表示测试正常

requests方法是基础方法，其他的6个基本方法都是调用requesta方法来实现的

get方法是用这样的形式来封装的

我们可以用type来显示 r 的类型

我们还可以用r.headers来请求返回，获得页面的头部信息

比如从网页获得的图片资源是二进制形式的

那我们可以用r.content来还原这个图片

在使用get方法获取网上资源的时候，有这么一个基本的流程：

首先用r.status_code来检查它的状态，如果是200说明访问正常，不是则说明出错了

如果是200，则再使用 r.text r.enconding r.apparent_encoding r.content 等来解析返回的内容

我们对百度进行访问，r.text之后发现都是乱码

使用 r.apparent_encoding 替代了 r.encoding 之后，乱码变成了一些可读的信息

着是为什么呢？

encoding从头部相关字段中提取编码，猜测其编码的方式

而 apparent_encoding则是实实在在分析网页内容，得出其编码的方式

所以当我们用encoding不能正确解码返回的内容时要用apparent_encoding来解码其中的信息

下面介绍爬取网页的通用代码框架

requests get使用时还是会有一定的风险的

所以异常的处理就非常重要了

使用python中的 try except 代码

在 try 中，有四行代码

第一行是一个get方法，我们去请求一个url链接

再根据它的responds返回的结果是不是200来判断有没有异常

第三行我们用apparent_encoding来替代encoding来保证返回时的解码是正确的

最后return r.text表示我们返回网页的内容

在这个方法中，我们通过raise_for_status 有效的判断网页是否异常

这样的通用代码框架，有效的处理我们在访问和爬取网页过程中的一些错误

或者网络链接不稳定的一些现象

把这个代码框架封装成一个函数叫做 getHTMLText(url)

HTTP协议及 requests 库方法

7个主要方法

就像电脑里存储文件的路径一样，只不过这个路径不在电脑里，在internet上

这6个方法就是requests库的6个主要函数对应的主要功能

我们通过get的方法可以把网上url的资源爬下来

有时候资源很大或者把资源拿下来的代价很大，这时候通过请求head来获得他的头部信息并且分析这个资源的大概内容

post不改变url本身的资源，只是在后面添加用户所提交的新的资源

put是将用户的资源

用text发现资源的内容为空，所以使用head方法可以占用很少的资源来获取内容的概要信息

我们更新一个字典，使用post方法，可以发现键字对（？）被默认为form表单的字段下

如果我们提交的是一个字符串，则显示是在data下

着是post方法根据用户提交内容的不同，进行一些相关的整理

put方法与post方法类似，只不过它能将原有的方法覆盖掉

requests库主要方法解析

method共有七种功能，他们对应的分别是HTTP协议所对应的请求功能

前六种我们都接触过

options实际上是向服务器获取一些服务器跟客户端能够打交道的参数，这里面并不与获取资源直接相关，所以我们在使用中用的比较少

我们再增加一个https的代理服务器，这样可以很好的隐藏源服务器的IP地址信息

这样，我们在访问网页时，IP地址就是代理服务器的IP地址

能够有效的防止对爬虫的逆追踪

小结

requests库一共有7个对外使用的方法，分别是：

常常是由于网络安全的请求，我们很难向一个 url 去发起 post、put、patch、delete这四个请求

作为requests库来说，我们在使用爬虫的时候，最常使用的就是 get

对于某些特别大的url链接，我们使用 head 方法来获得它的资源概要

基础爬虫要掌握的代码框架

所以一定要用 try except 的方式来保证网络连接的异常能够被处理

很核心的一行代码，也就是responds对象的raise_for_status函数，检查是否有异常

如果不是200，则except能捕获到所有网络连接错误时的异常

最后编辑于：2020.04.20 11:04:32

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,997评论 6赞 502
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,603评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 163,359评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,309评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,346评论 6赞 390
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,258评论 1赞 300
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,122评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,970评论 0赞 275
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,403评论 1赞 313
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,596评论 3赞 334
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,769评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,464评论 5赞 344
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,075评论 3赞 327
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,705评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,848评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,831评论 2赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,678评论 2赞 354

Requests库入门 2020-04-19

推荐阅读更多精彩内容