看了一天的验证码处理的问题,发现现在的验证码实在是太复杂了,我给跪了!主要之前从来没做过图片处理的问题,就是有也是公司直接接别人家的接口,我甚至只需要传到我们自己的服务器,我们后台跟它们去对接。
想了一下,既然验证码暂时应该研究不到,不如跳回之前写的爬取图片的爬虫身上继续研究吧,这次不上代码了,因为我没写😄
主要是想加快运行速度
毕竟有很多图片等着程序去处理,而程序的运行速度并不尽人意,而且今后如果深入研究的话,肯定会做大型的数据处理,所以我就跑去查python的多线程了- -
协程
查了一下发现并没有多线程啊,应该是协程(摘自维基百科)
<a><blockquote>与子例程一样,协程也是一种程序组件。相对子例程而言,协程更为一般和灵活,但在实践中使用没有子例程那样广泛。协程源自Simula和Modula-2语言,但也有其他语言支持。协程更适合于用来实现彼此熟悉的程序组件,如合作式多任务,迭代器,无限列表和管道。</blockquote></a>
生成器
其实上面协程的定义不看也无所谓了,因为python里面的协程可以说就是生成器。
生成器是什么东西呢?
首先,咱们说一下迭代器和可迭代对象
什么是可迭代对象?很好理解,可以被迭代的对象就是可迭代对象。
在程序里面的判断就是能用for迭代的:
<blockquote>有些同学可能还不理解迭代和遍历的区别,我在这稍微解释以下,迭代就是把一个<b>线性结构</b>的每一个数据元素找出来,线性结构就是一个有序数据元素的集合。非线性结构:不是在一个线性数列中,每个元素与其他0或多个数据元素有联系。而遍历就是把非线性结构的元素一个个找出来。</blockquote>
而迭代器就是有next()方法的,既然有next()方法了,我认为其实就是一个生成器了。
生成器还有一个标志:yield。
如果一个普通的函数不用return,而是用了yield,那说明这个函数就是一个生成器了。
那生成器是干啥的呢?加快运行速度。
举个例子来说,过年了,你妈妈在包水饺(也不知道你爸爸干啥去了),你在等着给妈妈下水饺,然后正常的流程是这样的:
包水饺--->等着包完--->包了一大盆--->下水饺---->开始吃。
如果你妈妈一直在包水饺怎么办?比如她想囤粮食(想瞎了我的心了),家里的盆放不开了啊,而且包太多的话,锅也煮不开啊,怎么办?
咱们把你妈妈包水饺的过程视作一个函数,然后每包完一个水饺,后面加一个:
<code>yield 你妈妈包的水饺</code>
这时候流程就变样子了:你妈妈每包一个水饺,她就让你去下水饺
这样,根本都用不到盆!!!!!从今往后家里省下了买盆的钱,然后用这个钱买了彩票,然后中奖了,然后你就走向了人生巅峰~
也就是说,每当我需要用到当前需要的数据时,我才会让生成器生成一条数据,不用的话就让生成器挂在那,他也不会重新运行,再用到的时候接着上次的继续运行,这样对内存和运行速度进行了非常大的优化。
最后挂一句话,是看的国外作者被翻译过来的: