一、写在前面
爬虫是一门技术,漫画是一种爱好,当两者结合起来,那么就是你白嫖的开始了。
斗破苍穹无疑是当今中国最火的小说,国漫之一了,小说版的斗破相信大家都已经看完了,但是漫画版的你肯定不敢说你把它看完了,因为官网都没更新完呢。哈哈,是吧,小编也是一位漫画爱好者,但又是一位较为节俭人,所以,能动手,千万不动钱。
二、思路分析
2.1 漫画来源
毫无疑问,不想花钱每周一买,那就官网每周一更吧。
从这链接就能看出,斗破绝对是官网的儿子,不然才排不上第一位呢。
2.2 工具
这个简单,知道python的人,都知道,小编也不赘述了,不会就百度去吧。
工具1:Sublime Text
模块:Requests,Json,Time,Os
2.3 网站分析
看了那么多,这才是关键。先不说小编是如何找到了关键所在这一苦逼的路程,小编直接告诉你,人人可用。
任意点开其中一个章节,进入后Shift+I 打开开发者模式,如下图:
这个时候,你会发现原来每一章的所有节的漫画图片链接都藏在这里,找到链接了问题就解决了一半,下一步就是如何翻页。说到这里,小编也是煞费苦心,找了许久才发现暗门所在。请看每注意看每一章的漫画链接的之间的规律:
第902章的链接:
https://www.kanman.com/25934/di902hua-1630725640005.html
第901章的链接:
https://www.kanman.com/25934/di901hua-1629515870003.html
很明显只是尾部不一样,所以关键在于如何匹配这一部分。那么小编也直接说如何这规律吧,如图:
继续往下拉,就发现本链接的页面中会含有前一页链接的尾部部分,VeryGood.得来全不费工夫。
这样一来,即可以得到本链接上的所有图片,顺带还有下一页的链接,只要做个递归解析,一步到位。
2.4 结果展示
2.5 代码展示
链接:https://pan.baidu.com/s/1bWmEbGz9EvvgBpMZVAGRxg 提取码:7rjl
三、感慨万分
想来小编只是热爱这技术,热爱这漫画。无奈为了自己的热爱,大部分人需要付出财物,那都是小问题,但我们也尊重版权,也尊重技术。
如有疑问,请私聊小编。