关于图片抓取的几种方式

断断续续学习了python一段时间,编程几乎0基础的情况下(大学学的VB那点基础真的是不够用),从头啃了几本网上推荐的教材进步还是很迟缓。

Less Talking,More Typing #这里要查找下愿意,大概就是少看多写

准备做的第一个项目就是试着在jandan上抓取图片,相对来说jandan的html原文件还是比较好定位的,也没有花时间去学习正则(当然这个之后是一定要巩固加强的),就成功把图片的域名分离出来了。在下载图片上,有使用urllib的,也有使用request的。尝试urllib的经过几次调试成功后,总是会出现部分图片下载损坏的问题,没有排查出来愿意,并不会返回报错信息。只好改用request来操作,虽然下载速度不快,但是不会出现urllib的问题。这个项目里面分解出来不少能够学习加深的点,后续可以分解下来一步步有方向性的学习:

·如何使用正则表达

·beautifulsoup的各种函数作用

·如何定义下载文件的储存位置

·如何提升调试效率

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 174,795评论 25 709
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,286评论 19 139
  • 小学的时候,有人问我长大要做什么。我说我要做老师,旁人就会觉得,是啊,女孩子做老师多好啊,工作轻松,寒暑假又多...
    叶堇幽香阅读 160评论 0 0
  • 今天和宿管大吵架,起因是一个电饭锅。放在衣柜上大概两年多没用。宿管一边敲门一边自己拿钥匙开门,大喊查寝,一群人就这...
    机车男nate阅读 164评论 0 0
  • 1 今天辟谷第六天,很多人不理解我为什么要坚持辟谷,认为这是自己折磨自己。我想说的是,想肆意放纵人生,就要先学会收...
    暖_遇见阅读 490评论 0 0