原文地址://www.greatytc.com/p/ea0b56e3bd86
2018/5/7
抓取1页影评,print内容出错
抓取结果编码出错,存在score未取到的情况
Python版本:2.7.13
2018/5/8
print同时打印2个结果时,文字编码错误
print结果参考,求大神告知原因
获取用户名代码,xpath内容待学习
测试结果OK
打印全部内容
打印结果OK
5/9
查看列表元素的类型
评分获取代码
源代码
代码运行结果,先获取class属性存储为字符串,取字符串的第8位即所需评分
列表内容获取正常
尝试写入CSV出错,发现name中既有Unicode又有str,绝望!!
参考前辈经验后,编码问题得到改善。
链接:https://blog.csdn.net/gyafdxis/article/details/77923516
文字能够正常显示,但是不在同一个单元格
万能百度:.writerow()和writerows()写入的是list类型,把单个数据变成[]就行。
刚开心一会,又碰到了问题!!我要换Python3(;´д`)ゞ
参考了这位大神(//www.greatytc.com/p/d1bf2f0bdc51)对数据的存储方法,终于成功了!!
3个元素作为一个列表存储到大列表中
将列表中的数据依次写入CSV
终于成功啦!撒花!
5/10
今日任务:把代码改为函数
这一段代码导致程序运行无结果,连print都不行,只能重新处理编码问题
在经历了无数次报错,无数次百度后终于找到了问题的关键
把数据统一为‘str’类,最终运行成功
运行中Tqdm出现警告,不知道什么原因,不过对结果没有影响
完整代码在下一篇文章中!