之前我都是将数据爬取后存为txt、csv或者excel,json格式几乎没有。于是乎我就想试一下,如何将爬取的数据存为json文件。于是我便查了一下使用json格式的好处,不查不知道,一查吓一跳。好家伙呀,json格式的特点和优势可真不少呢。json格式的特点和优势大致为:
1.数据清晰、易于读写
2.有很多工具类支持它的转换
3.在所有主流浏览器有很好的支持
4.在传输时数据量更小、传输更快
5.在JS中有天然的语言优势(因为它是标准的子集合)
因此我就开始试着将爬取的数据存为json格式,在之前我发布过关于文件的操作其中包含了jsoncsv、excel等文件相关操作,因此我也知晓json库的基本使用方法。
于是乎我就先将爬取的数据存为字典
然后直接将这个字典转为json格式
诶,发现是错误的,里面的格式有问题,不能这么做。
于是我又将爬取的数据现存列表,再转json,发现不行,只出现了一条数据
于是我有开始找问题,诶,突然灵光一闪,应该是放错位置了,爬虫是一直在循环的,如果将空列表定义在这里,那么每一次都会被清空,这不白忙活了吗!好家伙呀好家伙!于是乎,我将这一段代码放到了最外面,在执行数据数据爬取之前定义一个列表,然后进行列表存储,最完成后再转json
诶,这下就对咯!
之后为了保险,我简单的验证了一下json文件,诶,发现莫得问题,哈哈!
这就是我将爬取的数据存为json格式的历程之路,是不是最简便的方法不知道,是不是最正规的方法不知道,反正解决了问题,嘿嘿!
如果大家有什么更加简便的方法或者看出了我存在的问题,欢迎大家在评论区讨论哦!