功能、效果说明
我一直在做分析小红书热门笔记,用于创作自己的笔记内容。
为了想知道什么样的笔记封面更受欢迎。
我就用python
写了个批量下载热门笔记封面的工具。
效果演示
功能很简单,执行这一段代码之后,便可得到热门top100的小红书笔记封面。
注意哦,这里是指定关键词的热门笔记。
也就是说,你想要做哪一类的笔记,只需要输入对应关键词,就可得到这一类最热门笔记的封面。
下面就是代码和执行代码后获得的笔记封面。
屏幕截图 2023-03-08 183950.png
实现思路
我在先前写过如何获取小红书关键词搜索数据采集的功能。
在那一个功能中,实现了小红书关键词搜索结果的数据采集。
在这一个功能中,我就用到了从那里采集到的数据。
实现这个功能,我们只需要提取数据集中的封面url
地址,然后借助requests
库的get
方法,发送http
请求,就能拿到图片资源。
最后,只需要将资源保存为图片文件即可。
实现代码
这里是操作数据集的代码,关键点是提取数据集中的封面url
。
其他就是很简单的操作。
屏幕截图 2023-03-08 184243.png
import csv
import json
import requests
import os
def pic_get():
csv_name = input('请输入要读取的文件 \n')
file = './' + csv_name + '.csv'
count = 0
# 创建文件夹
os.mkdir(csv_name)
with open(file, encoding='utf-8-sig') as f:
for row in csv.reader(f, skipinitialspace=True):
if(count > 0):
# print(row)
# 提取封面url
url = row[5]
json_str = url.replace("'", '"')
# json.loads() ,要求json串格式中必须的双引号!!转换为字典
json_dict = json.loads(json_str)
print(json_dict['url'])
req = requests.get(json_dict['url'])
# 写入文件
open(csv_name+'/'+str(count)+'.jpg','wb').write(req.content)
count += 1
f.close()
if __name__ == '__main__':
pic_get()
实现原理
在这段代码中我用到了几个python
库。
csv
、json
、requests
、os
用的都是很基础的功能。
csv
库用来读取csv
文件中的数据。
json
库用来将读取到的csv
文件数据进行json
格式转换,方便获取图片url数据。
requests
库用来发送get
请求,请求得到图片资源。
os
库用来创建目录,用于分类保存图片文件。
总结与拓展
这一功能可以帮助我们拿到小红书关键词搜索的封面。
它们都是对应关键词中最热门笔记的封面。如果自己想发一款受欢迎的小红书笔记。
自己发小红书时,封面如何设计,就可以参考这些受欢迎的封面。
最后,祝你也能写出爆款小红书笔记。