不写代码，你也可以抓取任意公众号

刷朋友圈，看到一篇文章，很有料，哈！这个公众号不错，关注一下。

翻一下历史文章吧，看看作者还写了什么其他好玩的东西。

从公众号打开历史文章页，往下滑动了几秒，哎，这样看的话，很费时间啊。

而且我又不想全部文章都看，有没有什么方法，可以看到全部文章标题，我根据标题，选择感兴趣的再看文章内容。

搜索一下，找到了下面几个解决方案。

1、「P大叔」（http://pdfuncle.com/）：可以将公众号文章导出为PDF，很方便。

P 大叔 72 小时内才能导出，如果现在就想看，就需要等一段时间，放弃。

2、传送门（http://chuansong.me/）：可以直观的看到文章标题列表。

我感兴趣的公众号，却是没有被收录，提交的话，估计要等一段时间了。放弃。

3、新榜（https://www.newrank.cn/）：新榜的「公众号回采」功能，可以抓取文章的阅读数、点赞数、题图、等等等，多维度的数据。

对于我来说，这么多数据，我用不到，而且价格有点贵。

没钱，放弃。

4、搜狗微信搜索（http://weixin.sogou.com/）：可以通过关键字查找相关文章。

如果目标是某个确定的公众号，那搜狗就没有用武之地了，它只能显示最近的10条文章。

放弃。

5、编程：自己抓取公众号的标题。

额。。。这个，有点难度，放弃。

6、不用写代码的爬虫技能：用谷歌插件 webscraper，自己抓取感兴趣的公众号，需要的时候，随时抓，随时出结果。

而且入手简单，还是免费的。

我自己试了下，没问题，几分钟时间，很轻松的就将 1300多个标题全部抓下来了，而且真的一行代码都没有写。

如图：

excel表格最后部分

下面是抓取公众号的操作详细步骤——

一、下载安装软件

webscraper 是运行在谷歌浏览器之中，所以我们需要实际需要安装两个软件

谷歌浏览器
webscraper

这两个软件如果大家之前用过，就可以直接跳到第二步。

如果没有，可以看下面这个视频，里面详细介绍了安装步骤。

https://v.qq.com/x/page/j0753l7ki12.html

二、抓取数据

我因为手头只有 mac 系统，所有我介绍一下 mac 的抓取方式。

1、从浏览器打开公众号历史列表

打开 mac 版微信，进入某个公众号，点开历史文章页面，如下图——

image.png

点击历史文章页面图标（上图标注2）后，会弹出一个窗口，可以看到下面的图片——

image.png

这块如果你看到的是其他浏览器图标，则需要将系统默认浏览器设置为谷歌浏览器。这块自己百度一下

点击上图标注的浏览器logo，即可在浏览器查看公众号历史文章列表，这个页面，记为 A，不要关闭。

这个网页URL，也就是浏览器地址栏的信息，复制到某个地方保存下来，记为 B，这个很重要。
如下图

image.png

如果你点开出现下面的情况——

image.png

说明你的微信版本太高，最新版的微信内置浏览器，所以无法通过浏览器查看。需要退回到上一个版本的微信，公众号「多元思维Hack」后台回复“微信”，即可下载重新安装

2、开始抓取数据

（1）在前面的 A 网页上，点击鼠标 右键 ——> 审查元素（检查）

可以看到下方界面，如果和图片不一致，说明你的webscraper安装可能出现点问题，可以回看上面的视频演示。

图片下方的一大列信息请忽略，能看到红框标注的 web scraper即可。

（2）点击 Create new sitemap ——> Import Sitemap，如下图。

image.png

点击 Import Sitemap 后，可以看到下面界面——

在 Sitemap JSON 右侧输入下面信息（）：

{"_id":"testwechat","startUrl":["https://mp.weixin.qq.com/mp/profile_ext?action=home&__biz=MzI3ODU2MTUwOA==&scene=124&#wechat_redirect"],"selectors":[{"id":"total","type":"SelectorElementScroll","parentSelectors":["_root"],"selector":"div.weui_media_box","multiple":true,"delay":"3000"},{"id":"title","type":"SelectorText","parentSelectors":["total"],"selector":"h4.weui_media_title","multiple":false,"regex":"","delay":0},{"id":"date","type":"SelectorText","parentSelectors":["total"],"selector":"p.weui_media_extra_info","multiple":false,"regex":"","delay":0}]}

注意！！上方加粗的链接，大家需要换成自己想要抓取的公众号历史文章界面的网址，这个网址，前面让大家复制保存记为 B了。（忘了的可以上拉看下）

Rename Sitemap，就是重新起个名字，你抓的哪个公众号，就取什么最好，做到顾名思义。（也可以不写，默认为 testwechat）

填完点击最下面的 Import Sitemap即可。

（3）开始抓取，点击中间栏 “Sitemap 你起的名字” ——> Scrape。

如下图——

image.png

出现下方界面，需要填两个信息，默认即可。

image.png

点击“Start scraping”，就是见证奇迹的时刻。

浏览器会弹出一个新窗口，这个窗口会自动下拉，直到将公众号的文章全部抓取完毕才会停止，这个过程，你可以去做其他任何事情，但是不要关闭这个弹出窗口。

如果你出现下面这个界面，提示“验证”，卡住不动，说明你没有做上面的修改链接步骤，请回到上面第（2）步。

image.png

等到数据抓取完毕，可以看到下面这个界面，点击 “refresh”
一定等抓完再点 refresh

image.png

（4）导出excel到电脑上：点击中间栏 “Sitemap 你起的名字” ——> Export data as CSV

如下图——

点击 Download now! ，如下图

image.png

至此，我们已经将一个公众号的所有标题，以及发文日期抓取完毕。下载的 CSV 文件可以用excel打开。

excel里面的内容，大家关注自己需要的即可，无关的列，可以删掉。

这里抓到的只是标题和时间，如果大家通过标题，对某篇文章感兴趣，可以复制标题，到搜狗微信搜索（http://weixin.sogou.com/）即可看到原版内容。

我问了几个windows系统的朋友，发现windows版的微信无法从浏览器打开公众号文章列表，也就是前面的 A 网页，如果能做到这点，那就可以按照上面的方法操作。

可能还有其他方法可以做到这点，windows的朋友可以试下，如果成功了，可以告诉我下。

如果实在不行的话，就找个有mac的朋友帮你抓下，很简单的，要不找明白也行的。

我还和朋友合作写了个软件，有兴趣看看

功能牛逼，还能帮你赚钱的神器

最后编辑于：2018.12.09 11:52:03

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 211,194评论 6赞 490
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,058评论 2赞 385
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 156,780评论 0赞 346
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,388评论 1赞 283
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,430评论 5赞 384
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,764评论 1赞 290
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,907评论 3赞 406
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,679评论 0赞 266
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,122评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,459评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,605评论 1赞 340
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,270评论 4赞 329
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,867评论 3赞 312
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,734评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,961评论 1赞 265
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,297评论 2赞 360
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,472评论 2赞 348

不写代码，你也可以抓取任意公众号

一、 下载安装软件

二、 抓取数据

1、从浏览器打开公众号历史列表

2、开始抓取数据

推荐阅读更多精彩内容

一、下载安装软件

二、抓取数据