这里有一篇很好的解释websocket的网站供大家参考
https://segmentfault.com/a/1190000013149749
我自己在爬取有关websocket时的一些想法
1.一般情况下你要构造一个类,针对发送请求和接受数据都有相应的方法去做处理,所以说我们可以直接用websocket自带的一个方法类去封装我们的代码。
2。在浏览器页面通过开发者工具去找到ws的规律。(找不到的时候刷新一下页面就可以了)
3.当我们在模拟websocket发送请求的时候,注意要根据浏览器对应的信息去更换红色边框的内容。
4.我们整个的爬虫代码,除了我们根据websocket发送的message,找到对应的参数外,这个rid是关键,他的前10位是一个时间戳,我们可以通过找到他的规律去循环我们的代码,也可以通过这个时间戳,找到当浏览器发送这条message请求时,服务端返回的数据。
5.在用websocket发送请求时,会遇到send报红,我当时也做了很多的处理,但依然会报红,我认为应该是有的rid并没有返回的数据才会导致这个结果,所以不用关代码,让他继续运行就好。