问题1: host没同步,机器之间通信有问题
image.png
解决办法:同步hosts即可
问题2: zk连接数限制
任务跑了一段时间之后就开始背压,而且supervisor全挂了。
查看zk日志,发现大量类似日志:
Unable to read additional data from client sessionid 0x17b0bf07e0b0006, likely client has closed socket
原因:超过了zk连接数最大限制。
参考:https://blog.csdn.net/Simon_09010817/article/details/81738916