最近被负载均衡这个问题搞得很难受,我遇到的是最简单的均衡问题,并不是服务器集群,多core等高级负载均衡的问题。
我们的问题简单描述就是:通过网卡接收数据包,然后把数据包放入N个队列。要求:1.每个队列里数据包的数量差不多相等。2.同一会话的包放入同一个队列。
下面对考虑过的一些算法作一个总结。
一.轮回调度 顾名思义就是把数据包一个一个地放入N个队列中。第1个包放入0号队列,第2个包放入1号队列,放完N个队列,再从0号队列开始放。
二.取余 解出数据包的sip和dip.队列索引index=(sip+dip)%N.很明了,没什么要说的。
三.异或取余 解聘数据包的sip和dip.队列索引index=((sip+dip)^sip^dip)%N.据说分散程度会比方法二要好。但找不到数学依据。
四.依照RSS. RSS是一种网卡多队列技术,要完整介绍它,需要写一篇论文。这里用到的是symmetric rss即对称RSS。网卡内部大致是这样做的:利用数据包的二元/四元/五元组和一个40字节的固定值,通过一种hash算法,算出一个hash值。然后取这个hash值的低7位,这个低7位与队列索引号形成一张RETA表,通过这张表,只要知道hash值的低7位就能知道数据包要放入哪个队列。至于为什么是低7位呢?我猜测这是一个适中的值,如果取8位或9位,表的数据量就会比较大,查询相对耗时,如果取少了,随机程度就得不到保证。根据上面的知识,就可以得出队列索引 index=hash_value%N.这里对N取余相对于维护了一张
(0,1,2....N-1,0,1,2...N-1,0,1,2....N-1)的表。如果要修改表的排列,可自己新建一张自定义的表.
五.仿一致性hash 至于为什么有一个“仿”字,那是因为我们这里的应用场景与其真正的定义不一样,只是运用其思想。一致性hash没有图我是表达不清楚了,可自行百度。反正对于我这里的场景,相当于自定义了一张第四步中的RETA表,定义格式如下
default_tbl[128]=
{0,0,0,...
1,1,1,...
2,2,2,...
...,...
N-1,N-1,N-1...}
与第四步的表相比,只不过是形式不同。
所以这种方法的做法就是通过sip和dip求出hash值,通过hash值的低7位,找到表中对应的队列序号,把数据包放入该队列。
对于以上几种算法,第一种虽然说最均匀,但不行,因为确保不了同一会话的数据包在同一队列。
第三种的散列度比第二种要好。
第四种和第五种基本差不多,就是RETA表中的对应关系不一样,如果是确定的流量,通过修改那张表,一定能做到负载均衡的。就算是未知的流量,也能做到大致均匀,但要是同一会话的量太大了,爱因斯坦也没办法,现在遇到的就是这种情况,好烦。
晚安。