轮数在拥塞算法中是一个重要的概念,基于丢包的拥塞算法中,比如reno算法在拥塞避免阶段,每轮进行一次拥塞窗口加1,bic算法也是每轮进行一次拥塞窗口增加,只是增加的幅度不同,而基于时延的拥塞算法,如vegas算法,检测出一轮内的最小rtt_us值,与rtt_min对比推断得到当前网络的数据包排队的情况。这些例子中可以看出,对于算法的实现都需要考虑轮数的统计。
那算法是如何计算轮数的呢?主要分为三种,一种形如reno,bic这类算法中,轮数的计算建立在 某一轮能发送snd_cwnd个数据包,当累计了snd_cwnd个数据包确认,就为一轮结束。算法中有个snd_cwnd_cnt变量用来累计当前轮已经收到了多少的数据包确认,当该值大于等于拥塞窗口snd_cwnd,就认为一轮结束了。
以reno为例,w为控制增窗的频率快慢,reno中等于snd_cwnd
void tcp_cong_avoid_ai(struct tcp_sock *tp, u32 w)
{
if (tp->snd_cwnd_cnt >= w) { //累计了snd_cwnd个ack数据包
if (tp->snd_cwnd < tp->snd_cwnd_clamp)//未超过申明的最大窗口值
tp->snd_cwnd++;
tp->snd_cwnd_cnt = 0; //累计ack个数清零
} else {//累计ack个数
tp->snd_cwnd_cnt++;
}
}
第二类,如vegas这种基于时延的拥塞算法中,用序列号进行区分,记录某一轮的起始点对应的snd_nxt,当snd_nxt所对应的数据包没有发生重传,被接收端ack确认的时间即为一个rtt,也就是一轮,如下图所示,数据包a被ack确认时,只有线段SEQ1以上的数据包是之后发送的,当这区间某个数据包被ack确认,说明已经经过了一轮rtt,新一轮中,只有线段SEQ2以上的数据包是之后发送的。
以vegas算法为例,
if (after(ack, vegas->beg_snd_nxt)) {
/* Do the Vegas once-per-RTT cwnd adjustment. */
/* Save the extent of the current window so we can use this
* at the end of the next RTT.
*/
vegas->beg_snd_nxt = tp->snd_nxt;
...
}
第三种就是bbr算法中所使用的轮数计算方法,用时间来区分,每个数据包发送都记录当前交付到对端的数据包个数delivered,某一时刻T为一轮的起始点,对应的交付到对端个数为D,时间小于T的记录的delivered都小于D,之后发送的数据包记录的delivered都大于等于D,当接收端收到ack(sack)数据包对应发送的delivered大于等于D,说明T时刻之后发送的数据包至少有个一到达了接收端,即经过了一轮RTT。
如上图所示,时刻T1所对应的tp->delivered 为D,那时刻T1右侧发送的数据包都是之后发送的,记录prior_delivered都大于等于D,当两个重传数据包被ack确认时,其对应的prior_delivered都为D,说明T1时刻之后发送的两个数据包经过一个RTT传输已经被接收,已经经过了一轮,开始了新一轮,而此时tp->delivered为D+2,之后发送的数据包记录的prior_delivered都大于等于D+2,当收到ack确认的数据包记录的prior_delivered大于等于D+2,说明时间已经又过了一轮,新一轮已经开始。
/* See if we've reached the next RTT */
if (!before(rs->prior_delivered, bbr->next_rtt_delivered)) {
bbr->next_rtt_delivered = tp->delivered;
bbr->rtt_cnt++;
bbr->round_start = 1;
...
}
rs->prior_delivered就为每个ack(sack)确认的包发送时记录的tp->delivered值,当其大于等于某一轮起始的delivered值,就为新一轮开始。
这三种不同的方法,bic算法中这样处理是由于比如窗口每轮增加5个包,并不是一轮结束后窗口加5,而是每经过1/5的窗口值就进行拥塞窗口加1的操作。vegas算法中,需要统计一轮内最小rtt_us,需要知道某一轮的起始和结束点,定期的重置当前轮内追踪到的最小rtt_us以及调整窗口值。然而,BBR算法不仅负责拥塞避免阶段的发包,而且还接管了拥塞丢包状态下发包行为,而vegas算法中的轮数计算只能用于不丢包的open/disorder状态,假设某个时刻发生大面积丢包,拥塞窗口骤降,需要经过两三轮的重传才能重传完毕,才能推进snd_una,进而更新轮数。这对BBR来说是非常不合适了,因为已经拥塞丢包了,网络状况很有可能已经变差了,而这时却因为计算出来的轮数偏小,不能及时的更新最大带宽值,进而延迟了网络处于拥塞的状态时间。