Golang 1.11 sync.Mutex 源码解析

本文基于 go1.11 版本。

Mutex 使用

在深入源码之前,要先搞清楚一点,对 Golang 中互斥锁 sync.Mutex 的操作是程序员的主动行为,可以看作是是一种协议,而不是强制在操作前必须先获取锁。

这样说可能有点抽象,看下面这段代码:

package main

import (
    "fmt"
    "sync"
    "time"
)

type People struct {
    mux  sync.Mutex
    Name string
    Age  uint8
}

func (p *People) IncAge() {
    p.mux.Lock()

    time.Sleep(3 * time.Second)
    p.Age++

    p.mux.Unlock()
}

func main() {
    leo := &People{Name: "leo", Age: 18}

    innerIncTime := time.Now().Second()
    fmt.Println("with mutex  inc time:", innerIncTime)
    go leo.IncAge()

    time.Sleep(time.Second)
    outerIncTime := time.Now().Second()
    fmt.Println("without mutex inc time:", outerIncTime)
    leo.Age++
    fmt.Println("without mutex inc result:", leo.Age)

    fmt.Println("mutex status:", leo.mux)
    time.Sleep(2 * time.Second)
    fmt.Println("with mutex inc result:", leo.Age)
    fmt.Println("Two seconds later mutex status:", leo.mux)
}

在执行 leo.Age++ 之前已经加锁了,如果是需要强制获取锁的话,这里会等待 3 秒直到锁释放后才能执行,而这里没有获取锁就可以直接对 Age 字段进行操作,输出结果:

with mutex  inc time: 19
without mutex inc time: 20
without mutex inc result: 19
mutex status: {1 0}
with mutex inc result: 20
Two seconds later mutex status: {0 0}

所以,如果在一个 goroutine 中对锁执行了 Lock(),在另一个 goroutine 可以不用理会这个锁,直接进行操作(当然不建议这么做)。

还有一点需要注意的是,锁只和具体变量关联,与特定 goroutine 无关。虽然可以在一个 goroutine 中加锁,在另一个 goroutine 中解锁(如通过指针传递变量,或全局变量都可以),但还是建议在同一个代码块中进行成对的加锁解锁操作。

源码分析

这是 Mutex 的 源码链接

Mutex 结构

Mutex 表示一个互斥锁,其零值就是未加锁状态的 mutex,无需初始化。在首次使用后不要做值拷贝,这样可能会使锁失效。

type Mutex struct {
    state int32  // 表示锁当前的状态
    sema  uint32 // 信号量,用于向处于 Gwaitting 的 G 发送信号
}

几个常量

这里用位操作来表示锁的不同状态。

const (
    mutexLocked = 1 << iota // mutex is locked
    mutexWoken
    mutexStarving
    mutexWaiterShift = iota

    starvationThresholdNs = 1e6
)

mutexLocked

值为 1,第一位为 1,表示 mutex 已经被加锁。根据 mutex.state & mutexLocked 的结果来判断 mutex 的状态:该位为 1 表示已加锁,0 表示未加锁。

mutexWoken

值为 2,第二位为 1,表示 mutex 是否被唤醒。根据 mutex.state & mutexWoken 的结果判断 mutex 是否被唤醒:该位为 1 表示已被唤醒,0 表示未被唤醒。

mutexStarving

值为 4,第三位为 1,表示 mutex 是否处于饥饿模式。根据 mutex.state & mutexWoken 的结果判断 mutex 是否处于饥饿模式:该位为 1 表示处于饥饿模式,0 表示正常模式。

mutexWaiterShift

值为 3,表示 mutex.state 右移 3 位后即为等待的 goroutine 的数量。

starvationThresholdNs

值为 1000000 纳秒,即 1ms,表示将 mutex 切换到饥饿模式的等待时间阈值。这个常量在源码中有大篇幅的注释,理解这段注释对理解程序逻辑至关重要,翻译整理如下:

引入这个常量是为了保证出现 mutex 竞争情况时的公平性。mutex 有两种操作模式:正常模式和饥饿模式

正常模式下,等待者以 FIFO 的顺序排队来获取锁,但被唤醒的等待者发现并没有获取到 mutex,并且还要与新到达的 goroutine 们竞争 mutex 的所有权。新到达的 goroutine 们有一个优势 —— 它们已经运行在 CPU 上且可能数量很多,所以一个醒来的等待者有很大可能会获取不到锁。在这种情况下它处在等待队列的前面。如果一个 goroutine 等待 mutex 释放的时间超过 1ms,它就会将 mutex 切换到饥饿模式。

在饥饿模式下,mutex 的所有权直接从对 mutex 执行解锁的 goroutine 传递给等待队列前面的等待者。新到达的 goroutine 们不要尝试去获取 mutex,即使它看起来是在解锁状态,也不要试图自旋(等也白等,在饥饿模式下是不会给你的),而是自己乖乖到等待队列的尾部排队去。

如果一个等待者获得 mutex 的所有权,并且看到以下两种情况中的任一种:1) 它是等待队列中的最后一个,或者 2) 它等待的时间少于 1ms,它便将 mutex 切换回正常操作模式。

正常模式有更好地性能,因为一个 goroutine 可以连续获得好几次 mutex,即使有阻塞的等待者。而饥饿模式可以有效防止出现位于等待队列尾部的等待者一直无法获取到 mutex 的情况。

自旋锁操作

在开始看 Mutex 源码前要先介绍几个与自旋锁相关的函数,源码中通过这几个函数实现了对自旋锁的操作。这几个函数实际执行的代码都是在 runtime 包中实现的。

runtime_canSpin

代码具体位置

由于 Mutex 的特性,自旋需要比较保守的进行,原因参考上面 starvationThresholdNs 常量的注释。

限制条件是:只能自旋少于 4 次,而且仅当运行在多核机器上并且 GOMAXPROCS>1;最少有一个其它正在运行的 P,并且本地的运行队列 runq 里没有 G 在等待。与 runtime mutex 相反,不做被动自旋,因为可以在全局 runq 上或其它 P 上工作。

// Active spinning for sync.Mutex.
//go:linkname sync_runtime_canSpin sync.runtime_canSpin
//go:nosplit
func sync_runtime_canSpin(i int) bool {
    // sync.Mutex is cooperative, so we are conservative with spinning.
    // Spin only few times and only if running on a multicore machine and
    // GOMAXPROCS>1 and there is at least one other running P and local runq is empty.
    // As opposed to runtime mutex we don't do passive spinning here,
    // because there can be work on global runq or on other Ps.
    if i >= active_spin || ncpu <= 1 || gomaxprocs <= int32(sched.npidle+sched.nmspinning)+1 {
        return false
    }
    if p := getg().m.p.ptr(); !runqempty(p) {
        return false
    }
    return true
}

runtime_doSpin

代码具体位置同上。

执行自旋操作,这个函数是用汇编实现的,函数内部循环调用 PAUSE 指令。PAUSE 指令什么都不做,但是会消耗 CPU 时间。

/go:linkname sync_runtime_doSpin sync.runtime_doSpin
//go:nosplit
func sync_runtime_doSpin() {
    procyield(active_spin_cnt)
}

runtime_SemacquireMutex

代码具体位置。发送获取到 Mutex 的信号。

//go:linkname sync_runtime_SemacquireMutex sync.runtime_SemacquireMutex
func sync_runtime_SemacquireMutex(addr *uint32, lifo bool) {
    semacquire1(addr, lifo, semaBlockProfile|semaMutexProfile)
}

runtime_Semrelease

代码具体位置同上。发送释放 Mutex 的信号。

//go:linkname sync_runtime_Semrelease sync.runtime_Semrelease
func sync_runtime_Semrelease(addr *uint32, handoff bool) {
    semrelease1(addr, handoff)
}

Lock

这是 Lock 方法的全部源码,先看一下整体逻辑,下面会分段解释:

首先是直接调用 CAS 尝试获取锁,如果获取到则将锁的状态从 0 切换为 1 并返回。获取不到就进入 for 循环,通过自旋来等待锁被其它 goroutine 释放,只有两个地方 break 退出 for 循环而获取到锁。

源码实现分析

刚进入函数,会尝试获取锁:

if atomic.CompareAndSwapInt32(&m.state, 0, mutexLocked) {
        if race.Enabled {
            race.Acquire(unsafe.Pointer(m))
        }
        return
    }

直接通过调用 CompareAndSwapInt32 这个方法来检查锁的状态是否是 0,如果是则表示可以加锁,将其状态转换为 1,当前 goroutine 加锁成功,函数返回。

CompareAndSwapInt32 这个方法是汇编实现的,在单核CPU上运行是可以保证原子性的,但在多核 CPU 上运行时,需要加上 LOCK 前缀来对总线加锁,从而保证了该指令的原子性。

至于 race.Enabled ,这里是判断是否启用了竞争检测,即程序编译或运行时是否加上了 -race 子命令。关于竞争检测如想深入了解可以看官方博客,见参考目录 1。在这里可以不用理会。

如果 mutex 已经被其它 goroutine 持有,则进入下面的逻辑。先定义了几个变量:

var waitStartTime int64 // 当前 goroutine 开始等待的时间
starving := false       // mutex 当前的所处的模式
awoke := false          // 当前 goroutine 是否被唤醒
iter := 0               // 自旋迭代的次数
old := m.state          // 保存 mutex 当前状态

进入 for 循环后,先检查是否可以进行自旋:

如上所述,不要在饥饿模式下进行自旋,因为在饥饿模式下只有等待者们可以获得 mutex 的所有权,这时自旋是不可能获取到锁的。

能进入执行自旋逻辑部分的条件:当前不是饥饿模式,而且当前还可以进行自旋(见上面的 runtime_canSpin 函数)。

然后是判断能否唤醒当前 goroutine 的四个条件:根据 1)!awoke 和 2)old&mutexWoken == 0 来判断当前 goroutine 还没有被唤醒;3)old>>mutexWaiterShift != 0 表示还有其它在等待的 goroutine;4)如果当前 goroutine 状态还没有变,就将其状态切换为 old|mutexWoken, 即唤醒状态 。

// old&(mutexLocked|mutexStarving) == mutexLocked 表示 mutex 当前不处于饥饿模式。
// 即 old & 0101 == 0001,old 的第一位必定为 1,第三位必定为 0,即未处于饥饿模式。
if old&(mutexLocked|mutexStarving) == mutexLocked && runtime_canSpin(iter) {
    // 这时自旋是有意义的,通过把 mutexWoken 标识为 true,以通知 Unlock 方法就先不要叫醒其它
    // 阻塞着的 goroutine 了。
    if !awoke && old&mutexWoken == 0 && old>>mutexWaiterShift != 0 &&
        atomic.CompareAndSwapInt32(&m.state, old, old|mutexWoken) {
        awoke = true
    }
    // 将当前 goroutine 标识为唤醒状态后,执行自旋操作,计数器加一,将当前状态记录到 old,继续循环等待
    runtime_doSpin()
    iter++
    old = m.state
    continue
}

如果不能进行自旋操作,进入下面的逻辑:

如果 mutex 当前处于正常模式,将 new 的第一位即锁位设置为 1;如果 mutex 当前已经被加锁或处于饥饿模式,则当前 goroutine 进入等待队列;如果 mutex 当前处于饥饿模式,而且 mutex 已被加锁,则将 new 的第三位即饥饿模式位设置为 1。

new := old
// 不要尝试获取处于饥饿模式的锁,新到达的 goroutine 们必须排队。
if old&mutexStarving == 0 {
    new |= mutexLocked
}
// 没有获取到锁,当前 goroutine 进入等待队列。
// old & 0101 != 0,那么 old 的第一位和第三位至少有一个为 1,即 mutex 已加锁或处于饥饿模式。
if old&(mutexLocked|mutexStarving) != 0 {
    new += 1 << mutexWaiterShift
}
// 当前 goroutine 将 mutex 切换到饥饿模式。但如果当前 mutex 是解锁状态,不要切换。
// Unlock 期望处于饥饿模式的 mutex 有等待者,在这种情况下不会这样。
if starving && old&mutexLocked != 0 {
    new |= mutexStarving
}

设置好 new 后,继续下面的逻辑:

当 goroutine 被唤醒时,如果 new 还没有被唤醒,则发生了不一致的 mutex 状态,抛出错误;否则就重置 new 的第二位即唤醒位为 0。

if awoke {
    if new&mutexWoken == 0 {
        throw("sync: inconsistent mutex state")
    }
    new &^= mutexWoken
}

接下来会调用 CAS 来将 mutex 当前状态由 old 更新为 new:

如更新成功,old&(mutexLocked|mutexStarving) == 0 表示 mutex 未锁定且未处于饥饿模式,则 break 跳出循环,当前 goroutine 获取到锁。

如果当前的 goroutine 之前已经在排队了,就排到队列的前面。runtime_SemacquireMutex(&m.sema, queueLifo) 这个函数就是做插队操作的,如果 queueLifo == true,就把当前 goroutine 插入到等待队列的前面。

继续往下,如果 mutex 当前是处于饥饿模式,则修改等待的 goroutine 数量和第三位即饥饿模式位,break 跳出循环,当前 goroutine 获取到锁;如果是正常模式,继续循环。

if atomic.CompareAndSwapInt32(&m.state, old, new) {
    // old & 0101 == 0,old 的第一位和第三位必定不是 1,即 mutex 未锁定且未处于饥饿模式。
    if old&(mutexLocked|mutexStarving) == 0 {
        break // locked the mutex with CAS
    }
  
    // If we were already waiting before, queue at the front of the queue.
    queueLifo := waitStartTime != 0
    if waitStartTime == 0 {
        // 之前没排过队,开始计时。
        waitStartTime = runtime_nanotime()
    }
    runtime_SemacquireMutex(&m.sema, queueLifo)
  
    // 确定 mutex 当前所处模式
    starving = starving || runtime_nanotime()-waitStartTime > starvationThresholdNs
    old = m.state
    if old&mutexStarving != 0 {
        // If this goroutine was woken and mutex is in starvation mode,
        // ownership was handed off to us but mutex is in somewhat
        // inconsistent state: mutexLocked is not set and we are still
        // accounted as waiter. Fix that.
        if old&(mutexLocked|mutexWoken) != 0 || old>>mutexWaiterShift == 0 {
            throw("sync: inconsistent mutex state")
        }
        delta := int32(mutexLocked - 1<<mutexWaiterShift)
        // 如果不是饥饿模式或只剩一个等待者了,退出饥饿模式
        if !starving || old>>mutexWaiterShift == 1 {
            // Exit starvation mode.
            // Critical to do it here and consider wait time.
            // Starvation mode is so inefficient, that two goroutines
            // can go lock-step infinitely once they switch mutex
            // to starvation mode.
            delta -= mutexStarving
        }
        atomic.AddInt32(&m.state, delta)
        break
    }
    // 未处于饥饿模式,让新到来的 goroutine 先获取锁,继续循环
    awoke = true
    iter = 0
} else {
    // 上面的 CAS 没有成功更新为 new,记录当前状态,继续循环
    old = m.state
}

Unlock

Unlock 的代码比较少,直接在代码中注释:

func (m *Mutex) Unlock() {
    if race.Enabled {
        _ = m.state
        race.Release(unsafe.Pointer(m))
    }

    // Fast path: drop lock bit.
    // 将 mutex 当前状态第一位即锁位置为 0 保存到 new
    new := atomic.AddInt32(&m.state, -mutexLocked)
    // 当 new 状态锁位为 1 时会满足此条件,即对未加锁状态的 mutex 进行解锁,抛出错误
    if (new+mutexLocked)&mutexLocked == 0 {
        throw("sync: unlock of unlocked mutex")
    }
    // 如果未处于饥饿模式
    if new&mutexStarving == 0 {
        old := new
        for {
            // 如果没有等待者,或者一个 goroutine 已经被唤醒或获取到锁,或处于饥饿模式,
            // 无需唤醒任何其它被挂起的 goroutine。
            // 在饥饿模式中,所有权直接从执行解锁的 goroutine 传递给下一个等待者。
            if old>>mutexWaiterShift == 0 || old&(mutexLocked|mutexWoken|mutexStarving) != 0 {
                return
            }

            // 等待者数量减 1,并将唤醒位改成 1
            new = (old - 1<<mutexWaiterShift) | mutexWoken
            if atomic.CompareAndSwapInt32(&m.state, old, new) {
                // 唤醒一个阻塞的 goroutine,但不是唤醒第一个等待者
                runtime_Semrelease(&m.sema, false)
                return
            }
            old = m.state
        }
    } else {
        // 饥饿模式:将 mutex 所有权传递给下个等待者。
        // 注意:mutexLocked 没有设置,等待者将在被唤醒后设置它。
        // 但是如果设置了 mutexStarving,仍然认为 mutex 是锁定的,所以新来的 goroutine 不会获取到它。
        runtime_Semrelease(&m.sema, true)
    }
}

参考

  1. Data Race Detector
  2. Golang 互斥锁内部实现
  3. 信号量,锁和 golang 相关源码分析
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,968评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,601评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,220评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,416评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,425评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,144评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,432评论 3 401
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,088评论 0 261
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,586评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,028评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,137评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,783评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,343评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,333评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,559评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,595评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,901评论 2 345

推荐阅读更多精彩内容