错误码收集以及gRPC中的错误码转化

最近项目中为了将具体出错信息向前端暴露出来,所以需要定义具体的错误码格式,主要有如下几个问题需要解决。

  1. 错误码的定义。
  2. 因为错误码是分布在代码的各个模块中,因此最好使用自动化代码生成工具将错误码收集起来,类似与K8S中的根据相应的tag来生成代码。
  3. 由于底层很多命令是通过gRPC调用来完成的,如何将错误码和错误信息返回给客户端也是需要解决的问题。默认情况下client端返回给server端的错误码是经过封装处理的。

错误码的定义

  • 错误码是按照各组件来划分的,其格式为:AA-BB-CCCC

    • A: 项目或模块名称; 比如rbd, ceph, docker, disk等。
    • B: 具体子模块;比如rbd中的volume,snapshot, volume migration等等。
    • C: 具体错误编号;自增且唯一表示具体某一种错误。
  • 注意以下规范:

    1. 错误码的格式为16进制大写,例如1A-F3-001C
    2. AA-BB-CCCC中子模块BB如果为01则表示common的部分。例如02-01-XXXX表示一些通用的rbd错误码。
    3. 0000保留不使用,0001统一表示unspecified error。每个子模块有自己的0001编码,代表属于这个子模块的unspecified error

错误码

错误码分散于各模块中,错误码定义在xxx_error.go文件中,其中xxx代表对应的模块。其格式如下:

// ErrCodeRbd defines the id of rbd module
// +ErrCode
const ErrCodeRbd = 0x02
 
// the sub module of rbd
// +ErrCode=Rbd
const (
    ErrCodeRbdCommon = iota + 1
    ErrCodeRbdVolume
    ErrCodeRbdSnapshot
    ErrCodeRbdVolumeMigration
    ErrCodeRbdReplication
    ErrCodeRbdTrash
)
 
// list of rbd common error codes
// +ErrCode=Rbd,Common
const (
    ErrCodeRbdCommonUnspecifiedError = iota + 1
)
 
// ErrCodeRbdCommonToMessage is map of common error code to their messages
var ErrCodeRbdCommonToMessage = map[int]string{
    ErrCodeRbdCommonUnspecifiedError: "the %s operation failed due to unspecified error",
}
......

错误码文件中的内容大致如下:

  1. 首先定义的是模块ID,其为常量类型,命名时以ErrCode开头,后面跟着模块名,例如Rbd。命名格式为:ErrCodeAA。 value部分为16进制值。
  2. 接着是子模块的定义,01代表common,然后根据各子模块进行扩展即可。命名格式为:ErrCodeAABB
  3. 接着是各子模块对应的具体错误ID。命名格式为:ErrCodeAABBCC
  4. 接着是错误ID对应的message信息。命名格式为:ErrCodeAABBToMessage

错误码中Tag的设置

由于错误码分散在代码的各个模块中,为了更好的收集所有的错误码并生成对应的json文件供前端使用,所以采用的是k8s方案中的gengo自动化代码生成。代码分支见microyahoo/gengo

Tag的定义

如上面的代码片段所示,tag紧挨着const定义,以+ErrCode开头。
例如上面定义了三个tag

// +ErrCode  加在模块的上面,代表这是具体的一个模块。
// +ErrCode=Rbd 加在具体的子模块上面,代表这是模块下的子模块信息,可能有多个。
// +ErrCode=Rbd,Common 加在具体子模块对应的错误信息上面,代表子模块有很多具体的错误信息

其中第二个tag以+ErrCode开头,后面跟着具体的模块,是以键值对的形式展示的。第三个tag也是以+ErrCode开头,后面跟着具体的模块以及子模块,其中模块和子模块之间以逗号分隔,中间没有空格。

自动化生成的json文件如下:

{
    "01-01-0001": {
        "desc": "CommonUnspecifiedError"
    },
    "01-01-0002": {
        "desc": "CommonJSONUnmarshalError"
    },
    "01-01-0003": {
        "desc": "CommonJSONMarshalError"
    },
    "02-01-0001": {
        "desc": "RbdCommonUnspecifiedError"
    },
    "02-02-0001": {
        "desc": "RbdVolumeUnknownParameter"
    },
    "02-02-0002": {
        "desc": "RbdVolumeNoEntry"
    }
}

gRPC error处理

由于代码中运用了很多gRPC调用去其他节点执行相应的命令,而gRPC server会将我们执行命令返回结果的错误信息封装成statusError,这样客户端拿到的error是处理之后的,不是我们上述自定义的error,因此也就无法获取定义的错误码和其他自定义的错误信息。具体可以参见google.golang.org/grpc/status/status.go文件。

 41 // statusError is an alias of a status proto.  It implements error and Status,
 42 // and a nil statusError should never be returned by this package.
 43 type statusError spb.Status
 44
 45 func (se *statusError) Error() string {
 46     p := (*spb.Status)(se)
 47     return fmt.Sprintf("rpc error: code = %s desc = %s", codes.Code(p.GetCode()), p.GetMessage())
 48 }
 49
 50 func (se *statusError) GRPCStatus() *Status {
 51     return &Status{s: (*spb.Status)(se)}
 52 }

此问题可以通过分别在server和client端添加自定义的一元拦截器进行处理。过程大致如下:

  1. client端发起gRPC调用,server接收请求后执行相应的命令,如果执行失败将错误信息中的错误码和错误信息进行封装成可序列化的。error.proto文件定义如下所示,这样生成的error.pb.go中的Error实现了proto.Message接口,可被序列化之后被client接收并解析。
  1 syntax = "proto3";
  2
  3 package pb;
  4
  5 message Error {
  6   string code = 1;
  7   string message = 2;
  8   string details = 3;
  9 }

server端一元拦截器如下所示:

// ServerErrorInterceptor transfer a error to status error
func ServerErrorInterceptor(ctx context.Context, req interface{},
    info *grpc.UnaryServerInfo, handler grpc.UnaryHandler) (interface{}, error) {
    resp, err := handler(ctx, req)
    return resp, toStatusError(err)
}

func toStatusError(err error) error {
    if err == nil {
        return nil
    }
    cause := errors.Cause(err)
    pbErr := &pb.Error{
        Details: cause.Error(),
    }
    if coder, ok := cause.(errors.Coder); ok {
        pbErr.Code = coder.Code()
        pbErr.Message = coder.Message()
        pbErr.Details = coder.Details()
    }
    st := status.New(codes.Internal, cause.Error())
    st, e := st.WithDetails(pbErr)
    if e != nil {
        // make sure pbErr implements proto.Message interface
        return errors.NewCommonError(errors.ErrCodeCommonJSONMarshalError, e, pbErr.String())
    }
    return st.Err()
}

Server端的拦截器主要是将我们定义的带错误码的error转化为可被序列化的rpc pb.Error,然后调用Status.WithDetails()进行序列化,这样client端拦截器拿到序列化后的pb.Error,返回我们一个实现了errors.Coder接口的error。这样client就能获取定义的错误码,错误信息等等。

  1. client一元拦截器收到server端返回的错误信息后进行解析。
func ClientErrorInterceptor(ctx context.Context, method string, req, reply interface{},
    cc *grpc.ClientConn, invoker grpc.UnaryInvoker, opts ...grpc.CallOption) error {
    err := invoker(ctx, method, req, reply, cc, opts...)
    if err == nil {
        return nil
    }
    cause := errors.Cause(err)
    st, ok := status.FromError(cause)
    if ok {
        details := st.Details()
        if details != nil && len(details) > 0 {
            if pbErr, ok := details[0].(*pb.Error); ok {
                return newRPCClientError(pbErr.Code, pbErr.Message, pbErr.Details)
            }
        }
    }
    return err
}

一元拦截器在执行完调用后对错误信息进行处理,其中status.FromError从错误信息中获取Status,而Status.Details()方法会将错误信息反序列化成我们前面定义的pb.Error,这样我们就能拿到定义的错误码,错误信息,以及details了。

References

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,386评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,142评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,704评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,702评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,716评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,573评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,314评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,230评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,680评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,873评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,991评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,706评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,329评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,910评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,038评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,158评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,941评论 2 355

推荐阅读更多精彩内容