learn-tech/专栏/Go语言项目开发实战/19错误处理(下):如何设计错误包?.md
2024-10-16 00:01:16 +08:00

26 KiB
Raw Blame History

                        因收到Google相关通知网站将会择期关闭。相关通知内容
                        
                        
                        19 错误处理(下):如何设计错误包?
                        你好,我是孔令飞。

在Go项目开发中错误是我们必须要处理的一个事项。除了我们上一讲学习过的错误码处理错误也离不开错误包。

业界有很多优秀的、开源的错误包可供选择例如Go标准库自带的errors包、github.com/pkg/errors包。但是这些包目前还不支持业务错误码很难满足生产级应用的需求。所以在实际开发中我们有必要开发出适合自己错误码设计的错误包。当然我们也没必要自己从0开发可以基于一些优秀的包来进行二次封装。

这一讲里,我们就来一起看看,如何设计一个错误包来适配上一讲我们设计的错误码,以及一个错误码的具体实现。

错误包需要具有哪些功能?

要想设计一个优秀的错误包,我们首先得知道一个优秀的错误包需要具备哪些功能。在我看来,至少需要有下面这六个功能:

首先应该能支持错误堆栈。我们来看下面一段代码假设保存在bad.go文件中

package main

import ( "fmt" "log" )

func main() { if err := funcA(); err != nil { log.Fatalf("call func got failed: %v", err) return }

log.Println("call func success")

}

func funcA() error { if err := funcB(); err != nil { return err }

return fmt.Errorf("func called error")

}

func funcB() error { return fmt.Errorf("func called error") }

执行上面的代码:

$ go run bad.go 2021/07/02 08:06:55 call func got failed: func called error exit status 1

这时我们想定位问题但不知道具体是哪行代码报的错误只能靠猜还不一定能猜到。为了解决这个问题我们可以加一些Debug信息来协助我们定位问题。这样做在测试环境是没问题的但是在线上环境一方面修改、发布都比较麻烦另一方面问题可能比较难重现。这时候我们会想要是能打印错误的堆栈就好了。例如

2021/07/02 14:17:03 call func got failed: func called error main.funcB /home/colin/workspace/golang/src/github.com/marmotedu/gopractise-demo/errors/good.go:27 main.funcA /home/colin/workspace/golang/src/github.com/marmotedu/gopractise-demo/errors/good.go:19 main.main /home/colin/workspace/golang/src/github.com/marmotedu/gopractise-demo/errors/good.go:10 runtime.main /home/colin/go/go1.16.2/src/runtime/proc.go:225 runtime.goexit /home/colin/go/go1.16.2/src/runtime/asm_amd64.s:1371 exit status 1

通过上面的错误输出我们可以很容易地知道是哪行代码报的错从而极大提高问题定位的效率降低定位的难度。所以在我看来一个优秀的errors包首先需要支持错误堆栈。

其次,能够支持不同的打印格式。例如%+v、%v、%s等格式可以根据需要打印不同丰富度的错误信息。

再次能支持Wrap/Unwrap功能也就是在已有的错误上追加一些新的信息。例如errors.Wrap(err, "open file failed") 。Wrap通常用在调用函数中调用函数可以基于被调函数报错时的错误Wrap一些自己的信息丰富报错信息方便后期的错误定位例如

func funcA() error { if err := funcB(); err != nil { return errors.Wrap(err, "call funcB failed") }

return errors.New("func called error")

}

func funcB() error { return errors.New("func called error") }

这里要注意不同的错误类型Wrap函数的逻辑也可以不同。另外在调用Wrap时也会生成一个错误堆栈节点。我们既然能够嵌套error那有时候还可能需要获取被嵌套的error这时就需要错误包提供Unwrap函数。

还有错误包应该有Is方法。在实际开发中我们经常需要判断某个error是否是指定的error。在Go 1.13之前也就是没有wrapping error的时候我们要判断error是不是同一个可以使用如下方法

if err == os.ErrNotExist { // normal code }

但是现在因为有了wrapping error这样判断就会有问题。因为你根本不知道返回的err是不是一个嵌套的error嵌套了几层。这种情况下我们的错误包就需要提供Is函数

func Is(err, target error) bool

当err和target是同一个或者err是一个wrapping error的时候如果target也包含在这个嵌套error链中返回true否则返回fasle。

另外,错误包应该支持 As 函数。

在Go 1.13之前没有wrapping error的时候我们要把error转为另外一个error一般都是使用type assertion或者type switch也就是类型断言。例如

if perr, ok := err.(*os.PathError); ok { fmt.Println(perr.Path) }

但是现在返回的err可能是嵌套的error甚至好几层嵌套这种方式就不能用了。所以我们可以通过实现 As 函数来完成这种功能。现在我们把上面的例子,用 As 函数实现一下:

var perr *os.PathError if errors.As(err, &perr) { fmt.Println(perr.Path) }

这样就可以完全实现类型断言的功能而且还更强大因为它可以处理wrapping error。

最后,能够支持两种错误创建方式:非格式化创建和格式化创建。例如:

errors.New("file not found") errors.Errorf("file %s not found", "iam-apiserver")

上面我们介绍了一个优秀的错误包应该具备的功能。一个好消息是Github上有不少实现了这些功能的错误包其中github.com/pkg/errors包最受欢迎。所以我基于github.com/pkg/errors包进行了二次封装用来支持上一讲所介绍的错误码。

错误包实现

明确优秀的错误包应该具备的功能后我们来看下错误包的实现。实现的源码存放在github.com/marmotedu/errors。

我通过在文件github.com/pkg/errors/errors.go中增加新的withCode结构体来引入一种新的错误类型该错误类型可以记录错误码、stack、cause和具体的错误信息。

type withCode struct { err error // error 错误 code int // 业务错误码 cause error // cause error *stack // 错误堆栈 }

下面我们通过一个示例来了解下github.com/marmotedu/errors所提供的功能。假设下述代码保存在errors.go文件中

package main

import ( "fmt"

"github.com/marmotedu/errors"
code "github.com/marmotedu/sample-code"

)

func main() { if err := bindUser(); err != nil { // %s: Returns the user-safe error string mapped to the error code or the error message if none is specified. fmt.Println("====================> %s <====================") fmt.Printf("%s\n\n", err)

	// %v: Alias for %s.
	fmt.Println("====================> %v <====================")
	fmt.Printf("%v\n\n", err)

	// %-v: Output caller details, useful for troubleshooting.
	fmt.Println("====================> %-v <====================")
	fmt.Printf("%-v\n\n", err)

	// %+v: Output full error stack details, useful for debugging.
	fmt.Println("====================> %+v <====================")
	fmt.Printf("%+v\n\n", err)

	// %#-v: Output caller details, useful for troubleshooting with JSON formatted output.
	fmt.Println("====================> %#-v <====================")
	fmt.Printf("%#-v\n\n", err)

	// %#+v: Output full error stack details, useful for debugging with JSON formatted output.
	fmt.Println("====================> %#+v <====================")
	fmt.Printf("%#+v\n\n", err)

	// do some business process based on the error type
	if errors.IsCode(err, code.ErrEncodingFailed) {
		fmt.Println("this is a ErrEncodingFailed error")
	}

	if errors.IsCode(err, code.ErrDatabase) {
		fmt.Println("this is a ErrDatabase error")
	}

	// we can also find the cause error
	fmt.Println(errors.Cause(err))
}

}

func bindUser() error { if err := getUser(); err != nil { // Step3: Wrap the error with a new error message and a new error code if needed. return errors.WrapC(err, code.ErrEncodingFailed, "encoding user 'Lingfei Kong' failed.") }

return nil

}

func getUser() error { if err := queryDatabase(); err != nil { // Step2: Wrap the error with a new error message. return errors.Wrap(err, "get user failed.") }

return nil

}

func queryDatabase() error { // Step1. Create error with specified error code. return errors.WithCode(code.ErrDatabase, "user 'Lingfei Kong' not found.") }

上述代码中通过WithCode函数来创建新的withCode类型的错误通过WrapC来将一个error封装成一个withCode类型的错误通过IsCode来判断一个error链中是否包含指定的code。

withCode错误实现了一个func (w *withCode) Format(state fmt.State, verb rune)方法,该方法用来打印不同格式的错误信息,见下表:

例如,%+v会打印以下错误信息

get user failed. - #1 [/home/colin/workspace/golang/src/github.com/marmotedu/gopractise-demo/errors/errortrack_errors.go:19 (main.getUser)] (100101) Database error; user 'Lingfei Kong' not found. - #0 [/home/colin/workspace/golang/src/github.com/marmotedu/gopractise-demo/errors/errortrack_errors.go:26 (main.queryDatabase)] (100101) Database error

那么你可能会问这些错误信息中的100101错误码还有Database error这种对外展示的报错信息等等是从哪里获取的这里我简单解释一下。

首先, withCode 中包含了int类型的错误码例如100101。

其次当使用github.com/marmotedu/errors包的时候需要调用Register或者MustRegister将一个Coder注册到github.com/marmotedu/errors开辟的内存中数据结构为

var codes = map[int]Coder{}

Coder是一个接口定义为

type Coder interface { // HTTP status that should be used for the associated error code. HTTPStatus() int

// External (user) facing error text.
String() string

// Reference returns the detail documents for user.
Reference() string

// Code returns the code of the coder
Code() int

}

这样 withCode 的Format方法就能够通过 withCode 中的code字段获取到对应的Coder并通过Coder提供的HTTPStatus、String、Reference、Code函数来获取 withCode 中code的详细信息最后格式化打印。

这里要注意我们实现了两个注册函数Register和MustRegister二者唯一区别是当重复定义同一个错误Code时MustRegister会panic这样可以防止后面注册的错误覆盖掉之前注册的错误。在实际开发中建议使用MustRegister。

XXX()和MustXXX()的函数命名方式是一种Go代码设计技巧在Go代码中经常使用例如Go标准库中regexp包提供的Compile和MustCompile函数。和XXX相比MustXXX 会在某种情况不满足时panic。因此使用MustXXX的开发者看到函数名就会有一个心理预期使用不当会造成程序panic。

最后我还有一个建议在实际的生产环境中我们可以使用JSON格式打印日志JSON格式的日志可以非常方便的供日志系统解析。我们可以根据需要选择%#-v或%#+v两种格式。

错误包在代码中经常被调用所以我们要保证错误包一定要是高性能的否则很可能会影响接口的性能。这里我们再来看下github.com/marmotedu/errors包的性能。

在这里我们把这个错误包跟go标准库的 errors 包,以及 github.com/pkg/errors 包进行对比,来看看它们的性能:

$ go test -test.bench=BenchmarkErrors -benchtime="3s" goos: linux goarch: amd64 pkg: github.com/marmotedu/errors BenchmarkErrors/errors-stack-10-8 57658672 61.8 ns/op 16 B/op 1 allocs/op BenchmarkErrors/pkg/errors-stack-10-8 2265558 1547 ns/op 320 B/op 3 allocs/op BenchmarkErrors/marmot/errors-stack-10-8 1903532 1772 ns/op 360 B/op 5 allocs/op BenchmarkErrors/errors-stack-100-8 4883659 734 ns/op 16 B/op 1 allocs/op BenchmarkErrors/pkg/errors-stack-100-8 1202797 2881 ns/op 320 B/op 3 allocs/op BenchmarkErrors/marmot/errors-stack-100-8 1000000 3116 ns/op 360 B/op 5 allocs/op BenchmarkErrors/errors-stack-1000-8 505636 7159 ns/op 16 B/op 1 allocs/op BenchmarkErrors/pkg/errors-stack-1000-8 327681 10646 ns/op 320 B/op 3 allocs/op BenchmarkErrors/marmot/errors-stack-1000-8 304160 11896 ns/op 360 B/op 5 allocs/op PASS ok github.com/marmotedu/errors 39.200s

可以看到github.com/marmotedu/errors和github.com/pkg/errors包的性能基本持平。在对比性能时重点关注ns/op也即每次error操作耗费的纳秒数。另外我们还需要测试不同error嵌套深度下的error操作性能嵌套越深性能越差。例如在嵌套深度为10的时候 github.com/pkg/errors 包ns/op值为1547 github.com/marmotedu/errors 包ns/op值为1772。可以看到二者性能基本保持一致。

具体性能数据对比见下表:

我们是通过BenchmarkErrors测试函数来测试error包性能的你感兴趣可以打开链接看看。

如何记录错误?

上面,我们一起看了怎么设计一个优秀的错误包,那如何用我们设计的错误包来记录错误呢?

根据我的开发经验,我推荐两种记录错误的方式,可以帮你快速定位问题。

方式一通过github.com/marmotedu/errors包提供的错误堆栈能力来跟踪错误。

具体你可以看看下面的代码示例。以下代码保存在errortrack_errors.go中。

package main

import ( "fmt"

"github.com/marmotedu/errors"

code "github.com/marmotedu/sample-code"

)

func main() { if err := getUser(); err != nil { fmt.Printf("%+v\n", err) } }

func getUser() error { if err := queryDatabase(); err != nil { return errors.Wrap(err, "get user failed.") }

return nil

}

func queryDatabase() error { return errors.WithCode(code.ErrDatabase, "user 'Lingfei Kong' not found.") }

执行上述的代码:

$ go run errortrack_errors.go get user failed. - #1 [/home/colin/workspace/golang/src/github.com/marmotedu/gopractise-demo/errors/errortrack_errors.go:19 (main.getUser)] (100101) Database error; user 'Lingfei Kong' not found. - #0 [/home/colin/workspace/golang/src/github.com/marmotedu/gopractise-demo/errors/errortrack_errors.go:26 (main.queryDatabase)] (100101) Database error

可以看到,打印的日志中打印出了详细的错误堆栈,包括错误发生的函数、文件名、行号和错误信息,通过这些错误堆栈,我们可以很方便地定位问题。

你使用这种方法时,我推荐的用法是,在错误最开始处使用 errors.WithCode() 创建一个 withCode类型的错误。上层在处理底层返回的错误时可以根据需要使用Wrap函数基于该错误封装新的错误信息。如果要包装的error不是用github.com/marmotedu/errors包创建的建议用 errors.WithCode() 新建一个error。

方式二在错误产生的最原始位置调用日志包记录函数打印错误信息其他位置直接返回当然也可以选择性的追加一些错误信息方便故障定位。示例代码保存在errortrack_log.go如下

package main

import ( "fmt"

"github.com/marmotedu/errors"
"github.com/marmotedu/log"

code "github.com/marmotedu/sample-code"

)

func main() { if err := getUser(); err != nil { fmt.Printf("%v\n", err) } }

func getUser() error { if err := queryDatabase(); err != nil { return err }

return nil

}

func queryDatabase() error { opts := &log.Options{ Level: "info", Format: "console", EnableColor: true, EnableCaller: true, OutputPaths: []string{"test.log", "stdout"}, ErrorOutputPaths: []string{}, }

log.Init(opts)
defer log.Flush()

err := errors.WithCode(code.ErrDatabase, "user 'Lingfei Kong' not found.")
if err != nil {
	log.Errorf("%v", err)
}
return err

}

执行以上代码:

$ go run errortrack_log.go 2021-07-03 14:37:31.597 ERROR errors/errortrack_log.go:41 Database error Database error

当错误发生时调用log包打印错误。通过log包的caller功能可以定位到log语句的位置也就是定位到错误发生的位置。你使用这种方式来打印日志时我有两个建议。

只在错误产生的最初位置打印日志,其他地方直接返回错误,一般不需要再对错误进行封装。 当代码调用第三方包的函数时,第三方包函数出错时打印错误信息。比如:

if err := os.Chdir("/root"); err != nil { log.Errorf("change dir failed: %v", err) }

一个错误码的具体实现

接下来我们看一个依据上一讲介绍的错误码规范的具体错误码实现github.com/marmotedu/sample-code。

sample-code实现了两类错误码分别是通用错误码sample-code/base.go和业务模块相关的错误码sample-code/apiserver.go

首先,我们来看通用错误码的定义:

// 通用: 基本错误 // Code must start with 1xxxxx const ( // ErrSuccess - 200: OK. ErrSuccess int = iota + 100001

// ErrUnknown - 500: Internal server error.
ErrUnknown

// ErrBind - 400: Error occurred while binding the request body to the struct.
ErrBind

// ErrValidation - 400: Validation failed.
ErrValidation

// ErrTokenInvalid - 401: Token invalid.
ErrTokenInvalid

)

在代码中我们通常使用整型常量ErrSuccess来代替整型错误码100001因为使用ErrSuccess时一看就知道它代表的错误类型可以方便开发者使用。

错误码用来指代一个错误类型该错误类型需要包含一些有用的信息例如对应的HTTP Status Code、对外展示的Message以及跟该错误匹配的帮助文档。所以我们还需要实现一个Coder来承载这些信息。这里我们定义了一个实现了github.com/marmotedu/errors.Coder接口的ErrCode结构体

// ErrCode implements github.com/marmotedu/errors.Coder interface. type ErrCode struct { // C refers to the code of the ErrCode. C int

// HTTP status that should be used for the associated error code.
HTTP int

// External (user) facing error text.
Ext string

// Ref specify the reference document.
Ref string

}

可以看到ErrCode结构体包含了以下信息

int类型的业务码。 对应的HTTP Status Code。 暴露给外部用户的消息。 错误的参考文档。

下面是一个具体的Coder示例

coder := &ErrCode{ C: 100001, HTTP: 200, Ext: "OK", Ref: "https://github.com/marmotedu/sample-code/blob/master/README.md", }

接下来我们就可以调用github.com/marmotedu/errors包提供的Register或者MustRegister函数将Coder注册到github.com/marmotedu/errors包维护的内存中。

一个项目有很多个错误码如果每个错误码都手动调用MustRegister函数会很麻烦这里我们通过代码自动生成的方法来生成register函数调用

//go:generate codegen -type=int //go:generate codegen -type=int -doc -output ./error_code_generated.md

//go:generate codegen -type=int 会调用codegen工具生成sample_code_generated.go源码文件

func init() { register(ErrSuccess, 200, "OK") register(ErrUnknown, 500, "Internal server error") register(ErrBind, 400, "Error occurred while binding the request body to the struct") register(ErrValidation, 400, "Validation failed") // other register function call }

这些register调用放在init函数中在加载程序的时候被初始化。

这里要注意在注册的时候我们会检查HTTP Status Code只允许定义200、400、401、403、404、500这6个HTTP错误码。这里通过程序保证了错误码是符合HTTP Status Code使用要求的。

//go:generate codegen -type=int -doc -output ./error_code_generated.md会生成错误码描述文档 error_code_generated.md。当我们提供API文档时也需要记着提供一份错误码描述文档这样客户端才可以根据错误码知道请求是否成功以及具体发生哪类错误好针对性地做一些逻辑处理。

codegen工具会根据错误码注释生成sample_code_generated.go和error_code_generated.md文件

// ErrSuccess - 200: OK. ErrSuccess int = iota + 100001

codegen工具之所以能够生成sample_code_generated.go和error_code_generated.md是因为我们的错误码注释是有规定格式的// <错误码整型常量> - <对应的HTTP Status Code>: .。

codegen工具可以在IAM项目根目录下执行以下命令来安装

$ make tools.install.codegen

安装完 codegen 工具后,可以在 github.com/marmotedu/sample-code 包根目录下执行 go generate 命令来生成sample_code_generated.go和error_code_generated.md。这里有个技巧需要你注意生成的文件建议统一用 xxxx_generated.xx 来命名,这样通过 generated ,我们就知道这个文件是代码自动生成的,有助于我们理解和使用。

在实际的开发中,我们可以将错误码独立成一个包,放在 internal/pkg/code/目录下这样可以方便整个应用调用。例如IAM的错误码就放在IAM项目根目录下的internal/pkg/code/目录下。

我们的错误码是分服务和模块的所以这里建议你把相同的服务放在同一个Go源文件中例如IAM的错误码存放文件

$ ls base.go apiserver.go authzserver.go apiserver.go authzserver.go base.go

一个应用中会有多个服务例如IAM应用中就包含了iam-apiserver、iam-authz-server、iam-pump三个服务。这些服务有一些通用的错误码为了便于维护可以将这些通用的错误码统一放在base.go源码文件中。其他的错误码我们可以按服务分别放在不同的文件中iam-apiserver服务的错误码统一放在apiserver.go文件中iam-authz-server的错误码统一存放在authzserver.go文件中。其他服务以此类推。

另外同一个服务中不同模块的错误码可以按以下格式来组织相同模块的错误码放在同一个const代码块中不同模块的错误码放在不同的const代码块中。每个const代码块的开头注释就是该模块的错误码定义。例如

// iam-apiserver: user errors. const ( // ErrUserNotFound - 404: User not found. ErrUserNotFound int = iota + 110001

// ErrUserAlreadyExist - 400: User already exist.
ErrUserAlreadyExist

)

// iam-apiserver: secret errors. const ( // ErrEncrypt - 400: Secret reach the max count. ErrReachMaxCount int = iota + 110101

//  ErrSecretNotFound - 404: Secret not found.
ErrSecretNotFound

)

最后我们还需要将错误码定义记录在项目的文件中供开发者查阅、遵守和使用例如IAM项目的错误码定义记录文档为code_specification.md。这个文档中记录了错误码说明、错误描述规范和错误记录规范等。

错误码实际使用方法示例

上面我讲解了错误包和错误码的实现方式那你一定想知道在实际开发中我们是如何使用的。这里我就举一个在gin web框架中使用该错误码的例子

// Response defines project response format which in marmotedu organization. type Response struct { Code errors.Code json:"code,omitempty" Message string json:"message,omitempty" Reference string json:"reference,omitempty" Data interface{} json:"data,omitempty" }

// WriteResponse used to write an error and JSON data into response. func WriteResponse(c *gin.Context, err error, data interface{}) { if err != nil { coder := errors.ParseCoder(err)

    c.JSON(coder.HTTPStatus(), Response{
        Code:      coder.Code(),
        Message:   coder.String(),
        Reference: coder.Reference(),
        Data:      data,
    })
}

c.JSON(http.StatusOK, Response{Data: data})

}

func GetUser(c *gin.Context) { log.Info("get user function called.", "X-Request-Id", requestid.Get(c)) // Get the user by the username from the database. user, err := store.Client().Users().Get(c.Param("username"), metav1.GetOptions{}) if err != nil { core.WriteResponse(c, errors.WithCode(code.ErrUserNotFound, err.Error()), nil) return }

core.WriteResponse(c, nil, user)

}

上述代码中通过WriteResponse统一处理错误。在 WriteResponse 函数中如果err != nil则从error中解析出Coder并调用Coder提供的方法获取错误相关的Http Status Code、int类型的业务码、暴露给用户的信息、错误的参考文档链接并返回JSON格式的信息。如果 err == nil 则返回200和数据。

总结

记录错误是应用程序必须要做的一件事情在实际开发中我们通常会封装自己的错误包。一个优秀的错误包应该能够支持错误堆栈、不同的打印格式、Wrap/Unwrap/Is/As等函数并能够支持格式化创建error。

根据这些错误包设计要点,我基于 github.com/pkg/errors 包设计了IAM项目的错误包 github.com/marmotedu/errors ,该包符合我们上一讲设计的错误码规范。

另外,本讲也给出了一个具体的错误码实现 sample-code sample-code 支持业务Code码、HTTP Status Code、错误参考文档、可以对内对外展示不同的错误信息。

最后因为错误码注释是有固定格式的所以我们可以通过codegen工具解析错误码的注释生成register函数调用和错误码文档。这种做法也体现了我一直强调的low code思想可以提高开发效率减少人为失误。

课后练习

在这门课里我们定义了base、iam-apiserver服务的错误码请试着定义iam-authz-server服务的错误码并生成错误码文档。 思考下,这门课的错误包和错误码设计能否满足你当前的项目需求,如果觉得不能满足,可以在留言区分享你的看法。

欢迎你在留言区与我交流讨论,我们下一讲见。