the-go-programming-language/

Details

Valid go.mod file
Redistributable license
Tagged version
Stable version
Learn more about best practices

Repository

github.com/wangyoucao577/golang_test

Links

Open Source Insights

README ¶

The Go Programming Language

我的The Go Programming Language读书笔记及实验代码.

实验平台

Linux: Ubuntu 16.04.4 LTS
- Kernel 4.13.0-36-generic
- go version go1.9.4 linux/amd64

学习笔记

基本点

Go是一门编译型语言，且仅支持静态编译链接（不支持动态链接）
Go原生支持unicode
Go的编译没有警告, 要么pass, 要么error
- Go语言不允许 unused local variable, 否则会报编译错误
- import但未被引用的包, 会导致编译错误
Go的代码通过package组织(类似于其他语言的modules 或 libraries)
- 一个package由位于单个目录下的一个或多个.go生成
  - 每个目录只包含一个package
- 通常目录最后一段的名字即为package的名字.
  - 因此即使两个包的导入路径不同, 它们依然可能有一个相同的名字.
    - 导入的包可以重命名, 从而解决这个问题. 导入包的重命名只影响当前的源文件.
  - 有三种例外情况:
    - 包对应一个可执行程序, 也就是main包
    - 包目录中有test相关内容(i.e. 包目录中有一些以_test.go为后缀的源文件, 且它们的包名也以_test结尾)
    - 导入路径后可能追加了版本信息
- 而package xxx中的xxx为命名空间(引用名)
- 按照惯例是导入路径的最后一段与命名空间一致
- 包也支持匿名导入, 即以_重命名导入的包.
  - 通常用于实现一个编译时的机制, 即通过在main()主程序入口处选择性地导入附加的包.
  - 实现原理为, 编译时检测到import的包时, 会调用包的init()函数进行初始化. 而此时即可在init()中插入一些注册代码以实现此机制.
- Go语言的构建工具对包含internal名字的路径段的包的导入路径做了特殊处理:
  - 这种包叫做internal包
  - 一个internal包只能被和internal目录有同一个父目录的包所导入.
    - 例如, net/http/internal/chunked这个internal包只能被net/http/httputil或net/http导入, 但不能被net/url包打入.
每个源文件都应
- 首先以 package xxx 开始，以定义此文件属于哪个package.
- 然后import xxx 导入所需要链接的package(import必须在package之后)
- 再然后才是此文件中的代码实现
package main，以及 func main
- package main定义了独立的可执行程序
- func main则定义了程序的入口函数
注释： //, /* */
Go中函数和包级别(package level entities)的变量/函数可以任意顺序声明, 并不影响其调用
变量的几种声明/初始化形式(声明即初始化)
- var s1, s2 string (声明2个string变量, 隐式初始化为""字符串. 若类型为int, 则隐式初始化为0)
- s1,s2 := "","" (声明2个变量s1 s2, 以空字符串""初始化, 于是即推导出其为string类型. 此种方式术语叫做 short variable declaration)
- var s1 = "" (冗余的 var, 使用的较少)
- var s1 string = "" (冗余的var 和string, 用的也比较少)
Go中的循环语句仅有for一种, 其有几种形式
- for initialization, condition, post {
  - 此种形式下, initialization/condition/post 均可以省略, 左大括号"{" 必须在 post 的同一行
- for index, arg := range os.Args[1:] {
  - 此种区间遍历形式, 提供索引和值两个参数. 若不需要其中某个, 经常是不需要 index, 可以用 blank identifier "_" 即下划线来代替(Go语言不允许unused local variable). 如 for _, arg := range os.Args[1:] {

Go的代码组织

(摘自How to Write Go Code的Code origanization章节原文, 非常好的入门文档, 强烈推荐!!)

Overview
- Go programmers typically keep all their Go code in a single workspace.
- A workspace contains many version control repositories (managed by Git, for example).
- Each repository contains one or more packages.
- Each package consists of one or more Go source files in a single directory.
- The path to a package's directory determines its import path.
- Note that this differs from other programming environments in which every project has a separate workspace and workspaces are closely tied to version control repositories.
Workspaces
- A workspace is a directory hierarchy with three directories at its root:
  - src contains Go source files,
  - pkg contains package objects, and
  - bin contains executable commands.
- The go tool builds source packages and installs the resulting binaries to the pkg and bin directories.
- The src subdirectory typically contains multiple version control repositories (such as for Git or Mercurial) that track the development of one or more source packages.
- To give you an idea of how a workspace looks in practice, here's an example:

bin/    
    hello                          # command executable    
    outyet                         # command executable    
pkg/    
    linux_amd64/    
        github.com/golang/example/    
            stringutil.a           # package object    
src/    
    github.com/golang/example/    
        .git/                      # Git repository     metadata    
	hello/    
	    hello.go               # command source    
	outyet/    
	    main.go                # command source    
	    main_test.go           # test source    
	stringutil/    
	    reverse.go             # package source    
	    reverse_test.go        # test source    
    golang.org/x/image/    
        .git/                      # Git repository     metadata    
	bmp/    
	    reader.go              # package source    
	    writer.go              # package source    
    ... (many more repositories and packages omitted) ...

Go的常用工具命令

Go提供了一系列的工具命令，都可以通过一个单独的go命令调用

go run：编译一个或多个 .go, 链接库文件, 并运行最终生成的可执行文件 (不会保留可执行文件)
go build: 编译由一个或多个 .go 组成的package
- 对于packge main, 生成可执行程序的binary
- 对于其他package, 忽略输出结果, 相当于编译检查.
go install: 编译一个或多个 .go 组成的package, 生成可执行程序或package, 并将其对应的安装到 bin/pkg 目录下供执行或其他程序链接
- 基本同go build, 但会保存生成的结果
- 因为编译对应不同的操作系统平台和CPU架构, go install命令会将编译结果安装到GOOS和GOARCH对应的目录.
- 如果一个文件名包含了一个操作系统或处理器类型名字, 例如net_linux.go或asm_amd64.s, Go语言的构建工具将只在对应的平台编译这些文件.
- 还有一个特别的构建注释(加在文件开头, 包声明或包注释前面)可以提供更多的构建过程控制, 如:
  - // +build linux darwin: 仅在linux或MacOSX上才编译这个文件
  - // +build ignore: 不编译这个文件
go test: 运行Go语言中的测试代码
- -v: verbose output
- -run="Regular Expression": 仅运行函数名和此正则表达式匹配的测试函数
- -coverprofile=c.out, -covermode=count, -cover: 同时生成测试覆盖率(语句覆盖率)的统计
- -bench="Regular Expression": 运行Benchmark测试函数
  - -benchmem: 在Benchmark的结果中包含内存的分配数据统计
- -cpuprofile=cpu.out: CPU Profile
- -blockprofile=block.out: Block Profile
- -memprofile=mem.out: Memory Profile
go get: 下载远程包源码并install
- 下载远程包源码时会Clone其repo, 而不是简单的拷贝源文件
- 直接支持Github, Bitbucket, Launchpad, 其他网站则可能需要配置版本控制系统的具体路径和协议).
- 需要注意的是导入路径含有的网站域名和本地Git仓库对应的远程服务地址并不一定相同, 因为页面中通常会提供真实的Git仓库托管地址
- 加上-u参数则go get会确保所有的包和依赖的包的版本都是最新的, 然后重新编译和安装它们.
gofmt: 格式化源代码，强制无参数的命令来统一go的代码格式, 默认行为为将diff的内容写到stdout，而要直接格式化源文件本身的话，加上 -w 选项
- gofmt -l -w .
goimports: 根据代码需要自动地添加或删除import
go doc: 打印包的声明和每个成员的文档注释
godoc(另一个命令): 提供可以相互交叉引用的HTML页面, 但是包含和go doc命令相同以及更多的信息. 且支持通过-analysis=type和-analysis=pointer参数打开文档和代码中关于静态分析的结果.
go env: 查看Go环境变量的值
go list: 查询可用包的信息
- 可以查看包对应的目录中哪些Go源文件是产品代码, 哪些是包内测试, 哪些是测试扩展包, 以下以fmt包为例:
  - go list -f={{.GoFiles}} fmt: 其中GoFiles表示产品代码对应的Go源文件列表, 也就是go build命令要编译的部分.
  - go list -f={{.TestGoFiles}} fmt: TestGoFiles表示内部测试代码
    - 通常export_test.go用于导出一个内部的实现给测试扩展包
  - go list -f={{.XTestGoFiles}} fmt: XTestGoFiles表示测试扩展包代码, i.e fmt_test包
go tool: 运行Go工具链的底层可执行程序, 如go tool cover, go tool pprof.
- 这些底层可执行程序放在$GOROOT/pkg/tool/${GOOS}_${GOARCH}目录. 因为有go build, 我们很少直接调用这些底层工具.

细节与杂项

Go中的区间索引：
- 左闭右开原则. 即区间包括第一个索引元素, 不包括最后一个。（比如 a = [1, 2, 3, 4, 5], a[0:3]=[1,2,3], 即包含左边第一个元素a[0], 但不包含右侧的索引元素a[3]. ）
- 区间索引的左、右参数分别可以省略。左参数省略则默认为0, 右参数省略则为len(a)
名字的作用域
- 函数内部定义的名字，只在函数内部有效
- 函数外部定义的名字(包级名字), 在整个包的所有文件中都可以访问
  - 包级名字，若首字母大写(包括函数名和变量名)，那么就是导出的名字，即可以被外部的包访问
  - 包级名字，若首字母小写(包括函数名和变量名)，那么就是属于包内部的名字，可以在包的所有文件中访问
- 包本身的名字，一般总是用小写
命名风格
- 倾向于不要太长的名字
- 倾向于驼峰命名法(优先大小写分隔，而不是下划线分隔)
- 包的命名建议
  - 当创建一个包, 一般要用短小的包名, 但也不能太短导致难以理解;
  - 包名一般采用单数的形式(标准库的bytes,errors,strings等复数形式是为了避免和预定义的类型冲突.)
  - 要避免包名有其他的含义;
四种声明
- var: 变量声明
- const: 常量声明
- type: 类型声明
- func: 函数声明
变量的默认零值
(零值初始化机制可以确保每个声明的变量总是有一个良好定义的值, 因此在Go中不存在未初始化的变量)
- bool: false
- 数值型: 0
- string: ""
- 接口或引用类型(包括slice/map/chan/func):nil
- 指针: nil
简短变量声明(例如 a:= 0)
- 简短变量声明:=是声明语句, 而=是赋值语句
- 简短变量声明语句中必须至少要声明一个新的变量, 否则会编译失败(已声明过的变量在简短变量声明语句中等价于赋值)
指针
- C风格, 即通过&取地址, 通过*取值, 类型为*T
变量的生命周期与内存分配
- Go中作用域的概念与C/C++中的作用域的概念不同
  - Go中的声明语句的作用域是指源代码中可以有效使用这个名字的范围
  - Go中的作用域是编译时概念, 而生命周期是运行时概念
    - 前者是变量名字的可见范围, 后者是实际变量的可引用时间段
  - 注意for/if/switch等的隐式词法域
    - 比如if条件中声明的变量, 在else block中也可见
- 变量的回收由Go垃圾回收器负责, 而是否可以垃圾回收的唯一标志为变量是否仍然可达
  - 所以局部变量的地址返回后也依然有效, 因为依然可达
- new在Go中只是一个内建的函数
  - new函数返回的是指针
  - 通过new函数创建变量和直接声明的变量没有什么本质区别(后者需要一个临时变量, 然后才能取地址)
  - new和变量是在栈上分配还是堆上分配没有任何关系
  - 通常情况下new的使用较少
- 包级变量的生命周期和整个程序的运行一致
- 局部变量的生命周期, 从声明开始, 到不可达结束
- 变量的内存分配
  - 由Go编译器自动决定是在栈上分配还是堆上分配
  - 对于局部变量来说
    - 从函数中逃逸的变量, 必须在堆上分配
    - 不从函数中逃逸的变量, 由编译器自动决定在栈上分配还是堆上分配
命令行参数处理
- Go中一般通过flag包, 类似于python中的argparse
包的初始化
- 依次初始化(会按照变量的初始化依赖顺序)
- 包中复杂变量的初始化, 可以通过特殊的init()函数来进行(进入main()之前自动被调用)
- 每个包只会被初始化一次, 不会重复初始化
- package main最后被初始化
内置的复数类型(complex64/complex128)
- 用于构建复数, 其中real()和imag()函数分别返回复数的实部与虚部
字符串
- 一个字符串是一个不可改变的字节序列(只读的)
- rune: 对应于utf-32编码, 由于定长, 方便于索引
- Go中range循环时, 会自动隐式解码utf-8, 故索引更新的步长将会超过1个字节, 应特别注意!!
- 字符串字面值
  - 通常用双引号"内容"来表达
  - 原生的字面值形式用`内容`来表达, 内部所有的字符都会字面解释而不会转义(会忽略回车符)
- 标准库中常用的几个字符串处理的包
  - bytes
  - strings
  - strconv
  - unicode
常量
- 常量表达式的值在编译期计算, 而不是在运行期.
- 常量间的所有算数运算、逻辑运算和比较运算的结果也都是常量, 对常量的类型转换操作或以下函数调用都是返回常量结果:
  - len/cap/real/imag/complex/unsafe.Sizeof
- 常量的初始化
  - 批量声明时, 除了第一个以外其他的常量的右边的初始化表达式都可以省略, 即沿用上一个的初始化
  - 可通过itoa进行批量按一定规则初始化一堆常量(有点类似于其他语言中的enum)
- Go中的常量可以无类型
  - 即若是没有显式明确类型, 则编译器为这些常量提供比基础类型更高精度的算术运算, 可以认为至少有256bit的运算精度
  - 有六种未明确类型的常量类型
    - 无类型的布尔型
    - 无类型的整数
    - 无类型的字符
    - 无类型的浮点数
    - 无类型的复数
    - 无类型的字符串
数组
- 数组和结构都是有固定内存大小的数据结构, 相比之下slice和map则是动态内存大小的数据结构
- 数组的初始化
  - 默认情况下, 数组的每个元素都被初始化为元素类型对应的零值
  - 可以使用数组字面量的形式来进行初始化
  - 可以用...来初始化数组的长度, 即根据数组字面量初始化的数量来推导数组长度, 如s := [...]int{1, 2, 3}
  - 数组的长度是数组类型的组成部分, 故不同长度的数组可以认为是不同的类型
  - 数组的长度必须是常量表达式, 编译时确定
  - 也可以使用索引+对应值的形式来进行数组的初始化
- Go中数组作为函数传参时, 会进行值传递(拷贝整个数组), 而不是许多语言中的指针/引用传递.
  - 可以显式的以数组的指针作为函数参数进行传递
- Go与C中数组的主要区别
  - Go中的数组是值类型, 将一个数组赋值给另一个数组, 会拷贝所有元素
  - Go中的函数传递数组参数时, 也是拷贝整个数组传递; 而C中传递的是指向数组的指针
  - Go中数组长度为数组类型的一部分, 声明即不可修改. 不同长度的数组可认为类型不同.
Slice
- slice与数组
  - 主要区别为, 数组为定长的(编译时确定), 而slice是动态长度的
  - 语法上来讲, []T代表slice, [len]T代表数组
  - 数组可以使用==, !=进行比较, slice则不行
    - slice仅支持与nil之间通过==, !=比较
    - 两个slice之间的比较, 需要通过循环进行深度比较(若元素类型为byte, 可以用bytes.Equal)
- 理解slice
  - slice底层引用数组实现
  - 一个slice有三个部分构成: 指针、长度、容量(可以看做一个由指针、长度、容量组成的结构体来理解)
    - 指针: 指向当前slice的第一个元素的地址
      - 注意: 在底层数组中未必是第一个元素, 因为底层数组经常会是复用的
      - 传递slice时由于指针的存在, slice的底层数组元素内容是可修改的, 相当于传递一个slice的别名
    - 长度: slice中的元素个数, 内置的len()函数可以返回长度
    - 容量: slice能容纳的元素的总个数, 内置的cap()函数可以返回容量
  - 多个slice可以共享底层的数据, 并且引用的数组部分区间可能重叠
- 内置的make()函数可以用于创建一个指定元素类型、指定长度和指定容量的slice
- 内置的append()函数可以用于向一个slice追加元素
  - 对于任何可能修改slice的函数, 应将更新后的slice直接赋值给原slice, 以保证len, cap和底层数组元素的正确更新
- slice的内存小技巧
  - 输入的slice和输出的slice共享一个底层数组结构, 从而避免了不必要的内存分配, 多用于过滤/合并slice中的元素
Map
- map的类型可写为map[K]V, 其中K和V分别对应于Key和Value
  - Key必须是支持==比较运算符的数据类型
  - Value类型则没有限制, 完全可以支持slice/map或自定义的聚合类型
- map的创建
  - 可以使用内置的make()函数进行创建, 如ages := make(map[string]int)
  - 也可以使用字面值语法进行创建, 如ages := map[string]int{}
- map的元素插入、查找、修改值、删除
  - 插入新元素或查找元素或修改已有元素的值: ages[K]=V
  - 删除元素: 使用内置的delete()函数
- map的迭代
  - map的迭代顺序是不确定的, 并且不同的哈希函数实现可能导致不同的迭代顺序
    - 在实践中, 遍历的顺序是随机的, 每一次遍历的顺序都不一样. 这是故意的.
    - 如果要按顺序遍历, 则必须显式地对Key进行排序. 比如用一个slice存储所有的Key, 排序后遍历slice取出Key, 再从map中取出对应的Value
- map中的元素禁止取地址, 原因是map可能随着元素的增长而重新分配内存, 从而可能导致之前的地址无效
- 和slice一样, map之间也不能进行==比较, 除了与nil比较
- 由于map中的Key总是不同的, 必要时可以使用map模拟set的功能(Go没有内置set类型)
- map上的大部分操作, 包括查找、删除、len和range循环都可以安全地工作在nil的map上, 它们的行为和一个空的map类似. 但是向一个nil的map插入新元素则会导致panic异常.
Struct 结构体
- struct是一种聚合的数据类型.
- struct成员的定义顺序是有意义的, 交换了成员的顺序可以认为创建了不同的struct类型.
- struct成员的导出规则满足Go变量/类型导出的一般规则:
  - 大写字母开头的成员名字为导出的
  - 小写字母开头的成员名字为未导出的
  - 一个结构体可能同时包含导出的和未导出的成员
- 一个命名为S的struct类型将不能再包含S类型的成员, 因为一个聚合的值不能包含它自身. 但是S类型的结构体可以包含*S指针类型的成员, 这样我们就可以创建递归的数据结构了.
- 如果结构体没有任何成员的话，就是空结构体，写作struct{}, 大小为0, 也不包含任何信息. 但有时候也仍然是有价值的, 比如用map模拟set时用作Value以节约内存(虽然很少).
- 结构体字面值初始化的两种写法(如对于结构体type Point struct{ X, Y int }):
  - 按照顺序初始化, 如 p := Point{1, 2}
  - 以成员名字和相应的值来初始化，如 p := Point{ X: 1, Y: 2}. 这种方式可以仅写明部分成员, 顺序也不影响.
    - 注：对于未导出的成员, 在包外部这两种方式都不能使用, 因为无法访问未导出的成员.
- 如果结构体的成员都是可比较的, 那么结构体也是可比较的, 这样的话两个结构体将可以使用==或!=进行比较, 行为为比较两个结构体的每个成员.
- 匿名成员
  - 为Go的一个语言特性, 即声明一个成员时仅写明类型, 而不指明成员的名字. 实际上匿名成员还是有名字的, 名字就是类型名.
  - 好处: 可以直接访问匿名成员的叶子属性(也同样可以通过显式的类型名字访问叶子属性)
函数(func)
- 函数的类型被称为函数的标识符. 如果两个函数形参列表和返回值列表都一一对应, 那么这两个函数被认为有相同的类型和标识符.
- 函数调用时, Go语言没有默认参数值.
- 实参总是值传递的, 因此函数的形参是实参的拷贝.
- 没有函数体的声明, 表示该函数不是以Go语言实现的(比如汇编实现).
- Go使用可变栈大小, 栈的大小按需增加(初始化时很小), 因此不会有栈溢出问题(尤其是递归时).
- 在Go中, 一个函数可以有多个返回值.
- 如果一个函数将所有的返回值都显式地命名变量名, 那么该函数的return语句可以省略操作数, 这称之为 bare return. bare return可能会使代码变得难以被理解, 不应过度使用.
- 在Go中, 函数被看做第一类值(first-class values):
  - 函数像其他值一样, 拥有类型, 可以被赋值给其他变量, 传递给函数, 从函数返回.
    - 对函数值(function value)的调用也类似于函数调用.
    - 函数类型的零值是nil. 函数值可以与nil比较, 但函数值之间不可比较.
  - 与C中的函数指针的概念非常类似, 对函数值的调用可看做C中对函数指针所指向的函数的调用.
- 拥有函数名的函数只能在包级语法块中被声明, 通过函数值字面量(function literal)也即匿名函数(anonymous function)可以绕过这一限制.
- 匿名函数的语法与普通函数的声明类似, 区别仅在于func关键字后没有函数名.
  - 更为重要的是, 通过这种方式定义的函数可以访问完整的词法环境（lexical environment), 这意味着在函数中定义的内部函数可以引用该函数的变量.
    - e.g. 函数值不仅仅是一串代码, 还记录了状态(变量引用).
    - Go使用闭包(closures)技术实现函数值.
  - 当匿名函数需要被递归调用时, 我们必须首先声明一个变量, 再把匿名函数赋值给这个变量.
- 可变参数函数
  - 参数数量可变的函数称为可变参数函数, 典型的例子就是fmt.Printf.
  - 在声明可变参数函数时, 需要在参数列表的最后一个参数类型之前加上省略符号..., 这表示该函数会接收任意数量的该类型参数. i.e. func sum(vals ...int) int {}
  - 若原始参数已经是slice, 那么只需要在调用时最后一个参数后加上省略符..., 即可直接传递给可变参数函数. i.e. vals := []int{1,2,3}; fmt.Println(sum(vals...))
- defer机制
  - 语法: 在调用普通函数或方法前加上关键字defer即可
  - 当defer语句被执行时, 跟在defer后面的函数会被延迟执行, 直到包含该defer语句的函数执行完毕时, defer后的函数才会被执行. 不论包含defer语句的函数时通过return正常结束, 还是由于panic异常结束.
  - 可以在一个函数中执行多条defer语句, 他们的执行顺序与声明顺序相反.
  - 常应用于:
    - 确保资源在退出函数时总是被关闭, 防止资源泄露. 如文件句柄、锁等.
    - 记录进入和退出函数
    - 在函数每次调用时输出参数和返回值, 甚至修改最终的返回值.
  - 在循环中应用defer时要十分谨慎, 容易造成资源消耗过多甚至耗尽的风险
  - defer机制有点类似于面向对象语言中局部object变量退出作用域时的自动析构, 可以实现类似的效果.
方法(method)
- 属于某个特定类型的函数, 或者说绑定到某个特定类型的函数, 即是方法.
- 声明: 在函数声明时, 在其名字前放上一个变量, 即是一个方法. 这个附加的参数会将该函数附加到这种类型上, 相当于为这种类型定义了一个独占的方法.
  - 示例函数: func Distance(p, q Point) float64 {...}
  - 绑定到类型Point的相同功能的方法: func (p Point) Distance(q Point) float64 {...}
- 方法接收器(Receiver)的概念
  - 早期的面向对象语言将调用一个方法称为"向一个对象发送消息"
  - 大多语言中会使用this或self作为方法的接收器
  - Go中可以任意选择接收器的名字, 通常使用其类型的第一个字母
- Go中我们可以很容易为一些简单的数值、字符串、slice、map等内置类型来定义一些附加行为.
  - 方法可以被声明到任意类型, 只要不是一个指针或者一个interface
  - 不需要像大多语言中那样派生出新的类型来, 而只需要为类型声明一个新的方法即可.
- 如果method需要更新receiver的内容, 或者receiver对象太大希望避免调用时的拷贝, 那么就可以用其指针而不是对象来声明method.
  - 声明method的receiver该是指针还是非指针类型的原则:
    - 对象本身是否特别大, 从而是否需要避免调用时的拷贝传值
    - 是否需要通过此方法更新receiver的内容
  - 不管method的receiver是指针类型还是非指针类型, 都是可以通过指针/非指针类型进行调用的, 编译器会帮我们做好取地址或解引用的转换.
- nil也是一个合法的receiver, 类似于给func传递了一个为nil的值
- 可以直接通过struct对象调用struct匿名内嵌成员的方法. 从实现的角度看, 可以理解为内嵌字段会指导编译器去生成额外的包装方法来委托已经声明好的方法.
- method value: 也即method对应的function value
接口(interface)
- 接口类型是一种抽象的类型. 可以换个角度理解, 当你看到一个接口类型时, 你不知道它是什么, 唯一知道的就是可以通过它的方法来做什么. 也即方法接口的约定.
- 接口类型具体描述了一系列方法的集合, 一个实现了这些方法的具体类型就是这个接口类型的实例.
- 接口类型声明时, 方法的顺序变化没有影响, 也支持内嵌方式(类似结构的内嵌)声明, 唯一重要的就是这个集合里面的方法.
- 一个类型如果拥有一个接口需要的所有方法, 那么这个类型就实现了这个接口. 也即这个类型属于这个接口.
- 空接口类型interface{}对实现它的类型没有任何要求, 所以我们可以将任意一个值赋给空接口类型.
- 接口值(interface value)由一个具体的类型和一个此类型的值两个部分组成.
  - 两部分皆为nil时 interface value == nil, 称为空接口值.
  - 调用一个空接口值上的任何方法, 都会造成panic.
  - 比较接口值或者包含了接口值的聚合类型时, 必须要意识到潜在的panic风险.
  - 注意: 一个不包含任何值的nil接口值和一个刚好包含nil指针的接口值是不同的(需要判断是否为空时, 前者 == nil, 后者!= nil, 见讨论Interface values with nil underlying values, Check for nil and nil interface in Go).
- 类型断言(Type Assersion)
  - 可用于帮助判断接口值在运行时的实际类型
  - 语法为x.(T), 其中x为接口值, T为一个具体类型或接口类型. 返回值可以是一个或者两个
    - 一个返回值的情况, 如f := x.(T), 若失败则抛出panic异常
    - 两个返回值的情况, 如f, ok := x.(T), 若失败则ok为false, 从而方便程序错误处理
  - 可以通过Type Assertion询问行为(非常有价值的用法, 详见《The Go Programming Language》 Ch7.12)
- Type Switch
  - 通过switch以及Type Assertion来根据不同类型进行不同处理的方便写法, 本质上有点语法糖, 因为通过if/else加上Type Assertion完全可以实现, 但略显啰嗦. 用switch看起来优雅些.
  - 书上把Type Switch翻译成了类型开关, 虽然是直译, 但看起来够够的, 非常的不 make sense, 还不如保留原文Type Switch
Concurrency: Goroutine, Channel, sync
- goroutine+channel 支持术语为"顺序通信进程"(communicating sequential processes, 简称为CSP)的并发模型. 而更传统的并发模型为"多线程共享内存".
- 当一个程序启动时, main函数即在一个单独的goroutine中运行, 称为main goroutine.
- 通过go语句来创建新的goroutine, 语法上为普通的函数或方法调用前加上go关键字. e.g. go f()
- channel是一个通信机制, 它可以让一个goroutine通过它给另一个goroutine发送值信息. 每个channel都有一个特殊的类型, 也就是channel可发送的数据类型.
  - e.g. ch := make(chan int) 即创建一个channel可发送int型值.
  - e.g. ch := make(chan string 3) 即创建一个channel可发送string型值, 并最多缓存3个元素.
- 和map或slice类似, channel变量对应的也是一个底层数据结构的引用. 两个相同类型的channel可以使用==运算符比较.
- 一个channel有发送和接收两个主要操作, 都是通信行为. 语法为(ch为一个channel):
  - 发送: ch <- x
  - 接收: x <- ch (不写x时, 如 <- ch 则为丢弃接收的内容)
- 使用make()创建一个channel, 使用close()关闭一个channel
  - 通常不需要显式关闭
    - 首先, close()一个channel意义为不能再对此channel发送数据, 所以一般仅在需要告诉接收者goroutine, 要向channel发送的数据已经全部完成的时候才显式调用close(). 在接收channel数据的goroutine中可通过第二个返回值判断channel是否已经被关闭. e.g. x, ok := <- ch
    - 如上所述, 若要显式调用close(), 也仅应在发送的goroutine中调用
    - 其次, channel不再被引用后会像普通变量一样自动被垃圾回收
    - 试图重复close()一个channel或关闭一个nil的channel将导致panic异常
- Channel默认行为为阻塞
  - 一个基于无缓存的Channel的发送操作将导致阻塞, 直到另一个gorouting在相同的Channel上执行接收操作. Vice Versa.
    - 注: 当通过一个无缓存Channel发送数据时, 接收者收到数据发生在唤醒发送者goroutine之前("Happen Before").
  - 带缓存的Channel, 则是在缓存用满后开始阻塞.
- 单向channel
  - 典型应用场景: 通常在当channel定义为函数参数时, 且其在函数中仅会被用于发送或仅被用于接收(发送goroutine和接收goroutine调用不同的函数)
  - out chan<- int: out代表一个仅允许发送操作且支持的类型为int的channel
  - in <-chan int: in代表一个仅允许接收操作且支持的类型为int的channel
  - 单向channel的限制将在编译期检查. 对一个只接收的channel调用close()将会是编译错误.
  - 任何双向channel向单向channel变量的赋值操作将会是隐式转换, 而反向并不能转换, 即不能将单向channel转换为双向.
- 带缓存的channel内部持有一个元素队列, 向channel的发送操作就是向内部缓存队列的尾部插入元素, 接收操作就是从缓存队列的头部取出元素.
- 多个goroutine并发的向同一个channel发送数据, 或从同一个channel接收数据都是常见的用法.
- goroutine泄露: goroutine卡住而永远不会返回(如从一个不会再有数据的空的不带缓存的channel中接收), 称为goroutine泄露, 类似于线程卡死. 泄露的goroutine并不会被自动回收, 因此应确保每一个不再需要的goroutine能正常退出.
- 当在循环中使用goroutine进行并发处理时, 常用sync.WaitGroup来等待从而保证所有的goroutine都已退出, 防止goroutine泄露.
- Golang中可以基于select实现多路复用:
  - select语法类似于switch, 有多个case和一个可选的default
  - select会等待case中有能够执行的case时去执行. 当条件满足时, select才会去通信并执行case之后的语句. 如果多个case同时就绪, select会随机的选择一个通信并执行, 这样来保证每一个channel都有平等的被select的机会.
  - select可以有default语句, 此时行为相当于变成了非阻塞的select, 所有其他case条件都不满足时, 会进入default分支执行.
  - select本身仅一次行为, 常配合for使用.
- 退出goroutine的一个常用用法: 利用close()一个特定channel来广播退出消息, 在goroutine中查询这个channel是否已经被关闭从而决定继续执行还是退出
- Go中并发的口头禅："不要使用共享数据来通信, 使用通信来共享数据"
- sync包中几种常用的互斥锁/方法: sync.Mutex, sync.RWMutex, sync.Once, sync.WaitGroup
- Go的runtime和工具链为我们装备了一个复杂但好用的动态分析工具, 竞争检查器(the race detector), 帮助我们记录和报告所有已经发生的同步事件/数据竞争. 完整的同步事件集合参考The Go Memory Model.
- Goroutine与OS Thread的主要区别:
  - OS Thread比Goroutine有更大的栈内存开销
    - OS Thread通常有固定大小的栈内存(linux上貌似可以动态增长), 初始值也会相对较大(e.g. 2MB)
    - Goroutine会以一个很小的栈开始其生命周期, 一般只需要2KB. 并会根据需要动态地伸缩, 最大值可以有1GB.
  - OS Thread比Goroutine有更大的调度开销
    - OS Thread由OS进行调度, 一般会依赖于硬件计时器的中断调用一个叫scheduler的内核函数. 线程调度切换时需要完整的上下文切换, 也就是说, 保存一个用户线程的状态到内存, 恢复另一个线程的到寄存器, 然后更新调度器的数据结构. 这个上下文切换回很慢.
    - Goroutine则由Go的调度器在程序内部进行m:n调度(在n个操作系统线程上多工调度m个Goroutine), 并不依赖硬件计时器, 也不需要内核层面的上下文切换, 调度代价低得多.
    - Go调度器通过GOMAXPROCS可以决定有多少个(n)操作系统线程同时执行Go的代码. 其默认值是运行机器上的CPU核心数. 在休眠中的或者在通信中被阻塞的goroutine是不需要一个对应的线程来做调度的. 在I/O中或系统调用中或调用非Go语言函数时, 是需要一个对应的操作系统线程的. 但是GOMAXPROCS并不需要将这几种情况计数在内.
  - OSThread有明确的身份标识(thread id), 而Goroutine没有.
    - 这一点是设计上故意而为之, 从而鼓励更为简单的模式.
封装
- Go语言只有一种控制可见性的手段: 大写首字母的标识符会从定义它们的包中被导出, 小写字母的则不会. 这种基于名字的手段使得在Go语言中最小的封装单元是package.
错误处理
- panic是来自被调用函数的信号, 表示发生了某个已知的bug.
  - 一个良好的程序永远不应该发生panic异常.
  - 有些错误只能在运行时检查, 如数组访问越界、空指针引用等，这些错误会引起panic异常.
  - 一般而言, panic异常发生时, 程序会中断执行, 并立即执行在该goroutine中被延迟的函数(defer机制). 随后, 程序崩溃并输出日志信息. 日志信息包括panic value和函数调用的堆栈信息. 通常这些日志信息已经提供了足够的诊断依据.
  - Go的panic机制中, defer延迟函数的调用在堆栈释放之前.
  - 直接调用内置的panic函数也可以引起panic异常. 而由于panic会引起程序的崩溃, 因此一般仅用于严重错误.(有点类似于Release支持断言, 不应滥用)
  - 如果在defer函数中调用了内置函数recover, 并且定义该defer语句的函数发生了panic异常, recover会使程序从panic中恢复, 并返回panic value. 导致panic异常的函数不会继续运行, 但能正常返回. 未发送panic时调用recover, recover会返回nil.
    - 通过defer和recover使程序从panic异常中恢复, 应当有选择的仅在必要时使用.
- 通常导致失败的原因不止一种. 因此, 一般函数额外的返回值不再是简单的bool类型, 而是error类型.
  - 内置的error类型是接口类型.
  - error类型的值可能是nil或non-nil.nil表示成功, non-nil表示失败, 并可获取字符串类型的错误信息.
- 在Go中, 函数运行失败时会返回错误信息, 这些错误信息被认为是一种预期的值而非异常(exception), 这使得Go有别于那些将函数运行失败看作是异常的语言.
- 常用的五种错误处理策略
  - 传播错误
  - 重试失败的操作
    - 一般用于偶然性的错误, 或由不可预知的问题导致的错误.
    - 在重试时, 我们需要限制重试的时间间隔或重试的次数, 防止无限制的重试.
  - 输出错误信息并结束程序 .
    - 需要注意: 这种策略通常只在main中执行
    - 对于库函数而言, 应仅向上传播错误, 除非该错误意味着程序内部包含不一致性, 即遇到了bug, 才能在库函数中结束程序.
  - 仅输出错误信息, 继续程序的运行
  - 忽略错误
- 我们应该在每次函数调用后, 都养成考虑错误处理的习惯. 当你觉得忽略某个错误时, 应该清晰的记录下你的意图.
- Go中错误处理的编码风格(C-style)
  - 检查某个子函数是否失败后, 我们通常将处理失败的逻辑代码放在处理成功的代码之前.
  - 如果某个错误会导致函数返回, 那么成功时的逻辑代码不应放在else语句块中, 而应直接放在函数体中.
  - Go中大部分函数的代码结构几乎相同
    - 首先是一系列的初始检查, 防止错误发生, 之后是函数的实际逻辑.
- runtime包允许程序员输出堆栈信息, 以便于调试.
测试
- Go中的测试依赖一个go test测试命令和一组按照约定方式编写的测试函数. 测试命令可以运行这些测试函数.
- 在实践中, 编写测试代码和编写程序本身并没有多大区别.
- 在包目录内, 所有以_test.go为后缀名的源文件并不是go build构建包的一部分, 它们是go test测试的一部分.
- 在*_test.go文件中, 有三种类型的函数:
  - 测试函数: 即在*_test.go中以Test为函数名前缀的函数, 用于测试程序的一些逻辑行为是否正确. go test命令会调用这些测试函数并报告测试结果是PASS或FAIL. e.g. func TestSin(t *testing.T) { /* ... */ }
  - 基准测试函数: 即在*_test.go中以Benchmark为函数名前缀的函数, 用于衡量一些函数的性能. go test命令会多次运行基准函数以计算一个平均的执行时间. e.g. func BenchmarkSin(b *testing.B) { /* ... */ }
    - 默认情况下不运行, 需要以go test -bench=.来启动运行.
  - 示例函数: 即在*_test.go中以Example为函数名前缀的函数, 提供一个由编译器保证正确性的示例文档. e.g. func ExampleSin() { /* ... */}
    - 三个主要用途：
      - 作为文档(需要接收编译器的编译时检查)
      - 当内部含有类似// Output:格式的注释时, go test会运行测试检查输出和注释是否匹配
      - 提供一个真实的演练场, 如http://golang.org服务.
- go test命令会遍历所有的*_test.go文件中符合上述命名规则的函数, 然后生成一个临时的main包用于调用相应的测试函数, 然后构建并运行、报告测试结果, 最后清理测试中生成的临时文件.
- 测试函数的几种思路：
  - 表格驱动, 构造一些典型的输入和期望输出
  - 随机测试, 通过构造更广泛的随机输入来测试探索函数的行为
- 可以将产品代码的一些部分替换为一个容易测试的伪对象来来做函数功能的部分测试(参考11.2.3白盒测试)
  - 使用伪对象的好处是我们可以方便配置, 容易预测, 更可靠, 也更容易观察. 同时也可以避免一些不良的副作用, 如更新生产数据库或信用卡消费行为.
  - 使用伪对象测试结束后, 应及时恢复伪对象(一般通过defer), 从而不影响后续的测试.
- 测试扩展包:
  - 为了解决测试时的循环依赖问题, 有些情况需要建立一个额外的包来运行测试, 这时候可以用到测试扩展包.
  - 测试扩展包名以_test作为后缀, 告诉go test工具它应该建立一个额外的包来运行测试. e.g. 为net/url建立一个net/url_test的测试扩展包.
  - 测试扩展包仅会被go test运行测试时使用, 不能被其他任何包导入.
- 避免脆弱测试代码的方法是只检测你真正关心的属性, 保持测试代码的简洁和内部结构的稳定.
- 测试覆盖率的重点为测试过程中的语句覆盖率, 即测试中至少被运行一次的代码占总代码的比例. 可通过go test+go tool cover来衡量.
- 测试从本质上来说是一个比较务实的工作, 编写测试代码和编写应用代码的成本对比是需要考虑的. 实践中通常不需要也不应该追求100%的测试覆盖率.
- Profiling
  - Go提供了三类profile方法
    - go test -cpuprofile=cpu.out
    - go test -blockprofile=block.out: 分析goroutine中的阻塞操作, 如系统调用、管道发送和接收、获取锁等.
    - go test -memprofile=mem.out
  - 以及可视化工具go tool pprof(可以配合graphviz使用)
  - 进阶可参考Profiling Go Programs
unsafe包: 底层编程
- unsafe包是一个采用特殊方式实现的包. 虽然它可以和普通包一样的导入和使用, 但它实际上是由编译器实现的.
- 几个常用函数, 对理解原生内存布局/优化底层内存使用很有帮助: unsafe.Sizeof, unsafe.Alignof, unsafe.Offsetof
  - 和C/C++中的类似函数语义一致
- Go语言的规范并没有要求一个字段的声明顺序和内存中的顺序是一致的, 所以理论上一个编译器可以随意地重新排列每个字段的内存位置. (目前还没这么做, 参考Golang Issue 10014)
- unsafe.Pointer: 可以与任意指针类型互相转换的类型, 类似于C中的void*. 使用时要按照void*来考虑, 防止各种导致crash的风险.
- 与C语言互操作的库:
  - Go自带的cgo: 支持Go调用C, 同样支持C调用Go(将Go编译为静态库或编译为动态库供C调用均可以). 更多细节参考cgo
    - .go代码中import "C", 会让Go编译程序在编译之前先运行cgo工具.
      - cgo工具生成一个临时包用于包含所有在Go语言中访问的C语言的函数或类型.
      - cgo工具通过以某种特殊的方式调用本地的C编译器来发现在Go源文件导入声明前的注释中包含的C头文件中的内容(import "C"语句前紧挨着的注释时对应的cgo的特殊语法, 对应必要的构建参数选项和C语言代码. 注释中#cgo指令用于给C语言工具链指定特殊的参数, 如CFLAGS/LDFLAGS)
  - 第三方的swig(http://www.swig.org/): 支持更多的C++复杂的特性

Reference Links

Directories ¶

Path	Synopsis
ch10_jpeg The jpeg command reads a PNG image from the standard input and writes it as a JPEG image to the standard output.	The jpeg command reads a PNG image from the standard input and writes it as a JPEG image to the standard output.
ch11_echo Echo prints its command-line arguments.	Echo prints its command-line arguments.
ch11_storage2
ch11_word1 Package word provides utilities for word games.	Package word provides utilities for word games.
ch11_word2 Package word provides utilities for word games.	Package word provides utilities for word games.
ch13_bzip Package bzip provides a writer that uses bzip2 compression (bzip.org).	Package bzip provides a writer that uses bzip2 compression (bzip.org).
ch13_bzipper Bzipper reads input, bzip2-compresses it, and writes it out.	Bzipper reads input, bzip2-compresses it, and writes it out.
ch1_12_server_lissajous Lissajous generates GIF animations of random Lissajous figures.	Lissajous generates GIF animations of random Lissajous figures.
ch1_1_echo4 prints its command-line arguments	prints its command-line arguments
ch1_2_echo5 prints its command-line arguments	prints its command-line arguments
ch1_4_dup4
ch1_5_lissajous2 Lissajous generates GIF animations of random Lissajous figures.	Lissajous generates GIF animations of random Lissajous figures.
ch1_7_fetch2 Fetch prints the content found at a URL.	Fetch prints the content found at a URL.
ch1_8_fetch3 Fetch prints the content found at a URL.	Fetch prints the content found at a URL.
ch1_9_fetch4 Fetch prints the content found at a URL.	Fetch prints the content found at a URL.
ch1_dup1
ch1_dup2
ch1_dup3
ch1_echo1 prints its command-line arguments	prints its command-line arguments
ch1_echo2 prints its command-line arguments	prints its command-line arguments
ch1_echo3 prints its command-line arguments	prints its command-line arguments
ch1_fetch Fetch prints the content found at a URL.	Fetch prints the content found at a URL.
ch1_fetchall Fetchall fetches URLs in parallel and reports their times and sizes.	Fetchall fetches URLs in parallel and reports their times and sizes.
ch1_lissajous Lissajous generates GIF animations of random Lissajous figures.	Lissajous generates GIF animations of random Lissajous figures.
ch1_server1 Server1 is a minimal "echo" server.	Server1 is a minimal "echo" server.
ch1_server2 Server1 is a minimal "echo" server.	Server1 is a minimal "echo" server.
ch1_server3 Server1 is a minimal "echo" server.	Server1 is a minimal "echo" server.
ch2_2_meters_miles_conv
ch2_2_meters_miles_conv_test converts its numeric argument to Meters and Miles	converts its numeric argument to Meters and Miles
ch2_cf Cf converts its numeric argument to Celsius and Fahrenheit	Cf converts its numeric argument to Celsius and Fahrenheit
ch2_echo4 Echo4 prints its command-line arguments	Echo4 prints its command-line arguments
ch2_popcount
ch2_popcount_test
ch2_tempconv0 Package tempconv performs Celsius and Fahrenheit temperature computations.	Package tempconv performs Celsius and Fahrenheit temperature computations.
ch2_tempconv0_test main test for tempconv0	main test for tempconv0
ch3_10_comma_non_recursive
ch3_12_same_contents_in_str
ch3_13_KB_MB__YB
ch3_basename basename removes directory components and a .suffix.	basename removes directory components and a .suffix.
ch3_comma
ch3_mandelbrot Mandelbrot emits a PNG image of the Mandelbrot fractal.	Mandelbrot emits a PNG image of the Mandelbrot fractal.
ch3_netflag
ch3_printints
ch3_surface Surface computes an SVG rendering of a 3-D surface function.	Surface computes an SVG rendering of a 3-D surface function.
ch4_3_rev
ch4_4_rotate
ch4_5_remove_duplicate_str
ch4_append
ch4_autoescape
ch4_charcount Charcount computes counts of Unicode characters.	Charcount computes counts of Unicode characters.
ch4_dedup
ch4_embed
ch4_github Package github provides a Go API for the Github issue tracker.	Package github provides a Go API for the Github issue tracker.
ch4_github_issues Issues prints a table of Github issues matching the search terms.	Issues prints a table of Github issues matching the search terms.
ch4_issueshtml
ch4_issuesreport
ch4_movie
ch4_nonempty
ch4_rev
ch4_sha256
ch4_treesort
ch5_15_max_min
ch5_16_string_join
ch5_19_panic_recover
ch5_6_surface_bare_return Surface computes an SVG rendering of a 3-D surface function.	Surface computes an SVG rendering of a 3-D surface function.
ch5_9_expand
ch5_findlinks1 Findlinks1 prints the links in an HTML document read from standard input.	Findlinks1 prints the links in an HTML document read from standard input.
ch5_findlinks2
ch5_findlinks3
ch5_links Package links providers a link-extraction function.	Package links providers a link-extraction function.
ch5_outline
ch5_panic
ch5_squares
ch5_sum
ch5_title1
ch5_title2
ch5_toposort
ch5_trace
ch6_coloredpoint
ch6_geometry
ch6_geometry_main
ch6_intset
ch6_intset_main
ch6_urlvalues
ch7_1_wordsline_counter
ch7_2_countingwriter
ch7_bytecounter
ch7_eval
ch7_http1
ch7_http2
ch7_http3
ch7_interface_value
ch7_sleep
ch7_sorting
ch7_tempflag
ch7_xmlselect Xmlselect prints the next of selecte elements of an XML document.	Xmlselect prints the next of selecte elements of an XML document.
ch8_13_chat_timeout_client
ch8_3_netcat3
ch8_4_reverb2_waitgroup
ch8_6_crawl_with_depth
ch8_8_reverb2_with_select
ch8_chat
ch8_clock1
ch8_clock2
ch8_countdown1
ch8_countdown2
ch8_crawl1
ch8_crawl2
ch8_crawl3
ch8_du1
ch8_du2
ch8_du3
ch8_du4
ch8_netcat3
ch8_pipeline1
ch8_pipeline2
ch8_pipeline3
ch8_reverb1
ch8_reverb2
ch8_spinner
ch9_1_bank

?	: This menu
/	: Search site
f or F	: Jump to
y or Y	: Canonical URL