70 行 Go 代码打败 C！

文章发布于公号【数智物语】（ID：decision_engine），关注公号不错过每一篇干货。

作者 | Ajeet D'Souza

译者 | 苏本如，责编 | maozz

出品 | CSDN（ID：CSDNnews）

作为一名程序员，应当具有挑战精神，才能写出“完美”的代码。挑战历史悠久的C语言版wc命令一向是件很有趣的事。今天，我们就来看一下如何用70行的Go代码打败C语言版wc命令。

以下为译文：

Chris Penner最近发表的这篇文章——用80行Haskell代码击败C（https://chrispenner.ca/posts/wc），在互联网上引起了相当大的争议，从那以后，尝试用各种不同的编程语言来挑战历史悠久的C语言版wc命令（译者注：用于统计一个文件中的行数、字数、字节数或字符数的程序命令）就变成了一种大家趋之若鹜的游戏，可以用来挑战的编程语言列表如下：

1. Ada

2. C

3. Common Lisp

4. Dyalog APL

5. Futhark

6. Haskell

7. Rust

今天，我们将用Go语言来进行这个wc命令的挑战。作为一种具有优秀并发原语的编译语言，要获得与C语言相当的性能应该很容易。

虽然wc命令被设计为可以从标准输入设备（stdin）读取、处理非ASCII文本编码和解析命令行标志（wc命令的帮助可以参考这里），但我们在这里不会这样做。相反，像上面提到的文章一样，我们将集中精力使我们的实现尽可能简单。

如果你想看这篇文章用到的源代码，可以参考这里（https://github.com/ajeetdsouza/blog-wc-go）。

比较基准

我们将使用GNU的time工具包，针对两种语言编写的wc命令，从运行耗费时间和最大常驻内存大小两个方面来进行比较。

$ /usr/bin/time-f"%es %MKB"wc test.txt

用来比较的C语言版的wc命令和在Chris Penner的原始文章里用到的版本相同，使用gcc 9.2.1和-O3编译。对于我们自己的实现，我们将使用go 1.13.4（我也尝试过gccgo，但结果不是很好）来编译。并且，我们将使用以下系统配置作为运行的基准：

1. 英特尔酷睿i5-6200U@2.30GHz 处理器（2个物理核，4个线程）

2. 4+4 GB内存@2133 MHz

3. 240 GB M.2固态硬盘

4. Fedora 31 Linux发行版

为了确保公平的比较，所有实现都将使用16 KB的缓冲区来读取输入。输入将是两个大小分别为100 MB和1GB，使用us-ascii编码的文本文件。

原始实现（wc-naïve）

解析参数很容易，因为我们只需要文件路径，代码如下：

iflen(os.Args) <2{

panic("no file path specified")

}

filePath := os.Args[1]

file, err := os.Open(filePath)

iferr !=nil{

panic(err)

}

deferfile.Close()

我们将按字节遍历文本和跟踪状态。幸运的是，在这种情况下，我们只需要知道两种状态：

1. 前一个字节是空白；

2. 前一个字节不是空白。

当从空白字符变为非空白字符时，我们给字计数器（word counter）加一。这种方法允许我们直接从字节流中读取，从而保持很低的内存消耗。

constbufferSize =16*1024

reader := bufio.NewReaderSize(file, bufferSize)

lineCount :=0

wordCount :=0

byteCount :=0

prevByteIsSpace :=true

for{

b, err := reader.ReadByte()

iferr !=nil{

iferr == io.EOF {

break

}else{

panic(err)

}

byteCount++

switchb {

case'\n':

lineCount++

prevByteIsSpace =true

case' ','\t','\r','\v','\f':

prevByteIsSpace =true

default:

ifprevByteIsSpace {

wordCount++

prevByteIsSpace =false

}

要显示结果，我们将使用本机println（）函数。在我的测试中，导入fmt库（注：Go语言的格式化库）会导致可执行文件的大小增加大约400 KB！

println(lineCount, wordCount, byteCount,file.Name())

让我们运行这个程序，然后看看它与C语言版wc的运行结果比较（见下表）：

好消息是，我们的第一次尝试已经使我们在性能上接近C语言的版本。实际上，我们在内存使用方面做得比C更好！

拆分输入（wc-chunks）

虽然缓冲I/O读取对于提高性能至关重要，但调用ReadByte（）并检查循环中的错误会带来很多不必要的开销。我们可以通过手动缓冲读取调用而不是依赖bufio.Reader来避免这种情况。

为此，我们将把输入分成可以单独处理的缓冲块(chunk)。幸运的是，要处理一个chunk，我们只需要知道前一个chunk的最后一个字符是否是空白。

让我们编写几个工具函数：

typeChunkstruct{

PrevCharIsSpacebool

Buffer []byte

}

typeCountstruct{

LineCountint

WordCountint

}

funcGetCount(chunk Chunk)Count{

count := Count{}

prevCharIsSpace := chunk.PrevCharIsSpace

for_, b :=rangechunk.Buffer {

switchb {

case'\n':

count.LineCount++

prevCharIsSpace =true

case' ','\t','\r','\v','\f':

prevCharIsSpace =true

default:

ifprevCharIsSpace {

prevCharIsSpace =false

count.WordCount++

}

returncount

}

funcIsSpace(bbyte)bool{

returnb ==' '|| b =='\t'|| b =='\n'|| b =='\r'|| b =='\v'|| b =='\f'

}

现在，我们可以将输入分成几个chunk（块），并将它们传送给GetCount函数。

totalCount := Count{}

lastCharIsSpace :=true

constbufferSize =16*1024

buffer :=make([]byte, bufferSize)

for{

bytes, err := file.Read(buffer)

iferr !=nil{

iferr == io.EOF {

break

}else{

panic(err)

}

count := GetCount(Chunk{lastCharIsSpace, buffer[:bytes]})

lastCharIsSpace = IsSpace(buffer[bytes-1])

totalCount.LineCount += count.LineCount

totalCount.WordCount += count.WordCount

}

要获取字节数，我们可以进行一次系统调用来查询文件大小：

fileStat, err := file.Stat()

iferr !=nil{

panic(err)

}

byteCount := fileStat.Size()

现在我们已经完成了，让我们看看它与C语言版wc的运行结果比较（见下表）：

从上表结果看，我们在这两个方面都超过了C语言版wc命令，而且我们甚至还没有开始并行化我们的程序。tokei报告显示这个程序只有70行代码！

使用channel并行化（wc-channel）

不可否认，将wc这样的命令改成并行化运行有点过分了，但是让我们看看我们到底能走多远。Chris Penner的原始文章里的测试采用了并行化来读取输入文件，虽然这样做改进了运行时，但文章的作者也承认，并行化读取带来的性能提高可能仅限于某些类型的存储，而在其他类型的存储则有害无益。

对于我们的实现，我们希望我们的代码能够在所有设备上执行，所以我们不会这样做。我们将建立两个channel – chunks和counts。每个worker线程将从chunks中读取和处理数据，直到channel关闭，然后将结果写入counts中。

funcChunkCounter(chunks <-chanChunk, countschan<- Count){

totalCount := Count{}

for{

chunk, ok := <-chunks

if!ok {

break

}

count := GetCount(chunk)

totalCount.LineCount += count.LineCount

totalCount.WordCount += count.WordCount

}

counts <- totalCount

}

我们将为每个逻辑CPU核心生成一个worker线程：

numWorkers := runtime.NumCPU()

chunks :=make(chanChunk)

counts :=make(chanCount)

fori :=0; i < numWorkers; i++ {

goChunkCounter(chunks, counts)

}

现在，我们循环运行，从磁盘读取并将作业分配给每个worker：

constbufferSize =16*1024

lastCharIsSpace :=true

for{

buffer :=make([]byte, bufferSize)

bytes, err := file.Read(buffer)

iferr !=nil{

iferr == io.EOF {

break

}else{

panic(err)

}

chunks <- Chunk{lastCharIsSpace, buffer[:bytes]}

lastCharIsSpace = IsSpace(buffer[bytes-1])

}

close(chunks)

一旦完成，我们可以简单地将每个worker得到的计数（count）汇总来得到总的word count：

totalCount := Count{}

fori :=0; i < numWorkers; i++ {

count := <-counts

totalCount.LineCount += count.LineCount

totalCount.WordCount += count.WordCount

}

close(counts)

让我们运行它，并且看看它与C语言版wc的运行结果比较（见下表）：

从上表可以看出，我们的wc现在快了很多，但在内存使用方面出现了相当大的倒退。特别要注意我们的输入循环如何在每次迭代中分配内存的！channel是共享内存的一个很好的抽象，但是对于某些用例来说，简单地不使用channel通道可以极大地提高性能。

使用Mutex并行化（wc-mutex）

在本节中，我们将允许每个worker读取文件，并使用sync.Mutex互斥锁确保读取不会同时发生。我们可以创建一个新的struct来处理这个问题：

typeFileReaderstruct{

File *os.File

LastCharIsSpacebool

mutex sync.Mutex

}

func(fileReader *FileReader)ReadChunk(buffer []byte)(Chunk, error){

fileReader.mutex.Lock()

deferfileReader.mutex.Unlock()

bytes, err := fileReader.File.Read(buffer)

iferr !=nil{

returnChunk{}, err

}

chunk := Chunk{fileReader.LastCharIsSpace, buffer[:bytes]}

fileReader.LastCharIsSpace = IsSpace(buffer[bytes-1])

returnchunk,nil

}

然后，我们重写worker函数，让它直接从文件中读取：

funcFileReaderCounter(fileReader *FileReader, countschanCount){

constbufferSize =16*1024

buffer :=make([]byte, bufferSize)

totalCount := Count{}

for{

chunk, err := fileReader.ReadChunk(buffer)

iferr !=nil{

iferr == io.EOF {

break

}else{

panic(err)

}

count := GetCount(chunk)

totalCount.LineCount += count.LineCount

totalCount.WordCount += count.WordCount

}

counts <- totalCount

}

与前面一样，我们现在可以为每个CPU核心生成一个worker线程：

fileReader := &FileReader{

File: file,

LastCharIsSpace:true,

}

counts :=make(chanCount)

fori :=0; i < numWorkers; i++ {

goFileReaderCounter(fileReader, counts)

}

totalCount := Count{}

fori :=0; i < numWorkers; i++ {

count := <-counts

totalCount.LineCount += count.LineCount

totalCount.WordCount += count.WordCount

}

close(counts)

让我们运行它，然后看看它与C语言版wc的运行结果比较（见下表）：

可以看出，我们的并行实现运行速度比wc快了4.5倍以上，而且内存消耗更低！这是非常重要的，特别是如果你认为Go是一种自动垃圾收集语言的话。

结束语

虽然本文绝不暗示Go语言比C语言强，但我希望它能够证明Go语言可以作为一种系统编程语言替代C语言。

如果你有任何建议和问题，欢迎在评论区留言。

原文：https://ajeetdsouza.github.io/blog/posts/beating-c-with-70-lines-of-go/

星标我，每天多一点智慧

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,189评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,577评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,857评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,703评论 1赞 276
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,705评论 5赞 366
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,620评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,995评论 3赞 396
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,656评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,898评论 1赞 298
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,639评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,720评论 1赞 330
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,395评论 4赞 319
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,982评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,953评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,195评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 44,907评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,472评论 2赞 342

70 行 Go 代码打败 C！

推荐阅读更多精彩内容