CUDA C 简介

GPU介绍

图形处理器（Graphics Processing Unit, GPU）初始时设计用于并行的图像处理，通常在个人电脑、工作站、游戏机以及一些移动设备中作为图像处理的微处理器。随着实际应用对GPU性能需求的不断增加，GPU的计算性能越来越强并且越来越通用化，这也使得GPU在通用并行计算（GPGPU）中得到了越来越广泛的使用。从下面两幅图中可以看出，GPU相较于CPU具有更高的浮点运算性能以及更快的存储带宽。

CPU与GPU每秒浮点操作数的对比

CPU与GPU的内存带宽对比

异构并行计算

虽然GPU有非常强大的计算性能，但是它不能独立的作为一个处理器使用，需要和CPU协同工作，我们称GPU为CPU的协处理器。CPU负责整个程序的发起与调度。由于并行计算的代码同时运行在CPU与GPU上，所以称之为异构并行计算。

CPU与GPU异构示意图

CPU与GPU之间通常采用PCIe进行连接。从示意图中可以大致的看出CPU与GPU之间的主要区别：CPU除了有多个的算术逻辑单元（ALU）之外，还有很大的硬件部分是控制单元（Control），所以CPU不仅有能力处理计算任务，还比较擅长于处理一些逻辑控制的任务。相比之下，GPU则把绝大部分的晶体管用作计算单元，所以GPU更加擅长于做并行计算的任务。一个异构计算的应用通常包含两个部分：运行在CPU上的部分称为主机端代码（Host Code），运行在GPU上的部分称为设备端代码（Device Code）.

什么是CUDA？

CUDA是计算统一设备架构（Compute Unified Device Architecture）的简称，是一种由NVIDIA公司推出的通用并行计算架构，该架构能够使用GPU解决复杂的计算问题。CUDA支持多种不同的编程语言，包括常见的C/C++，Fortran以及Python。用户除了使用CUDA编写自己的GPU应用程序之外，NVIDIA以及其他开发人员还开发出了基于CUDA的常用库，比如用于线性方程组求解的cuBLAS，用于深度神经网络的cuDNN等等。现有的库一般都是经过专业人员开发并经过严格的测试才发布的，所以如果现有的库能够满足项目的需要，尽量调用现有的CUDA库。这样不仅能够加快开发进度，而且项目质量也能得到很好的保证。当然，很多时候并没有现成的CUDA库可以调用，这就需要我们自己动手编写。除了CUDA之外，我们还可以使用OpenACC进行GPU计算，虽然OpenACC相较于CUDA更为简便易用，但其缺乏灵活性并且性能较差。关于CUDA的下载与安装以及支持CUDA编程的显卡列表等信息可以参见CUDA的官方文档。

GPU计算应用

下面通过一个简单的Hello World的例子来看一下CUDA程序具体长什么样子：

#include <stdio.h>
__global__ void helloFromGPU (void)
{
    printf(“Hello World from GPU!\n”);
}
int main(void)
{
    // hello from cpu
    printf(“Hello World from CPU!\n”);
    helloFromGPU <<<1, 10>>>();
    cudaDeviceReset();
    return 0;
}

编译并运行：

$nvcc -arch sm_61 hello.cu -o hello
$./hello
Hello World from CPU!
Hello World from GPU!
Hello World from GPU!
Hello World from GPU!
Hello World from GPU!
Hello World from GPU!
Hello World from GPU!

与相应的CPU相比，可以看出主要有两点不同：1）有限制符__global__的核函数（kernel function）, 2) 调用核函数时候需要<<<>>>配置核函数。
这儿的核函数就是运行在GPU端的代码。通常情况下一个CUDA代码包含五个部分：
-分配GPU端的内存
-把数据从CPU端拷贝到GPU端
-调用核函数在GPU完成具体的计算任务
-把计算结果从GPU端拷贝回CPU端
-释放GPU端内存
前面提到的Hello World的例子中我们只看到了第三个部分，在后续的章节中我们会继续看到其他的部分，并针对于每个部分作详细的介绍与分析。

最后编辑于：2018.12.12 10:19:59

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,793评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,567评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,342评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,825评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,814评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,680评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,033评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,687评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 42,175评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,668评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,775评论 1赞 332
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,419评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,020评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,978评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,206评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,092评论 2赞 351
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,510评论 2赞 343

CUDA C 简介

GPU介绍

异构并行计算

什么是CUDA？

推荐阅读更多精彩内容