欢迎阅读本书。本书的目标是让你亲身参与个人高性能计算(Personal High-Performance Computing,PHPC)。如果你跟随我们的CUDA世界之旅,只需一台基本的游戏级计算机,你就可以执行大规模并行计算并从中获益。这种规模的计算任务在几年之前是需要超级计算机才能完成的。本书包含的内容能够帮助你去阅读更高深的CUDA著作并开发自己的CUDA项目。首先,介绍一下CUDA以及我们的教学策略。
CUDA是英伟达公司为促进高性能并行计算的普及所创建的支持并行计算的软硬件平台。CUDA的硬件方面涉及显卡上配备的一个或多个兼容CUDA的图形处理器(Graphics Processing Units,GPU)。英伟达CUDA工具箱软件则提供了基于C/C++编程语言的开发环境[1]。CUDA使用的基于GPU方式的大规模并行计算也是很多最快和最节能超级计算机所采用的关键技术。核心的度量准则已经从每秒浮点计算次数(FLOPS)转变为每瓦电能的每秒浮点计算次数(FLOPS/watt,即计算的总量除以消耗的能量)。而GPU并行方式在每瓦电能的每秒浮点计算次数上具有优势。实际上,在2012年6月到2013年12月期间,全世界最节能的10大超级计算机从刚开始的完全基于IBM的绿色基因系统(配有PowerPC CPU)转变成基于英伟达公司的GPU系统[2]。在这个快速转换为GPU计算的过程中,计算能力与电能消耗的比率已经翻了两番,并在持续增长。