解读CUDA汇编PTX(一) [翻译]

Introduction本文系翻译文章Demystifying PTX Code。在我最近的文章里,我展示了怎样从CUDA和OpenCL代码生成PTX文件,本文则将重点解读PTX文件里的复杂指令。我们还是使用向量加法的代码代码片段:https://gist.github.com/FindHao/394b2f069788e5a4c80a069638a47e1c原作者的代码项目: more ...

NVCC编译过程

Introduction本文介绍了编写的nVIDIA Cuda代码是如何编译成二进制的。上图即为官方的流程图。打印步骤nvcc -O2 -c vectorAdd.cu -keep -arch sm_20 --dryrun以 more ...