__global__ void muladd
blockIdx
blockDim
threadIdx
cudaMalloc
cudaMemcpy
<<<32, 256>>>
cudaFree
__device__
第一部分借c语言并行编程之题,行介绍高级矢量扩展和线程之实。
第一部分的程序如无特殊说明,都能在gcc7.3.0下编译通过(如果我没有抄错的话)。