写了两个脚本来获得通过nsys profile出来的cuda程序执行时间。

1. runnsys.sh

runnsys.sh program_path program args

第一个参数是要运行的程序目录,后面的参数是要运行的程序和参数。以sradv1为例,runnsys.sh /home/test/rodinia/sradv1/ ../srad 1 0.5 502 458。注意运行是进入到了程序目录/reports/下,所以要运行的程序要加上../保证路径正确,或者直接使用全局路径。如果运行参数中含有路径,也要改成全路径模式或者在reports文件夹里的相对路径。

2. 提取kernel执行时间,memory copy traffic 和cuda api运行时间

selectnsys.py report_path save_to

以srad为例,selectnsys.py /home/test/rodinia/sradv1/reports/ sradv1-original。执行完成后,将在当前目录下生成sradv1-original_kernel_time.csv,sradv1-original_memsize.csv,sradv1-original_cudaapi.csv,


文章版权归 FindHao 所有丨本站默认采用CC-BY-NC-SA 4.0协议进行授权|
转载必须包含本声明,并以超链接形式注明作者 FindHao 和本文原始地址:
https://www.findhao.net/academic/2573.html

Comments

comments powered by Disqus