nvidia - FindHao

CUDA Tips[持续更新]

1. 设置多GPU环境下GPU的可见性如果服务器上有多个GPU，可以设置程序只用某几个GPU。 # for NVIDIA GPUs export CUDA_VISIBLE_DEVICES=0 more ...

NVIDIA Jetson 配置笔记

安装pytorch 现在nvidia官方已经提供了简单的安装命令。 https://docs.nvidia.com/deeplearning/frameworks/install-pytorch-jetson-platform/index.html 是nvidia为jetson系列专门定制的pytorch。但是其他的包还是需要自己编译安 more ...

Jetson Nano 摄像头直播串流 RTSP to HLS

之前的Ender3 v2 3D打印机提到过我用了jetson nano来连接3d打印机，用octoprint来提交和监控打印任务，但是没有仔细说明如何配置摄像头监控。本文记录下摄像头相关的内容。 jetson nano支持csi和usb摄像头，在命令上基本类似。我使用的是usb摄像头。查看摄像头支持的格式根据 more ...

nsight compute和nsight system的使用笔记

使用ncu和nsys cli的笔记，持续更新。 Nsight Compute ncu主要是获取更细粒度的intra kernel的hardware counters。官方手册官方的profile 指导手册 more ...

大部分情况下，更新nvidia gpu驱动不需要重启机器。如果你的驱动成功更新，但是使用nvidia-smi提示有Failed to initialize NVML: Driver/library version mismatch，一般情况下是因为更新的驱动没有被成功加载。查看当前nvidia driver是否被使用执行第二条命令可以直接列出正在使用gpu的程序。比如nv-hosten是DCGM的server端，直接kill或者使用nv-hostengine -t将其退出即可 more ...

NVIDIA DCGM

Introduction NVIDIA Data Center GPU Manager (DCGM) is a suite of tools for managing and monitoring NVIDIA datacenter GPUs in cluster environments. It also provides APIs to let developers integrate it into their own GPU profiling/monitoring tools. Installation If you have more ...

ubuntu nvidia gpu driver的安装

之前记录过一篇使用nvidia提供的run包安装驱动的文章，现在更新下使用apt source更新的方法。目前主要有三个apt源可以更新nvidia gpu driver ubuntu XX-updates/restricted，ubuntu官方源里的闭源驱动 https://launchpad.net/~graphics-drivers/+archive/ubuntu/ppa graphics driver的 more ...

设置NVIDIA GPU的时钟频率

NVIDIA GPU默认是自动调频，如果需要profile程序，通过ncu获得的结果可能会不准确，尤其是对于一些比较小的程序来说。因此，测试需要固定gpu的时钟频率。需要执行的命令如下： sudo nvidia-smi -pm 1 nvidia-smi -q -d CLOCK sudo nvidia-smi -lgc 2100,2100 nvidia-smi -q -d CLOCK more ...

Ubuntu下开启TPM2.0安装nvidia driver

windows 11 发布了，新系统要求开启TPM2.0（一个安全芯片标准，8代及以后的intel和较新的amd cpu都支持）。但是之前在ubuntu下使用run包装nvidia 驱动时，一般都会遵循一些教程关闭UEFI的secure boot，同时也就关闭了TPM等。本文记录了如何开启TPM，在ubuntu下安装nvidia gpu driver。开启TPM 以华硕主板, amd cpu为例，在UEFI中找到启动-->安全启动-->OS Type，选择Windows UEFT 模式。在高级-->AMD fTPM设置， more ...

cuda程序运行时间

写了两个脚本来获得通过nsys profile出来的cuda程序执行时间。 1. runnsys.sh runnsys.sh working_dir program args 第一个参数working_dir是设置后面你的程序在哪里跑。比如有些程序是编译在build/，但是实际input和work的目录在另外的目录下。这个参数设置为实际程序运行的目录即可。同时，reports也将生成在这个目录。后面是正常运行cuda程序时的命令和参数。 more ...