不重启服务器重新挂载nvidia gpu driver

大部分情况下,更新nvidia gpu驱动不需要重启机器。如果你的驱动成功更新,但是使用nvidia-smi提示有Failed to initialize NVML: Driver/library version mismatch,一般情况下是因为更新的驱动没有被成功加载。 查看当前nvidia driver是否被使用 执行第二条命令可以直接列出正在使用gpu的程序。比如nv-hosten是DCGM的server端,直接kill或者使用nv-hostengine -t将其退出即可 more ...

ubuntu nvidia gpu driver的安装

之前记录过一篇使用nvidia提供的run包安装驱动的文章,现在更新下使用apt source更新的方法。 目前主要有三个apt源可以更新nvidia gpu driver ubuntu XX-updates/restricted,ubuntu官方源里的闭源驱动 https://launchpad.net/~graphics-drivers/+archive/ubuntu/ppa graphics driver的 more ...

设置NVIDIA GPU的时钟频率

NVIDIA GPU默认是自动调频,如果需要profile程序,通过ncu获得的结果可能会不准确,尤其是对于一些比较小的程序来说。因此,测试需要固定gpu的时钟频率。需要执行的命令如下: sudo nvidia-smi -pm 1 nvidia-smi -q -d CLOCK sudo nvidia-smi -lgc 2100,2100 nvidia-smi -q -d CLOCK more ...

Ubuntu下开启TPM2.0安装nvidia driver

windows 11 发布了,新系统要求开启TPM2.0(一个安全芯片标准,8代及以后的intel和较新的amd cpu都支持)。但是之前在ubuntu下使用run包装nvidia 驱动时,一般都会遵循一些教程关闭UEFI的secure boot,同时也就关闭了TPM等。本文记录了如何开启TPM,在ubuntu下安装nvidia gpu driver。 开启TPM 以华硕主板, amd cpu为例,在UEFI中找到启动-->安全启动-->OS Type,选择Windows UEFT 模式。 在高级-->AMD fTPM设置, more ...

AMD ROCm学习

rocm是amd推出的类NVIDIA CUDA的开源的开发平台。 架构的变化(todo) 与cuda对比 CUDA ROCm Description SM Compute Unit, CU One of many more ...

解读CUDA汇编PTX(二) SASS nvdisasm工具

NVIDIA CUDA的NVCC编译过程之前已经介绍过了,编译ptx后,会生成cubin文件。 cubin文件是包含了CUDA执行代码节的ELF格式文件。类似于我们常见运行文件。而官方提供了两个工具来反编译cubin文件到sass文件(类似常见的汇编),官方使用文档。 nvdisasm n more ...

GPU benchmark说明

Introduction 本文内容主要系摘录翻译自Ang Li的博士毕业论文。 1.Perfect Power Efficiency Revolution for Embedded Computing http://hpc.pnl.gov/PERFECT/ more ...