gpgpusim runtime的dockerfile

Introduction之前写过一篇在docker里跑gpgpusim(下称参考文献1),今天花了一点时间,写了个完整的dockerfile,并上传到了docker hub上去。现在简化一下运行的步骤。gpgpusim-runtime在docker hub的地址:https://hub.docker.com/r/findhao/gpgpusim_runtime/运行执行参考文 more ...

实验室旧机器改造

实验室项目入了一台矿机做研究之用。8块RX580,每块8G GDDR5。考虑到实验室目前的GPU分配情况以及矿机过高的功率,鞠总决定拿出两块,放实验室旧机器上。但是实验室目前的主流机器是Dell OptiPlex 7010,大概属于中塔类型,但是放不进去全尺寸的RX580,遂买了先马的大机箱,以及新配的安钛克的500w电源。在这个过程中,了解到了很多关于组装机器的知识,写本文以记录。品牌机主板可能会比较奇葩,比如7010自带245w的电源,换成惠普品牌机的300w电源,无法开机,一直黄灯报警。一条可行的曲线线路是:7010自带电源用来供给除了RX580以外的部分,惠普的3 more ...


Python多线程多进程中的几个坑

Introduction原文:今天遇到的Python多线程、多进程中的几个坑今天在写oj的判题端的时候犯了一个低级错误,就是为了加快判题速度,我就采用了多线程多组用例同时运行的方法,但是后来不经意的发现,明明跑的很快的程序到了我这实际运行时间就变成了好几倍,而cpu时间并没有太大的变化。我开始怀疑是runner的问题,因为以前使用ptrace的runner的时候,ptrace会在进程用户态和内核态之间反复的检查,导致程序运行缓 more ...

在docker里跑gpgpusim

1. Introductiongpgpusim在虚拟机里跑起来非常慢,而自己配机器的环境又可能会出现这样那样的问题。本文给出了一种使用gpgpusim提供的vbox虚拟机进行编译,在host的docker环境下运行的方法。2. 使用gpgpusim官方vbox虚拟机gpgpusim官方提供了vbox虚拟机文件的下载,大概7G多,http://ece.ubc.ca/~taylerh/files/gpgpu-sim/gpgpu-sim.vm.tar.gz直接从vbox里打开就行。里面的系统是ubuntu more ...



解读CUDA汇编PTX(二) SASS nvdisasm工具

Introduction解读CUDA汇编PTX--目录NVIDIA CUDA的NVCC编译过程之前已经介绍过了,编译ptx后,会生成cubin文件。cubin文件是包含了CUDA执行代码节的ELF格式文件。类似于我们常见运行文件。而官方提供了两个工具来反编译cubin文件到sass文件(类似常见的汇编), more ...

C语言内核深度解析 – 读书笔记1

Introduction《C语言内核深度解析》的读书笔记ISBN:978-7-115-43294-0主要内容系摘录。1. C语言与内存32位的系统中可用内存是小于等于4G的,这里涉及了三总线的概念:地址总线、数据总线和控制总线。比如我们现在要向内存中写入一个数据,控制总线上传输写指令,地址总线上传输内存地址,而数据总线则传输要写入内存的数据。我们说的多少位CPU,指的是数据 more ...