使用GPGPU-SIM做实验

1. Introduction 本文说明了使用gpgpusim做实验需要注意的问题以及做出的修改。 强烈不推荐使用gpgpusim做实验。 如果是改SASS,建议maxas或者asfermi(尽管他们可能会有这样那样的问题,而且使用起来难度不小)。使用模拟器,是被reviewer攻击的常用点,除非你有足够强有力的解释,否则这会成为你论文的掣肘。 使用模拟器发的A,一般工作量会很多。 more ...

cuda寄存器限制launch_bound和maxrregcount

一个CUDA程序如果使用的寄存器数量过多,会导致在SM上同时驻留的线程和block数量减少,继而导致程序性能不足。 __launch_bounds__和maxrregcount都可以用来限制cuda程序的寄存器数量,但是两者是不同的机制。 __launch_bounds__ __global__ vo more ...


攒二手机器

近日从闲鱼攒了一台二手机器,感觉在闲鱼上捡垃圾还是需要避开一些坑的,记录下这次经历,同时也分享一些看到的坑。 显示器是15年本科时候天猫买的三星24寸显示器,内存条是去年价格还没有涨出天价时买的两条威刚DDR3 1600 8G。硬盘拆的旧笔记本上的硬盘,一块ssd是15年给笔记本升级买的120G三星850,键盘是15年买的cherry.其实这些配件如果买二手,也占了大概一半成本。 所以我还需要买的是 CPU 主板 显卡 机箱 电源 电 more ...

gpgpusim runtime的dockerfile

Introduction 之前写过一篇在docker里跑gpgpusim(下称参考文献1),今天花了一点时间,写了个完整的dockerfile,并上传到了docker hub上去。现在简化一下运行的步骤。 gpgpusim-runtime 在docker hub的地址: https://hub.docker.com/r/findhao/gpgpusim_runtime/ 运行 执行参考文 more ...

实验室旧机器改造

实验室项目入了一台矿机做研究之用。8块RX580,每块8G GDDR5。考虑到实验室目前的GPU分配情况以及矿机过高的功率,鞠总决定拿出两块,放实验室旧机器上。但是实验室目前的主流机器是Dell OptiPlex 7010,大概属于中塔类型,但是放不进去全尺寸的RX580,遂买了先马的大机箱,以及新配的安钛克的500w电源。在这个过程中,了解到了很多关于组装机器的知识,写本文以记录。 品牌机主板可能会比较奇葩,比如7010自带245w的电源,换成惠普品牌机的300w电源,无法开机,一直黄灯报警。一条可行的曲线线路是:7010自带电源用来供给除了RX580以外的部分,惠普的3 more ...

Boot-Repair[转载]

boot repair 备份下bootrepair的源 sudo add-apt-repository ppa:yannubuntu/boot-repair sudo apt-get update sudo apt-get install -y boot-repair Reference: https://linux.cn/article-3087-1.html more ...


Python多线程多进程中的几个坑

Introduction 原文:今天遇到的Python多线程、多进程中的几个坑 今天在写oj的判题端的时候犯了一个低级错误,就是为了加快判题速度,我就采用了多线程多组用例同时运行的方法,但是后来不经意的发现,明明跑的很快的程序到了我这实际运行时间就变成了好几倍,而cpu时间并没有太大的变化。 我开始怀疑是runner的问题,因为以前使用ptrace的runner的时候,ptrace会在进程用户态和内核态之间反复的检查,导致程序运行缓 more ...