美国生活-1

8.13 21:00 UTC-4到达RIC机场,20多个小时的飞机让我疲惫不堪,堪比去东北的那趟卧铺给我带来的疲惫感。飞机落地在里士满时,我的心里充斥着不真实感。就好像自己浮在空中,无法控制地向前飘去,后面推着我的,是各种各样纷杂的事情。等回到租的房子,已经是晚上10点多。模糊的灯光中,房子影影绰绰。这里,将是我新的“家”,是新旅程的起点。夜空和一个月前在东北看到的夜空一样神秘,跟小时候坐在奶奶脚上看到的天 more ...

CUDA 10 Memory Transaction的一个现象

1. Introduction近日,在写一些microbenchmark分析cuda程序访存问题时,发现了一个有趣的问题。目前尚未找到合理的解释,先记录下来以待后续分析。实验平台为:NVIDIA GTX950,sm5.0,maxwell架构。2. Global MemoryA memory "request" is an instruction which accesses memory, and a "transaction" is the movement of a unit of da more ...

CUDA Sanitizer Samples使用

1. IntroductionCUDA 10.1推出了新的API:The Compute Sanitizer API,提供了更底层更丰富的Instrumentation API。https://docs.nvidia.com/cuda/sanitizer-docs/SanitizerApiGuide/index.html目前相关文档还比较简单,本文记录下官方Samp more ...

Deepin 15.10 安装cuda toolkit 10.1

1. Introductiondeepin可以按照正常cuda toolkit的方式安装cuda 9.0,但是10.0+就出现了问题。查看安装日志也看不出所以然。在cuda论坛阴差阳错发现了一个用来解决其他问题的方法,但是可以用来解决deepin上cuda toolkit的安装。2. 正常安装toolkit和driver的方法2.1 禁用默认闭源驱动# 使用vim或者其他编辑器添加配置文件 more ...

加入Deepin派系

1. Introduction前段时间偶然再次看到deepin的消息,拜读了前deepin CTO 王勇的博客,被大牛的成长历程震撼到,于是在虚拟机里安装deepin15.10体验了下。想起上一次用deepin,好像还是2012年。在虚拟机里用了几天,发现意外地好用。简单总结deepin的几点优势和遇到的问题。2. 优势我使用Linux作为主系统大概有6年,在使用的过程中,越来越发现,一个稳定、应用支持足够丰富无bug的系统,才是我的需求 more ...

从Wordpress到Pelican

1. Introduction博客对于我的作用,更多是整理知识、备忘。但是随着内容增多,以及因为安全防护问题使用cloudflare作为防火墙,wordpress搭建的博客越来越慢。很早之前就有了对博客进行一次大整理的念头,并有意识地寻找替代框架。在给工具写文档时,发现了pelican,一个python写的静态网站生成器。静态网站生成器的特点就是可DIY性非常强,或者说很多东西都得手撸。于是2019年开始准备把博客从wordpress迁移到pelican上来。 more ...

CUDA二进制探索

本文记录了探索NVIDIA CUDA SASS语法对应的二进制位的过程。1. CUDA二进制文件1.1 SASSNVCC编译过程和解读CUDA汇编PTX(二) SASS nvdisasm工具提过CUDA的汇编SASS,使用cuobjdump工具反编译出的SASS格式如下: more ...

我的美国F1学生签证

终于把签证的问题也解决掉了,但是被check,应该是只给一年签。总结一下准备签证的过程。背景说明:W&M phd 2019 fall,offer,cs1. F1学生签证120天的规定美国大使馆签证处官方的说法是:申请人最好在获得I-20表后尽快申请非移民学生签证,以便尽早安排签证面谈。请注意,学生签证的签发日期不会早于I-20表上注明的入学日期前120天。这个可以在申请签证的网站上常见问题FAQ-学生签证里找到,说明大使馆是允许提前面签的。我预约签证的时间比这个120天早一周。是因为看到其他人的经 more ...

GPU寄存器(二)

1. Introduction本文介绍了NVIDIA GPU寄存器的相关内容。2. GPU寄存器2.1 物理寄存器的映射关于gpu寄存器之前我还整理过:GPU寄存器一个程序的近机器语言级别的中间语言中适用的寄存器,我们称之为“体系结构寄存器,architected register”,这些寄存器会被处理器映射到物理寄存器(Physical Registers)上。CPU使用寄 more ...

Cache替换策略

1. Introduction本文主要内容系Reference的整理,介绍了cache访问模式的分类和几种cache替换策略。2. Cache访问模式分类$$\begin{align}&A:( a_1 , a_2 , ... , a_{k-1} , a_k , a_k , a_{k-1} , ... , a_2 , a_1 )^ N\text{ for any k}\\&B:( a_1 , a_2 , ... , a_k )^ N \text{ k > cache size}\\&C:(( a_ more ...