分类: 学术

5

手把手教你写Cache模拟器

Introduction 项目地址: 也放到了CacheSim-开源中国上 这个专辑记录了写一个非常简单的cache模拟器的过程。 主要是因为我要做的研究里,使用gem5来跑程序太慢了,所以只能自己在项目里实现一个简易的cache模拟器,获得一些实验数据。 正好加州大学圣迭戈分校(University of California, San Diego,简称为UCSD,又常译为加州大学圣地亚哥分校)...

1

NVIDIA Tegra TK/X系列板子的零拷贝(zero copy)问题

Introduction 本文系翻译,原文地址:Zero Copy on Tegra K1之前写过的关于cuda 零拷贝的文章:CUDA零复制内存CUDA锁页内存和零复制以下是NVIDIA论坛和Google Groups里关于tegra板子零拷贝的讨论,给出的观点也是零拷贝在unified memory上是没有发生copy行为的,强烈推荐看他们的讨论,可能需要翻墙。Jetson TK1 laten...

1

Linux查看cache信息

Introduction 本文介绍了如何在linux下查看cache的信息,并进行简单的分析。 unix设计哲学 一切皆文件 Linux也很好的继承了这个理念。 cpu cache 我的cpu: Intel(R) Core(TM) i5-3470 CPU @ 3.20GHz cpu文件 文件夹/sys/devices/system/cpu就是对cpu的文件映射。进入以后,随便进一个cpu核,可以看...

0

GPU寄存器

Introduction 本文将简单介绍GPU中的寄存器。 寄存器 寄存器是GPU片上高速缓存, 执行单元可以以极低的延迟访问寄存器。寄存器的基本单元式寄存器文件,每个寄存器文件大小为32bit。局部存储器对于每个线程,局部存储器也是私有的。如果寄存器被消耗完。数据将被存储在局部存储器中。如果每个线程使用了过多的寄存器,或声明了大型结构体或数据,或者编译器无法确定数据的大小,线程的私有数据就有可能...

2

arm的cache lock down(cache 锁)

Introdution arm官方手册中关于cache lock down的部分Arm9 Processers的Rev0.ARM940T Technical Reference Manual.Caches and Write Buffer Cache lock down部分。鉴于我的水平,请和上面官网的文档部分结合查看,本文主要是对上文的翻译。如有纰漏,恳请指正。绝大多数情况下cache对程序员都...

0

多级cache的管理策略

Exclusive vs Inclusive cache的多级管理策略wiki上的说明部分 Multi-level caches introduce new design decisions. For instance, in some processors, all data in the L1 cache must also be somewhere in the L2 cache. Thes...

1

Gem5 安装记录

Introduction GEM5是一款模块化的离散事件驱动全系统模拟器,它结合了M5和GEMS中最优秀的部分,是一款高度可配置、集成多种ISA和多种CPU模型的体系结构模拟器 本文记录了我安装gem5安装的过程。我的所有压缩包都放在了~/gem5/下,最后安装出来的路径是~/gem5/gem5-stable,你可以根据自己的情况执行下面的命令所有的压缩包都在这里:gem5的百度云分享里面还有个很...

0

Tegra TK1 TX1 源设置

Introducation 由于是arm平台,使用的应该是arm hf。教育网支持ipv6,改为国内的源更新会更快,速度可到10MB/s. 国内教育网的源 # See http://help.ubuntu.com/community/UpgradeNotes for how to upgrade to # newer versions of the distribution. deb http:/...

9

GPGPU-Sim安装

Pre 我的安装环境 CUDA Toolkit 安装 设置环境变量 GPU Computing SDK 安装 设置环境变量 处理GPGPU-Sim的依赖 设置环境 benchmark测试 编译 配置文件 运行 Debug Reference Pre GPGPU-sim 是一个模拟NVIDIA GPU的开发工具。 官方主页 我的安装环境 Ubuntu 14.04 x64 无NVIDIA显卡 Leno...