分类: 学术

Linux查看cache信息

Introduction 本文介绍了如何在linux下查看cache的信息,并进行简单的分析。 unix设计哲学 一切皆文件 Linux也很好的继承了这个理念。 cpu cache 我的cpu: Intel(R) Core(TM) i5-3470 CPU @ 3.20GHz cpu文件 文件夹/sys/devices/system/cpu就是对cpu的文件映射。进入以后,随便进一个cpu核,可以看到cache文件夹,tree以后: . ├── index0 │ ├── coherency_lin...

GPU寄存器

Introduction 本文将简单介绍GPU中的寄存器。 寄存器 寄存器是GPU片上高速缓存, 执行单元可以以极低的延迟访问寄存器。寄存器的基本单元式寄存器文件,每个寄存器文件大小为32bit。局部存储器对于每个线程,局部存储器也是私有的。如果寄存器被消耗完。数据将被存储在局部存储器中。如果每个线程使用了过多的寄存器,或声明了大型结构体或数据,或者编译器无法确定数据的大小,线程的私有数据就有可能被分配到local memory中,一个线程的输入和中间变量将被保存在寄存器或者是局部存储器中。局部...

arm的cache lock down(cache 锁)

Introdution arm官方手册中关于cache lock down的部分Arm9 Processers的Rev0.ARM940T Technical Reference Manual.Caches and Write Buffer Cache lock down部分。鉴于我的水平,请和上面官网的文档部分结合查看,本文主要是对上文的翻译。如有纰漏,恳请指正。绝大多数情况下cache对程序员都是透明的,但是仍然会出现要求cache line不要被替换的需求出现,所以大多数架构都支持对cach...

远程调试nvidia jetson tk1 tx1 cuda板子

Introduction Nvidia针对异构本身有一套开发平台,叫NVIDIA® Nsight™,有很强的debug和程序分析工具。有Nsight Visual Studio和Nsight Eclipse两个版本。在这里的平台:Host: x86_64 Ubuntu 14.04 Tegra tx 1板子: Ubuntu 14.04.4 LTS Linux tegra-ubuntu 3.10.67-gcdddc52 #1 SMP PREEMPT Mon Nov 9 13:16:26...

多级cache的管理策略

Exclusive vs Inclusive cache的多级管理策略wiki上的说明部分 Multi-level caches introduce new design decisions. For instance, in some processors, all data in the L1 cache must also be somewhere in the L2 cache. These caches are called strictly inclusive. Other proc...

Gem5 安装记录

Introduction GEM5是一款模块化的离散事件驱动全系统模拟器,它结合了M5和GEMS中最优秀的部分,是一款高度可配置、集成多种ISA和多种CPU模型的体系结构模拟器 本文记录了我安装gem5安装的过程。我的所有压缩包都放在了~/gem5/下,最后安装出来的路径是~/gem5/gem5-stable,你可以根据自己的情况执行下面的命令所有的压缩包都在这里:gem5的百度云分享里面还有个很好的入门教程gem5_hipeac.pdf 安装步骤 sudo apt-get update # 安...

Tegra Tx1 硬编码解码H265

Introducation NVIDIA® TEGRA® X1 全新的移动超级芯片 全新的 Tegra X1 是我们有史以来的移动处理器。 它拥有 256 个 NVIDIA Maxwell™ GPU 核心和一颗 64 位 CPU、具备无与伦比的 4K 视频功能和超越上一代产品的节能性与性能,所有这些使其能够完美适配挑战性的移动应用。 GPU NVIDIA Maxwell 256 核 GPU DX-12、OpenGL 4.5、NVIDIA CUDA®、OpenGL ES 3.1、AE...

nvida jetson Tegra k,x系列ubuntu系统源设置

由于是arm平台,使用的应该是arm hf。教育网支持ipv6,改为国内的源更新会更快,速度可到10MB/s. 国内教育网的源 deb http://ipv6.mirrors.ustc.edu.cn/ubuntu-ports/ xenial main restricted universe multiverse deb-src http://ipv6.mirrors.ustc.edu.cn/ubuntu-ports/ xenial main restricted universe multive...

CUDA零复制内存

Pre 零复制(Zero Copy)(零拷贝内存) 三件事 启用零复制 分配主机内存 将常规的主机指针转换成指向设备内存空间的指针 代码参考 Reference Pre 之前的博客CUDA锁页内存和零复制只是简单介绍了下零复制内存,并没有详细说明,这里参考《CUDA并行程序设计-GPU编程指南》这本书再详细说明下。 零复制(Zero Copy)(零拷贝内存) 零复制是一种特殊形式的内存映射,它允许你将主机内存直接映射到GPU内存空间上。因此,当你对GPU上的内存解引用时,如果它是基于GPU的,那...

SISD、MIMD、SIMD、MISD计算机的体系结构的Flynn分类法

计算平台介绍 Flynn’s taxonomy (multiprogramming context) Single instruction Multiple instruction Single program Multiple program Single data SISD MISD Multiple data SIMD MIMD SPMD MPMD 注意配图,配图才是重点,图片来源于wiki Flynn于1972年提出了计算平台的Flynn分类法,主要根据指令流和数据流来分类,...