体系结构 - FindHao

浮点数的二进制存储 2

之前的那篇转载浮点数的存储转载内容比较粗糙。今天又花了点时间试了个具体的例子。部分内容摘自参考。以32bit浮点数 0.123456789的存储为例，通过在线进制转换获得其16进制表示为 3DFCD6E9 more ...

浮点数的存储[转载]

本文主要内容系转载。标准在 IEEE-754 规范[39]中，浮点数由三部分组成：符号位、指数部分和尾数部分（标准化表示方式）。单精度浮点数一般是用 4 字节（32bit）来表示。不同标准的单精度浮点数、半精度浮点数表示方式[39] 数据类型符号位指数部分尾数部分 more ...

1. Introduction 本文介绍了NVIDIA GPU寄存器的相关内容。 2. GPU寄存器 2.1 物理寄存器的映射关于gpu寄存器之前我还整理过：GPU寄存器一个程序的近机器语言级别的中间语言中适用的寄存器，我们称之为“体系结构寄存器，architected register”，这些寄存器会被处理器映射到物理寄存器（Physical Registers）上。 CPU使用寄 more ...

Cache替换策略

1. Introduction 本文主要内容系Reference的整理，介绍了cache访问模式的分类和几种cache替换策略。 2. Cache访问模式分类 $$ \begin{align} &A:( a_1 , a_2 , ... , a_{k-1} , a_k , a_k , a_{k-1} , ... , a_2 , a_1 )^ N\text{ for any k}\\ &B:( a_1 , a_2 , ... , a_k )^ N \text{ k > cache size}\\ &C:(( a_ more ...

CacheSim-1 Cache背景知识简介

Introduction CacheSim 简单的Cache模拟器专辑目录本文简要介绍Cache的背景知识，以及Cache结构的划分。在计算机系统中，CPU高速缓存（英语：CPU Cache，在本文中简称缓存）是用于减少处理器访问内存所需平均时间的部件。在金字塔式存储体系中它位于自顶向下的第二层，仅次于CPU寄存器。其容量远小于内存，但速度却可以接近处理器的频率。当处理器发出内存访问请求时，会先查看缓存内是否有请求数据 more ...

CacheSim-3 详细实现check_cache_hit等函数

Introduction CacheSim 简单的Cache模拟器专辑目录本文详细说明load_trace、check_cache_hit等函数。 1.程序入口 main.cpp主要针对一个测试文件，配置了不同cache line大小，不同组相联路数，不同的替换策略。默认使用写回法。默认cache大小32KB（0x8000 Bytes）。在每次循环里， more ...

CacheSim-4详细实现cache miss以后的操作

Introduction CacheSim 简单的Cache模拟器专辑目录本文主要介绍cache miss以后的操作。接上一章的cache hit以后的操作，如果miss了 index = more ...

CacheSim-5 实验数据分析

Introduction CacheSim 简单的Cache模拟器专辑目录本文统计了组相联路数、cache_line_size,cache_size以及替换策略对miss率和读写通信数据量的影响，并以图表的形式展现出来。 1. 组相联路数的影响不变条件：cache_line_size 32bytes，LRU，Cache_size 32KB more ...

手把手教你写Cache模拟器

Introduction 项目地址：也放到了CacheSim-开源中国 more ...

CacheSim-2 类的设计

Introduction CacheSim 简单的Cache模拟器专辑目录本文说明了模拟的Cache需要完成的功能，以及大体框架设计，通过头文件内容的说明，使读者获得整体的认识。 1.模拟Cache需要完成的功能 1.1 指令读取由于主存访问trace以文件形式给出， trace文件下载所以需要从文件中读取访存tra more ...